智象未来团队荣获ACM Multimedia 2025最佳演示奖，多模态生成式AI技术领跑全球-AI云资讯

近日，第33届ACM国际多媒体会议（ACM MM 2025）在爱尔兰都柏林举行，智象未来团队成功摘得最佳演示奖，成为中国首个获此殊荣的多模态生成式人工智能初创企业团队，彰显了智象未来在多模态生成式AI领域的顶尖科研实力和卓越创新能力。

ACM国际多媒体会议由国际计算机学会（ACM）主办，致力于推动多媒体全领域的研究创新与产业应用落地，是全球多媒体领域最具权威性与影响力的学术盛会之一。每年会议评选的最佳演示奖，具有极高含金量和行业认可度，代表着评审委员会和与会学者对该技术创新性、实用性、成熟度和现场展示效果的最高肯定。

智象未来获奖的“灵感智能体”（Chat Generation）统一多模态智能体，以革命性技术将复杂的视觉内容创作，转化为直观的对话体验。其核心优势在于突破碎片化多模态技术工具的局限，在单一界面内无缝整合了文本生成图像、指令式图像编辑及文本/图像生成视频功能，有效解决了跨模态语义对齐的行业难题。该技术基于170亿参数量的HiDream-I1模型，依托稀疏扩散Transformer（DiT）结构与动态混合专家（MoE）设计，在HPS、GenEval等国际权威基准测试中表现优异。而针对指令式图像编辑任务，团队通过上下文视觉条件优化HiDream-I1模型，使其能够实现精准的图像修改效果。

该智能体开创了可及性、交互式视觉叙事和多模态生成AI中协作内容创作的新方式，通过将生成和编辑融合于一个对话驱动的体验中，降低了高质量视觉内容创作的门槛，并显著缩短了迭代周期，实现从想法到优质产出的 “一次会话” 创意循环。目前，这一技术原型已成功迭代应用于智象未来旗舰产品vivago.ai的对话生成功能中，为用户提供更自然、个性化的多模态对话交互体验。

此外，在本次ACM国际多媒体会议上，智象未来举办了Identity-Preserving Video Generation（IPVG）挑战赛。赛事吸引了北大、上海交大、腾讯等国内外顶尖科研及企业团队参加，参赛者需要在生成视频的过程中保持给定身份的一致性，完成人脸或全身身份保持的任务。智象未来担任本次赛事主办，是国际顶会对其多模态视觉生成能力处于世界前沿的权威认证，彰显了其研发团队在行业内的强大号召力。

智象未来研发团队持续致力于将前沿学术成果落地，以核心技术驱动产品体系迭代升级，并在激烈市场竞争中赢得业内认可。自创立以来，智象未来对行业变革和市场发展保持敏锐嗅觉，无论是对基础模型的研发创新，还是对产业化发展的深度理解，均处于行业领先地位。此次获得ACM国际多媒体会议最佳演示奖，更是智象未来在技术、产品两侧均具备硬实力的权威体现，印证了团队科研成果的前瞻性和突破性。

智象未来成立于2023年3月，由加拿大工程院外籍院士梅涛创立。在坚持自主研发的同时，智象未来持续推进高质量模型的开源开放，并打造出首个登顶国际权威榜单的中国自研生成式AI模型。作为多模态生成式人工智能初创企业，智象未来正以自主创新为核心驱动力，持续推动中国生成式AI技术迈向更高水平，并以开放、务实的姿态积极融入全球人工智能创新生态，展现中国AI技术实力与创新担当。

智象未来团队荣获ACM Multimedia 2025最佳演示奖，多模态生成式AI技术领跑全球

相关文章

人工智能企业

人工智能硬件

人工智能产业

人工智能技术