智象未来团队荣获ACM Multimedia 2025最佳演示奖,多模态生成式AI技术领跑全球
2025-11-06 16:30:52AI云资讯14503
近日,第33届ACM国际多媒体会议(ACM MM 2025)在爱尔兰都柏林举行,智象未来团队成功摘得最佳演示奖,成为中国首个获此殊荣的多模态生成式人工智能初创企业团队,彰显了智象未来在多模态生成式AI领域的顶尖科研实力和卓越创新能力。

ACM国际多媒体会议由国际计算机学会(ACM)主办,致力于推动多媒体全领域的研究创新与产业应用落地,是全球多媒体领域最具权威性与影响力的学术盛会之一。每年会议评选的最佳演示奖,具有极高含金量和行业认可度,代表着评审委员会和与会学者对该技术创新性、实用性、成熟度和现场展示效果的最高肯定。
智象未来获奖的“灵感智能体”(Chat Generation)统一多模态智能体,以革命性技术将复杂的视觉内容创作,转化为直观的对话体验。其核心优势在于突破碎片化多模态技术工具的局限,在单一界面内无缝整合了文本生成图像、指令式图像编辑及文本/图像生成视频功能,有效解决了跨模态语义对齐的行业难题。该技术基于170亿参数量的HiDream-I1模型,依托稀疏扩散Transformer(DiT)结构与动态混合专家(MoE)设计,在HPS、GenEval等国际权威基准测试中表现优异。而针对指令式图像编辑任务,团队通过上下文视觉条件优化HiDream-I1模型,使其能够实现精准的图像修改效果。

该智能体开创了可及性、交互式视觉叙事和多模态生成AI中协作内容创作的新方式,通过将生成和编辑融合于一个对话驱动的体验中,降低了高质量视觉内容创作的门槛,并显著缩短了迭代周期,实现从想法到优质产出的 “一次会话” 创意循环。目前,这一技术原型已成功迭代应用于智象未来旗舰产品vivago.ai的对话生成功能中,为用户提供更自然、个性化的多模态对话交互体验。

此外,在本次ACM国际多媒体会议上,智象未来举办了Identity-Preserving Video Generation(IPVG)挑战赛。赛事吸引了北大、上海交大、腾讯等国内外顶尖科研及企业团队参加,参赛者需要在生成视频的过程中保持给定身份的一致性,完成人脸或全身身份保持的任务。智象未来担任本次赛事主办,是国际顶会对其多模态视觉生成能力处于世界前沿的权威认证,彰显了其研发团队在行业内的强大号召力。


智象未来研发团队持续致力于将前沿学术成果落地,以核心技术驱动产品体系迭代升级,并在激烈市场竞争中赢得业内认可。自创立以来,智象未来对行业变革和市场发展保持敏锐嗅觉,无论是对基础模型的研发创新,还是对产业化发展的深度理解,均处于行业领先地位。此次获得ACM国际多媒体会议最佳演示奖,更是智象未来在技术、产品两侧均具备硬实力的权威体现,印证了团队科研成果的前瞻性和突破性。
智象未来成立于2023年3月,由加拿大工程院外籍院士梅涛创立。在坚持自主研发的同时,智象未来持续推进高质量模型的开源开放,并打造出首个登顶国际权威榜单的中国自研生成式AI模型。作为多模态生成式人工智能初创企业,智象未来正以自主创新为核心驱动力,持续推动中国生成式AI技术迈向更高水平,并以开放、务实的姿态积极融入全球人工智能创新生态,展现中国AI技术实力与创新担当。
相关文章
- 一句话完成合同审批全流程,合合信息联合亚马逊云科技打造多模态文档智能体
- 物理世界智能的优化:从文本思考到多模态思考
- 深耕AI+音视频二十载,佰锐科技多模态行为风险识别跻身行业第一梯队
- 数据的第三种形态:艺恩如何为大模型提供多模态的数据弹药?
- 算力与模型同频共振:天数智芯Day 0 深度适配 SenseNova U1,共筑多模态AI新底座
- 专攻AI供应链治理痛点!多模态SCA智能情报驱动,以AI治理AI实现全域风险可控!
- VPU:多模态AI时代下的视频算力变革
- 海康威视徐习明:聚焦感知多模态大模型,为中国制造业发展服务
- 天数智芯完成Qwen3.5 多模态模型全量适配 全栈技术筑牢生态适配硬实力
- 直击AI多模态媒资痛点!当虹科技荣获浙江省科学技术进步奖
- 小度全系产品将集结亮相AWE 2026,“超能小度”多模态能力成最大看点
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 合合信息发布多模态大模型文本智能白皮书,破解复杂文档处理困局
- 合合信息发布多模态大模型文本智能白皮书,五大核心能力标准引领复杂文档处理变革
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 三维天地推出多模态数据湖产品SW-DBLake,重新定义AI时代的数据基石
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









