天数智芯完成阶跃星辰开源多模态大模型适配,共筑AI开源新生态
2025-02-19 13:12:03爱云资讯9343
2025 年 2 月 18 日,头部大模型创业公司阶跃星辰宣布开源两款 Step 系列多模态模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音交互模型,引发行业高度关注。目前,两款模型都可以在跃问 App 内体验。天数智芯作为通用 GPU提供商,已第一时间携手合作伙伴,完成对阶跃两款开源模型的适配。
阶跃Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。在阶跃发布并开源了针对文生视频质量评测的新基准数据集 Step-Video-T2V-Eval上的测评结果显示,Step-Video-T2V 的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频模型。
Step-Audio 是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下的应用需求。
在 LlaMA Question、Web Questions 等 5 大主流公开测试集中,Step-Audio 模型性能均超过了行业内同类型开源模型,位列第一。Step-Audio 在 HSK-6(汉语水平考试六级)评测中的表现尤为突出,是最懂中国话的开源语音交互大模型。比如下面这段对话中,模型能够深入理解中文的博大精深,而不会被「绕晕」。
此次,为支持阶跃星辰开源多模态大模型,天数智芯迅速调配资源展开模型适配工作。通过优化 GPU 架构和算法,天数智芯确保了模型在运行过程中的稳定性和高效性,让 Step-Video-T2V 和 Step-Audio 的性能得以充分发挥,为用户带来流畅的体验。
天数智芯与阶跃星辰的携手合作,不仅为双方在 AI 领域的发展注入了新动力,也为 AI 产业开源技术生态的繁荣添砖加瓦,有望推动 AI 技术在更多行业落地生根,创造更大的社会价值。
相关文章
- 亿咖通科技亮相2025世界人工智能大会,以舱驾融合领跑AI大模型应用市场
- 端侧大模型迎来“轻“革命:移远通信 × RWKV 打造“轻量AI大脑“
- 从智鑫多维到Agentic大模型:易鑫亮相WAIC彰显金融科技实力
- WAIC 2025青年菁英交流会之下一代大模型架构演进:聚焦前沿理论突破,探索大模型演进新路
- 宝信软件携大模型、人形机器人、国产大型 PLC 等硬核产品亮相WAIC 2025
- 中国移动大模型产业创新基地焕新升级
- “九天”通用基础大模型3.0发布 模型能力多维升级 多项技术成果开源
- 星火语音同传大模型闪耀世界人工智能大会,讯飞翻译机构建全球沟通桥梁
- 荣耀发布 MagicGUI 大模型并开源 加速构建AI终端生态
- 每日互动AI一体机GAI Station:安全融合大模型与大数据 高效驱动企业业务增长
- SuperCLUE发布工业大模型测评最新榜单,北电数智骄阳·工业大模型综合排名第一
- 绝影亮相NVIDIA展台,端侧多模态大模型落地成果显著
- 国内首个通过主任医师评测的大模型,已在夸克AI搜索上线
- 科大讯飞亮相2025政法装备展,星火法律大模型“落地生花”
- 邬贺铨:人工智能从生成式大模型向AI Agent和Agentic AI发展,互联网进入智能体时代
- AI大模型技术持续突破,蘑菇车联跻身“2024年中国独角兽企业”榜单