天数智芯完成阶跃星辰开源多模态大模型适配,共筑AI开源新生态
2025-02-19 13:12:03AI云资讯9847
2025 年 2 月 18 日,头部大模型创业公司阶跃星辰宣布开源两款 Step 系列多模态模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音交互模型,引发行业高度关注。目前,两款模型都可以在跃问 App 内体验。天数智芯作为通用 GPU提供商,已第一时间携手合作伙伴,完成对阶跃两款开源模型的适配。

阶跃Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。在阶跃发布并开源了针对文生视频质量评测的新基准数据集 Step-Video-T2V-Eval上的测评结果显示,Step-Video-T2V 的模型性能在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频模型。
Step-Audio 是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下的应用需求。

在 LlaMA Question、Web Questions 等 5 大主流公开测试集中,Step-Audio 模型性能均超过了行业内同类型开源模型,位列第一。Step-Audio 在 HSK-6(汉语水平考试六级)评测中的表现尤为突出,是最懂中国话的开源语音交互大模型。比如下面这段对话中,模型能够深入理解中文的博大精深,而不会被「绕晕」。
此次,为支持阶跃星辰开源多模态大模型,天数智芯迅速调配资源展开模型适配工作。通过优化 GPU 架构和算法,天数智芯确保了模型在运行过程中的稳定性和高效性,让 Step-Video-T2V 和 Step-Audio 的性能得以充分发挥,为用户带来流畅的体验。
天数智芯与阶跃星辰的携手合作,不仅为双方在 AI 领域的发展注入了新动力,也为 AI 产业开源技术生态的繁荣添砖加瓦,有望推动 AI 技术在更多行业落地生根,创造更大的社会价值。
相关文章
- 中科闻歌重磅发布通用决策大模型Decitron决策机,内测邀请开启
- 端侧AI构筑“新丝路”:面壁智能大模型开源与端侧推理框架的出海实践
- 告别“数据枯竭”,迈向“价值坐标”——艺恩发布《全球大模型数据市场白皮书》
- 星辰大模型能力升级 天翼智铃推出30秒长视频动画制作
- 牧原携手阿里云共建养猪大模型 AI赋能传统产业升级
- 大模型落地“最后一公里“:Testin XAgent工程化评测实践
- 元戎 CEO 周光:大模型范式进入共识期,正在重构辅助驾驶行业
- 从ViP创新工艺到维擎垂域大模型,维信诺金砖论坛集中展示显示产业“中国方案”
- 卓世科技与戴盟机器人达成战略合作,共筑”行业大模型+具身智能”新生态
- 云工场科技推进CPU+GPU协同推理,推动大模型应用降本增效
- 东软添翼医疗大模型荣登“医疗AI大模型最具应用价值产品榜”
- 群核科技空间智能大模型完成国家备案,加速走向产业应用
- 破解大模型“幻觉”,徐剑军选择“可信”之道
- 携手共建“物理世界大模型”联合实验室,洞察时空与上海电信达成战略合作
- 东软添翼医疗大模型领跑 医疗AI进入“可信时代”
- 直接上智能体,还需要统一基座大模型吗?医院智能化走到十字路口
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









