豆包·同声传译模型2.0来了:3s延迟,实时声音复刻
2025-07-25 11:01:35爱云资讯1930
7月24日,火山引擎正式发布豆包·同声传译模型 Seed LiveInterpret 2.0,现已全量上线火山方舟平台。只需开口说话,你的“同款”声音就能同时开口说外语;演讲过程中,双语字幕与你的声音同步生成。
豆包·同声传译模型2.0是首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界 SOTA 的同时,实现了极低的语音延迟水平和“0样本声音复刻”。这意味着,国际会议、跨境谈判等场景的实时交互体验将得以大幅提升,跨语言交流再也不怕生硬!
豆包·同声传译模型2.0像一位思维超敏捷的“同传专家”,基于端到端理解和生成框架,面向中英文,可实时接收多人语音输入,并在“听”的过程中同步理解、复刻声音,并输出语音和译文,以极低延迟实现高质量语音翻译,真正实现了“边听边说”。相比传统机器同传系统,豆包·同声传译模型2.0具备以下优势:
极低的语音延迟,沟通无断点:采用全双工语音理解生成框架,翻译延迟可低至2-3秒,较传统机器同传系统降低超60%,实现了真正的“边听边说”翻译。
0样本声音复刻,音色无缝跨越:无需提前录制,一边说话一边采样,即可实现“0样本”声音复刻,让同一个人同音色开口说外语,给现场的听众更还原更沉浸的体验。
智能平衡节奏,对话超自然:可根据语音清晰度、流畅度、复杂程度,调整输出节奏,并适配不同语言特性。面对超长信息,依然能保证传译语音节奏的自然流畅。
近期,豆包·同声传译模型已在多个权威国际会议中应用。在2025中关村论坛年会上,为多场重量级会议提供顶流 AI 同传服务,助力中外学者无缝畅聊,获央视点赞!在2025全球数字经济大会上,同样实现了外籍嘉宾发言的同步音色复刻翻译,参会者无需戴耳机,看屏幕字幕就能轻松 get 内容,实现“低延迟、高准确、听得懂”。
除了大型国际会议,豆包·同声传译模型还可以在更多生活场景发挥价值。例如,TikTok 主播用母语直播时,实时将内容翻译成外语并复刻主播声音,让外国观众听懂并信任,加速生意达成;在出境旅游方面将作为“随行翻译”,通过豆包实时翻译导游所讲内容,让语音沟通不再阻碍探索世界的脚步;帮助记者快速准确获取外文资讯与采访内容,辅助写稿,提升新闻时效性与准确性。
目前,豆包·同声传译模型 Seed LiveInterpret 2.0已在火山方舟开放使用,并即将在8月上线 Ola Friend 耳机,为用户带来更加灵活的使用方式和体验。
更多详细信息和功能将在7月30日的火山引擎 FORCE Link AI 创新巡展·厦门站公布,敬请期待!
相关文章
- 飞书发布知识问答等多款AI产品 让企业拥有懂自己的“豆包”
- 接入豆包大模型,巨人网络解锁《太空杀》AI游戏玩法新高度
- 豆包大模型1.6发布!更强模型、更高性价比
- 字节豆包视频模型Seedance 1.0首次登顶全球视频生成竞技榜
- 中文大模型幻觉测评:豆包大模型准确率全球第一,超越DeepSeek-R1、Gemini-2.5、GPT-4o
- Flat Ads:透视中国AI出海战略,看豆包、腾讯元宝、美图相机如何占领市场先机
- 涂鸦智能集成DeepSeek、豆包、OpenAI等全球先进AI大模型,发布亿元补贴助力AI硬件创新
- “言出图随”:三星绘图助手解锁图像创作的“豆包解法”
- 豆包实时语音大模型登场,谁是概念股中的 “潜力黑马”?
- 豆包语音大模型首家引领级通过中国信通院语音大模型评估
- AI PC获“豆包”助攻 新硬件催生新价值
- 智源最新评测结果发布:豆包大模型“主观评测”排名第一,多榜单位居国内第一
- 基于豆包·视频生成模型打造创新体验,即梦成为“想象力的相机”
- 豆包文生图能力升级 支持一键生成含指定文字图片
- 火山引擎正式发布豆包.语音模型创业者加速计划
- 融入字节豆包AI,“I系搭子” FIIL首款实用型 AI耳机GS Links即将上市