阿里达摩院发布新一代自研语音AI芯片技术 计算效率提升百倍以上
2019-08-21 17:20:23AI云资讯818
8月22日,在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros,该技术能将语音生成算法的计算效率提高百倍以上。这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计。

作为芯片领域的顶级峰会之一,HOTCHIPS 与其他顶级半导体会议的显著区别之一就是更侧重于商业应用,而非仅仅是学术项目,此次阿里发布的Ouroboros 就是面向语音合成领域商业应用的 FPGA 加速计算方案。
针对 ASIC 实现的性能仿真预估表明, Ouroboros 的设计可以实时运行 WaveNet 等业界先进的文字转语音(TTS,Text-to-Speech)算法 ,实现实时语音合成。
算法很好但难以进行实时计算是语音芯片的行业难题。Ouroboros的突破在于它使用了端上定制硬件加速技术,替代云端服务器,有效避免了对网络连接和云端服务的强依赖性,解决了这一问题。以计算量最大的AI语音合成算法WaveNet为例,为了生成1秒的语音,CPU和GPU需要消耗50秒的计算时间,但Ouroboros在FPGA环境下只需要 0.3秒,大大提升计算效率,同时将整体服务成本降低 10 倍以上。
阿里用户在使用天猫精灵、高德导航、智能点餐机等服务时,将率先得到媲美真人语音交互的体验。
阿里发布的 Ouroboros 技术,同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。该算法将商用系统里的合成语音与原始语音的相似度提高到97%以上,是目前业界体验最好的语音生成算法。自研算法与自研AI芯片设计的结合,意味着阿里在语音生成领域实现了真正的“软硬一体化”计算结构的落地。
据了解,Ouroboros 芯片技术除了语音合成之外,还将支持AI语音识别。基于 Ouroboros 研发完整的语音AI芯片,有望率先在天猫精灵上落地。
相关文章
- 至强® 6处理器在阿里云第九代ECS实例中的应用案例:货拉拉大促高并发实践
- 合合信息亮相2026金融AI联盟大会,携手阿里云共同启动“超级智能体计划”
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 当虹科技获评阿里“玄铁优选伙伴” 加速适配新一代旗舰CPU
- 阿里云数字短信全量开放,终端全覆盖实现营销短信点击率3倍提升
- 杭州维丽杰携手阿里巴巴 达成JBP深度战略合作
- 阿里云Q3财报:增速36%创新高,AI连续三位数增长!
- 上海数据集团、阿里云、浩鲸科技深化战略合作 发力AI时代数据要素
- AWE 2026 展会盛大启幕,阿里巴巴/微美全息锚定智能眼镜强势加入“百镜大战”
- 连登顶会!阿里云研究成果大幅提升运维智能精度与效率
- 阿里云金山算力中心加速投产,基于“真武”芯片建设超大规模算力中心
- MWC 2026 AI眼镜竞相“比拼”,阿里/字节跳动/微美全息竞逐智能硬件蓝海市场
- 黄飞对话阿里云AI专家:当零售中台拥有AI大脑,未来将去向何方?
- 阿里正式发布新一代基模千问3.5
- “2026遇见时光”藏族风情年会在渝举办 阿里文旅“藏西秘境 天上阿里”精彩亮相山城
- 韧性生长破周期:2026 阿里蚂蚁校友年会,阿里系创业者拆解 AI 四大赛道实战路径









