讯飞输入法随心说 中英、七大方言混合语音输入无压力
2019-01-24 16:45:28AI云资讯1358
都说2018是人工智能(AI)应用元年,遥不可及的AI与大众的关系变得越来越亲密。2018年4月,讯飞输入法发布了全语音交互的“莫得键盘”;6月AI赋能,使通用语音识别率提升至98%,支持20多种方言语音输入,实现语音识别、语音合成以及机器翻译的场景融合,提升语音输入的表达力。经过半年时间的创新和沉淀,讯飞输入法语音输入又有了新突破,最新Android版本支持中英混合语音输入『随心说』,同时优化普通话与方言口音的混合语音输入效果,增强了语音输入体验。

有没有发现,职场工作的你时不时说中文夹杂英文。放假回家,Amanda又秒变彩凤,前一句普通话后一句家乡话脱口而出!常见的语音输入是这样的,上班谈事说英文切换到英文识别模式;回家跟亲朋友好友在线聊天,说家乡话切换到对应的方言模式。如果想在沟通中做到“雅俗共赏”,那需要手动切换起来,中→英,英→中,普通话→方言,方言→普通话,英→方言,频繁操作体验自然不尽如人意。

日前讯飞输入法上线语音输入『随心说』,不用切换语音识别模式就能实现中英混合语音输入。据悉,为更好助力方言口音的表达,进一步优化了包括东北话、天津话、河南话、皖北话、山东话、河北话、四川话七种方言与普通话的混合语音输入效果。“准确输入”、“高效表达”、“便捷交互”、“智能识别”基于这些关键词,可以看出讯飞输入法技术能力快速迭代,同时也是科大讯飞AI核心技术不断赋能的体现。

事实上,科大讯飞在AI研究和应用,特别是智能语音方面布局多年。基于注意力模型的核心思想,通过机器学习的方法,构建了Hybrid CNN模型,用于构建语音识别声学模型的全局优化,堪称目前效果更好、资源占用更小、模型更灵活的语音识别框架。
具体来说,在原DFCNN基础上,将传统卷积使用扩张卷积代替,从而实现对语音长时相关性的更精确的表达。与此同时,还引入基于长短期记忆网络LSTM的门控机制使得Hybrid CNN在长时相关性建模的过程中,能快速的过滤噪声等干扰信息,并加强语境等长时信息,颇具灵活性,从而在实际应用中能够保障高噪声等复杂场景的语音识别效果。
另外,Hybrid CNN模型真正实现了端到端的建模,以原始音频波形直接建模,避免了人工设计的特征提取过程带来的信息损失,真正的实现了端到端建模,进一步提升识别效果。
也正因为上述的创新,使Hybrid CNN这种前沿的语音识别框架克服了DFCNN模型参数量和计算复杂度大的问题。在保证识别效果不损失的情况下,系统资源占用规模和运算量同比下降了60%以上,使得Hybrid CNN可以在手机等设备上流畅的运行,这也使得本地化语音的识别效果更加接近云端识别效果。
A.I.持续赋能讯飞输入法,不仅提高手机输入效率和准确率,甚至免去语音识别的切换操作,让用户享受A.I.带来的全新便捷生活。
相关文章
- 未来智能发布viaim讯飞智能体耳机:迈出“AI Agent”战略第一步
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 讯飞星火党政智盒发布,打造国内首个安全可控、敢用易用的党政“龙虾”
- 科大讯飞发布玲珑Agent OS,让AI真正走进企业核心业务流
- 全球首发|讯飞Astron开源项目矩阵,构建企业级智能体完整技术生态
- 2026中国翻译协会年会召开,科大讯飞携多语言AI翻译产品矩阵亮相并获评5A级企业认证
- 科大讯飞佛山人工智能产业基地正式启用,助力南海构建AI产业生态
- 科大讯飞重磅布局智能穿戴,讯飞AI眼镜开启跨语言沟通新时代
- 科大讯飞AstronClaw升级,引领AI Agent从对话走向执行
- 科大讯飞亮相2026联合国中文日,让语言无界,让文化共鸣
- 打造办公新模式,科大讯飞三大核心“AI+办公”大模型在成都发布
- 科大讯飞AIPC华东制造基地正式投产,软硬智造一体出场即“数字员工”
- 科大讯飞与苏移集成签署战略合作协议,共推具身智能产业升级
- 从硬件集成到软核共研,科大讯飞与北京人形机器人创新中心深化合作
- 中关村国际技术交易中心揭牌 讯飞 AI 眼镜亮相
- 科大讯飞与金光集团签约战略合作,携手推动印尼人工智能转型
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









