Gboard输入法离线语音识别上线:目前仅限谷歌Pixel手机使用
2019-03-14 15:11:30AI云资讯1128
昨日,谷歌通过博客悄然宣布实时语音识别技术的突破。使用人工智能技术并利用其Pixel手机的神经处理功能,Gboard用户现在可以进行离线实时语音识别。

图源:谷歌
目前,如果用户在Pixel设备上使用Gboard,要进行语音识别并转化成文本,实时语音处理需要使用Wi-Fi或蜂窝数据连接进行。谷歌宣布,自从它首次引入神经学习来处理人类语音以来,它一直在继续开发软件架构,以便使用其Pixel设备的神经处理功能完全离线工作。
据介绍,谷歌新型递归神经网络传感器(RNN-T)体积已经足够小,可以完全安装在手机上,消除网络延迟和零散连接,这是随时使用该技术的障碍。它可以实时输出逐字输出的字样,就好像有人在说出你说的那样。
谷歌已经能够通过将数据处理要求从2GB(需要无线连接进行离线处理)降低到仅仅80 MB进行处理来实现这一目标。
虽然最初只适用于使用Pixel设备并仅使用美国英语的Gboard用户,但Google希望其开发的研究技术将被用于更多语言和更多设备以及用于其他环境。
相关文章
人工智能企业
更多>>人工智能硬件
更多>>- 普恩志引领:2026半导体与高端制造前瞻——核心备件如何驱动产业革新与市场机遇
- 超旗舰降噪,殿堂级音质 索尼双芯超旗舰真无线降噪耳机WF-1000XM6正式发售
- 当AI学会“隐身”,手机才真正智能:三星Galaxy S26系列开启AI哲学的降维打击
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 全球瞩目!荣耀携Robot Phone、Magic V6系列、荣耀MagicBook Pro 14 2026震撼亮相MWC 2026
- MWC直击:荣耀双旗舰搭载第五代骁龙8至尊版,助力智能手机下一代技术演进
- 联想moto首款“大折叠”手机MWC正式发布
- 三星Galaxy S26 Ultra上手:AI深度融入,防窥屏隐私防护太实用
人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









