谷歌称语音识别是下一个机会,尤其在发展中国家
2018-09-25 11:19:28AI云资讯1457
据国外媒体报道,虽然人工智能机器人和自动驾驶汽车可能成为未来的头条新闻,但谷歌搜索负责人本·戈麦斯(Ben Gomes)表示,技术领域的下一个重大飞跃将是语音服务的进步。戈麦斯表示,更好地理解通用语言对互联网的未来发展至关重要。
戈麦斯说:“语音识别和对语言的理解是未来搜索和信息的核心。但是有很多难题,比如理解引用语是如何起作用的,理解‘他’、‘她’或‘它’在句子中指的是什么。在语音服务角度,这只是其面临的数以百万计的问题之一。

图示:谷歌搜索部门负责人本·戈麦斯(Ben Gomes)说,语音识别和语言理解是未来搜索和信息的核心。
9月24日是谷歌成立二十周年之际,而戈麦斯在接受《卫报》采访时发表了上述言论。而在七年前,谷歌面向公众推出了其第一个语音服务,也就是一个简单的将语音转换成文字的搜索工具。
如今,语音识别已经成为谷歌搜索和人工智能语音助手的一部分。谷歌的人工智能语音助手嵌入了全球数十亿部智能手机中,相应的语音识别技术在识字率低的发展中国家显得尤为重要。

“对我们来说,语音识别看来似乎是一项先进技术,但在印度这样的国家似乎是一项基本需求,这一点并不明显。因此,这在某种程度上改变了人们的看法。”出生于坦桑尼亚并在印度班加罗尔长大的戈麦斯说。
“发展中国家的许多语言从未真正拥有过我们所常见的键盘——我学了10年印地语,但我不知道如何打字——所以语音比打字更容易使用。”
谷歌理解语言的尝试并不新鲜。在破解了这些基础知识之后,谷歌从2000年开始进行拼写校正,接着又加入了戈麦斯所称的“语言软化”技术。
“你可以把最初的搜索引擎想象成寻找有严格定义的单词——这是你输入的确切单词,我会试着在文档标题中找到它。”
“但是人们在了解某个领域时会使用一种语言组织形式,而在他们不了解这一领域时会使用另一种语言组织形式。在英语中,我们通常将其视为同义词,但它是一种特殊的同义词。”
例如,人们可能会搜索“我如何改变显示器的亮度”,使用像“改变”这样的通用词,因为他们不知道更具体的词。但那些对该领域有更多了解的人会在查询和文档中使用“调整”一次。要为用户找到正确的文档,您需要将专业领域的术语注入到他们的查询中,这种效果让谷歌花了五年时间开发完成。
许多难题阻碍了计算机在人类层面上真正理解语言,但对于戈麦斯来说,未来在于“语言勇于查找信息将变得更容易”。
“你可以用更复杂的方式提出更复杂的问题。实际上你可以和谷歌进行对话。”
相关文章
- 谷歌的未来是一个无所不能的搜索框
- Google I/O 2026:Gemini 将成为谷歌年度开发者大会的主角
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- 谷歌发布 Chromebook 后继产品——Googlebook
- 谷歌称其首次发现并阻止了一个利用AI开发的零日漏洞
- 谷歌首款AI眼镜即将呼之欲出,微美全息(WIMI.US)扎实推进AI+AR生态落地
- 谷歌母公司发布2026年一季度财报,搜索查询量创下历史新高
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Siri悄然接入Gemini大模型,苹果反成谷歌云2026 Next大会主角
- 联合谷歌共建:戴盟发布数百万小时触觉具身数据集
- 谷歌将Marvell纳入双芯片TPU计划,ASIC AI推理格局或将重塑
- 谷歌推出Mac版Gemini人工智能应用
- Meta闭源模型Muse Spark登场,谷歌/微美全息加码投入开源AI“严阵以待”
- 谷歌正式接管母公司Alphabet旗下机器人软件企业Intrinsic
- 谷歌云客户业务负责人重返微软,出任安全主管
- 谷歌年度营收首次突破4000亿美元
人工智能企业
更多>>人工智能硬件
更多>>- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
- 出游露营正当时 三星Galaxy手机全方位守护你的户外体验
- 拯救者Y900系列生产力大屏AI平板正式发布,学娱场景随心换,打造新一代旗舰终端
- 智慧陪伴 定格浪漫 三星Galaxy A57 5G让你的520心意满分
- 短途出行机器人QUORRA X5出海订单覆盖欧美,头部资本加持正奇未来布局全球
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









