AI突破新边界王小川在香港亮出全球首个虚拟主播
2018-07-12 17:26:12AI云资讯676
有着"科技界达沃斯"之称的Web Summit团队来到香港,开启了为期四天的RISE科技大会。包括微软总裁Brad Smith、亚马逊CTOWerner Vogels在内的上百位全球顶级科技企业高管和先锋创业者齐聚一堂,就人工智能、大数据、区块链等时下热门主题,进行思想和灵感的交流,分享全球科技领域最新发展情况。
2018年7月11日,搜狗CEO王小川作为国内AI领军人物代表,受邀出席此次峰会并进行了题为《人工智能的下一个应用突破》的演讲,分享了他对"人工智能的意义"、"语言与AI的关系"等问题的新锐思考,并通过多款产品全面秀出了搜狗的"AI肌肉"。

(图1:搜狗CEO在RISE大会发表演讲)
自然交互+知识计算 搜狗的语言AI版图
在王小川看来,“语言”是AI的未来,“掌握一种语言就是掌握了一种灵魂”,而语言则是人工智能皇冠上的明珠。无论是百箱大战中Amazon Echo、GoogleHome等多款围绕着语音交互打造的智能音箱,还是会打电话的Google Duplex、会辩论的IBMProjector Debater,都聚焦于让机器拥有“语言”这颗明珠。
搜狗以“让表达与获取信息更简单”为使命,多年坚持以语言为核心,围绕于自然交互和知识计算两大方向,在语音、图像、翻译等语言类AI技术上不断突破。王小川认为,通过自然交互,人与机器能够更自由地表达;通过知识计算,让机器来帮助人类,实现智能的体外进化。
在自然交互版块,搜狗不断在语音识别和语音合成方面进行开拓创新。搜狗输入法是中国最大的语音输入法,目前语音识别准确率已超98%;日均语音输入调用次数峰值达4亿次;支持外文多语种和中文方言识别;智能断句、标点预测、识别结果顺滑等功能也领先于业界。语音合成支持多种音色选择,通过少量数据即可生成说话者自己的合成音色,还可实现说话人风格的迁移。
王小川现场展示了用“王小川讲话训练数据”,结合庞麦郎的《我的滑板鞋》歌曲素材,经机器进行语音识别、语音合成后,生成王小川版的《我的滑板鞋》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣地呈现了搜狗语音合成和情感迁移技术。

(图2:搜狗CEO王小川现场展示语音合成与情感迁移技术)
虚拟主播生动播报RISE新闻 搜狗语音技术的最新尝试
在此次活动上,王小川展示了搜狗推出的全球首个高度实用化、定制化的虚拟主播。结合唇语合成、语音合成、音视频联合建模与深度学习技术,可驱动机器生成对应的唇语图像与声音,进而输出统一的音视频素材。此次展示的虚拟主播,是搜狗使用央视新闻主播姚雪松数十个小时的音视频素材进行训练与计算的结果,最终生成了一段音视频同步的RISE大会新闻播报,与真人播报无异。

(图3:虚拟主播新闻播报画面)
AI技术为搜狗全线产品赋能 问答、对话、翻译是搜狗的产品方向
除了新产品外,搜狗已让AI技术为搜狗的全线产品赋能,无论是搜狗搜索,还是搜狗输入法,都做到了更懂用户,给出的选项和推荐也能直捣用户内心的需求。王小川认为,AI时代企业要做的不是多面开花,而是应该认准战略方向让技术有的放矢。
对于未来,王小川的判断是:搜索会升级为问答,输入法会演化成辅助对话系统。当输入关键词或问句后,搜索引擎将会直接给出你想了解的答案;用机器帮助人类完成更便捷、更高质量的对话。

(图4:RISE大会参会者)
此外,随着人们跨国交流需求的增加,翻译的需求将会激增。运用领先的神经网络机器翻译技术,加之以上亿级双语平行语料训练,搜狗目前已经支持61种语言的互译,凭借丰富的产品场景,翻译技术已经运用在了输入法和搜索产品中。结合用户出国和学习工作的使用场景,搜狗在今年连续推出了搜狗旅行翻译宝和搜狗录音翻译笔两款智能硬件,进一步推动了AI翻译技术的实用化。
提及搜狗AI的下一步,王小川说:“以语言为核心,一方面我们在年底之前还会再发布四款新的智能硬件;另一方面会把这种计算能力用到医疗、法律这些垂直的领域,使得机器在垂直领域会变得更加的聪明。”
关于AI整体技术发展和产业落地,王小川有着这样的判断:美国固有的优势在于顶尖的科研技术,而中国的优势在于用户规模和应用领域。目前全球已实现知识共享的联通,前沿的人工智能学术论文发布后,中国可以学习和借鉴前沿的学术成果,并把它转化为生产力。所以在人工智能领域,中国有机会跟美国在应用层面上齐头并进。同时,应用层面生态的进化,可以反过来推动整个系统的发展,最终实现良性循环。
“技术改变世界”正在成为现实,搜狗不仅持续在技术领域开拓创新,更驱动着技术的不断落地化、打造消费级产品,将“中国制造”转变为“中国智造”。相信在未来,搜狗可以持续“让表达和获取信息更简单”,让科技真正地惠及人们的生活。
相关文章
- 天翼云息壤2500万Tokens免费送,打通国产AI落地“最后一公里”
- “码”上有礼!仅需1元!跟随联通元景即刻解锁GLM-5,畅享AI编程新体验
- IBM推出AI智能体驱动的FlashSystem全闪存产品组合,开启“自主存储”新时代
- 查体智能辅助诊疗系统PC版正式发布暨AI中医应用示范医院挂牌
- AI问答正在取代搜索,品牌曝光逻辑彻底变了,软文街GEO帮你抢占新入口
- 爆火Elys + 声网对话式AI引擎,把社交交给AI赛博分身
- 陪伴机器人塞满马年购物车,涂鸦智能打造“AI新年货”
- 艾利特机器人发布“Elite PAI”具身智能大模型,定义工业场景的“有效智能”
- 思博伦通信推出首款面向网络测试与保障的Agentic AI解决方案
- AI中医可视化,把脉是否雷同心电图,看舌头可否归为影像学
- 中昊芯英“刹那®”TPU AI芯片Day0适配智谱GLM-5
- 五载同行!LED+AI+XR,揭秘2026春晚视觉幕后的“洲明力量”
- 500万用户追捧!百度地图岳云鹏文心AI副驾对话破亿,春节互动数据亮眼
- 安徽电信携手华为打造5G-A x AI大上行样板,助力合肥骆岗公园大型无人机灯光秀精彩呈现
- 白龙马变身文心AI副驾?岳云鹏携手百度地图上天津春晚,送出2亿红包!
- 山东移动携手中兴通讯:AI主动治盲,打造地下停车场感知标杆
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









