发力人工智能应用落地 微软IoT In Action峰会两大看点
2018-12-20 16:23:52AI云资讯784

图:微软全球执行副总裁,微软人工智能及微软研究事业部负责人沈向洋博士
观点一:25年来,微软通过云计算、人工智能这些创新技术,来加速中国企业的数字化转型。中国公司和世界级的创新公司在引领全球,不少公司都来自深圳,我们大家一起努力,实现梦想。
沈向洋博士指出,世界就是一台计算机,今天的世界已经变成一台庞大的计算机,手机是计算机,PC是计算机,所有的计算被连接起来,分布在各处强大的计算能力,采集无处不在的传感器数据,应用机器学习分析采集到的数据,用人工智能创造出工作生活中的各种各样的体验,这是了不起的事情。

在新时代,微软新的世界观是“未来的世界就是云到边缘的计算世界”,智能云(Intelligent Cloud)+智能边缘(Intelligent Edge),为了达到这个远景,微软誓要把Azure打造成世界新的计算机,成为融入AI的最佳云和边缘平台。
在IoT领域,微软呈现四大布局,分别是Azure云、Azure混合云、Azure 边缘(Azure IoT Edge)、Azure Sphere。现场重点介绍了后两者的最新进展。沈向洋表示,Azure IoT Edge,是一项将云端的人工智能和Azure服务直接部署和运行在各种跨平台物联网设备上的全托管服务,目前支持Windows、Lunix等多个系统。微软展示了与科勒和大疆的合作项目,另外,半导体芯片开发商乐鑫(Espressif)也发布了ESP-32-Azure IoT Kit开发板。

微软的Azure就是一台世界的计算机,覆盖54个国家和地区,获得了安全和合规的认证。全球覆盖的区域和安全合规认证远远高于其他公司。服务全球500强中超过百分之九十的公司。
观点二、计算机视觉,计算机图形,文本到语音合成,微软在中国的创新已经影响到全球。
沈向洋博士介绍说,微软之所以可以在智能云和智能端取得如此大优势,得益于微软在人工智能领域20多年的研究和世界级的研发成果。

笔者梳理了这张图片上的五大里程碑事件:
1、2016年,微软亚洲研究院一支团队在图片网络(ImageNet)得全球图像识别大赛中一鸣惊人,这个团队带来得精妙算法叫残存网络(ResNet),它对10万张照片进行识别,并列入了1000个不同类别之下,其错误率低到3.5%。2年后,谷歌的DeepMind研发出AlphaGo Zero,即能够自学的新一代AlphaGo,残差网络就是它的核心技术模块之一。
2、2017年8月20日,微软首席语音科学家黄学东宣布微软语音识别系统继微软对话语音识别技术达至人类专业水平,开启人工智能新征程之后再次取得重大突破,错误率由5.9%进一步降低到5.1%,可与专业速记员比肩。此次突破大幅刷新原先记录,并在语音识别行业树立新的里程碑。
3、2018年 1 月,微软研究院在斯坦福大学发起的 SQuAD 文本理解挑战赛上获的完成 SQuAD 阅读理解测试的准确率高达 88.5%,超越人类。2018 年 3 月,微软宣布旗下机器翻译技术取得突破,在中文翻译英文准确度可媲美人类。
4、2018年3月微软宣布机器翻译研究系统的准确率达到69.9%。中英文翻译,新闻高测试集测试比对准确率达到69.9%。
5、2018年5月份Build 2018 大会上,微软在公有云Azure平台上推出了语音合成定制服务产品Custom Voice。将语音和对应文本(500句)上传,Custom Voice即可对声音进行模拟,并在线测试模拟效果。
“语音和语言是衡量人类智能的标杆,人工智能的发展分支之一是语音识别,去年《经济学人》杂志总结了过去40年语音方面的进展,过去20年,语音识别上有标杆上的测试,两人随便聊天,看看计算机是否可以转录下来,包括吵架、谈情说爱,错误率高居不下,微软转录系统在不考虑代价的情况下,转录水平可以超过专业人员。黄学东表示,微软的语音合成技术除了端到端神经网络开发,还使用了迁移学习,最大特点就是支持各种定制化服务。但考虑到定制某个人声音会涉及法律问题,定制化服务暂时不向个人开放。
沈向洋表示,微软希望利用AI技术在所有感知方面超过人类水平,最近研发的是微软还在研发OCR印刷体识别、手写文字识别等技术。
观点三、全球每年微控制器有90亿量,随着物联网数量增加,MCU使用量会越来越大。微软Azure Sphere三部分,芯片级的云+端物联网安全解决方案,是基于Linux安全小型的操作系统,包括认证微控制器、操作系统、安全服务三方面,协同可以确保智能边缘设备的安全。

沈向洋表示,Azure 给制造业带来的机遇,凭借着Azure Sphere,制造业有全新的安全体验和新的商业模式,比如ROOBO做得语音芯片,做离线远程的语音控制,让Azure集成语音服务放在任何设备上。长虹集团子公司四川爱联发布了面向智能家电的嵌入式Azure Sphere模块。除了语音之外,ROOBO发布了基于Azure Sphere及ROOBO嵌入式语音芯片的家电物联网模块,该解决方案支持通过多达400种离线语音指令控制家用电器,能为智能楼宇、智慧工厂等环境种的麦克风的终端设备提供隐私安全保护。我们期待和更多的深圳厂商开发Azure Sphere的合作方案。
人工智能落地应用加速:
全球首创Azure智能会议系统+IoT Edge 的视觉人工智能开发工具包
微软作为智能语音行业的领先企业之一,认为中国当前技术下的语音识别效果还远没有达到理想水平,微软结合硬件技术合作伙伴有望借助技术优势撬动市场。

黄学东表示,微软在文本到语音合成方面达到了一个新的里程碑,利用深度神经网络,使计算机合成的声音几乎与真人的录音无法区分。微软和儒波斯和签订了人工智能战略合作备忘录。

图:智能会议系统设备“黑塔“在会议上展示
微软在现场展示了“黑塔”全球首创的人工智能会议系统,这款由Azure人工智能驱动的边缘设备,能同时追踪、记录多人会议的语音和图像,对每个人发言进行文字记录,从中提取要点议题并生成会议纪要。
据悉与微软合作开发这一系统的儒博(ROOBO)宣布与微软达成战略合作,将成为微软智能语音转录服务于定制文本到语音服务的合作伙伴,将儒博在智能硬件开发于平台运维上的优势,和微软在人工智能与服务上的先进技术结合,共同开发和拓展智能语音在物联网、智能边缘、智能家庭、智能教育等领域的应用前景。

图:黑塔系统现场实时会议追踪和记录每个人发言
在这次大会上,微软和儒博向行业展示了搭载Azure Sphere安全方案的语音模组,该产品搭载双方自主研发的芯片,在保证物联网设备安全的前提下,满足端到云的物联网安全解决方案,实现在低功耗下物联网设备的离线、在线语音控制,完成IoT场景下的设备管理、数据管理、安全管理及设备升级服务。

图:语音模组开发套件
在全球各地,各种智能设备正快速涌现在家庭和商业场合中,预计到2020年,其总数将超过200亿台。这些设备将非常智能,甚至无需一直连接到云端,就能具备看、听、推理、预测的能力。对于智能边缘计算,微软已经高通的合作,打造运行 Azure IoT Edge 的视觉人工智能开发工具包。这一解决方案将为开发基于摄像头的物联网解决方案提供关键的硬件和软件支持。

开发者可以利用 Azure 机器学习服务及高通视觉智能平台与高通人工智能引擎的硬件加速开发应用解决方案。摄像头也可以用于更高级的 Azure 服务,例如机器学习、流分析和认知服务,并且可以从云端下载到边缘环境中在本地运行。
通过近二十年的高强度研发投入,微软在很多人工智能落地的关键赛道上已经探索形成了一些明确的产品,下一步就是这些产品怎么规模化和释放利润的问题。我们从微软这次全球大会上看到的是人工智能加上物联网赋能多场景应用的前景,但落地到底如何,还有待市场和客户的检验。
相关文章
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
- 点猫科技与新加坡华侨中学签署人工智能教育合作备忘录
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 人工智能终端迎来“国家标尺” 联想以规模化产品实践助力标准编制
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 微软放弃Xbox Copilot人工智能
- 人工智能助力新型工业化 第九届数字中国建设峰会工业智能产业生态大会成功举办
- 中兴通讯携手印尼XLSMART 在雅加达正式启动联合创新中心加速印尼 5G-Advanced 与人工智能发展与应用
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- 实力登榜!思特奇入选2026全国企业“人工智能+”行动创新案例TOP100
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









