旷视科技副总裁谢忆楠:中国人工智能的系统与准绳

2018-07-12 17:36:12爱云资讯

2018年,商业创新迈进新的阶段,商业创新在业务飞速发展的同时,伴随而来的也有风口大热背后的认知沉淀与实践积累。7月10日36氪联合《零售老板内参》举办的2018商业新生态峰会在北京举行。本届峰会以“质”为主题,希望新的时代浪潮下新商业企业可以看清商业本质,最终完成新商业的革新与升级。

近几年国内涌现了一大批优秀的以计算机视觉为研究方向的AI企业,并且仍然有源源不断的创业者投身其中,让人禁不住怀疑,行业泡沫是否已经出现。当前的局面究竟是泡沫还是春天?在2018商业新生态峰会上,旷视科技副总裁谢忆楠围绕中国人工智能的系统与准绳,与大家分享了他的观点。

以下为谢忆楠发言全文:

感谢大会邀请。

我们今天讲的是特意跟着大会的主题——本质、明质、远质,重新调整了一下内容,我们讲中国人工智能的系统与准绳。首先说系统,我去年参加了一个人工智能大会,听美国一位获得图灵奖的老师跟我讲美国和中国在这波人工智能热潮中的区别,美国更多是通过计算力和算法驱动,他们不断地尝试算法能达到怎样的极限,他们擅长直线的尝试。所以我们可以看到阿尔法狗,看到非常强的技术展示给我们。这个过程中其实我们会发现一个问题,他其实并没有讲这些技术能做什么。我们不能指望每天会花几百万电费的阿尔法狗做什么东西,但是中国的人工智能来自于场景,真正来自商业化,跟我们今天的大会主题非常贴近。所以说我们今年或者说中国这波人工智能是通过很多的场景、AI商业化去实现的。

所以我们可以看到中国和美国之间,大家都讲中国领先或者美国领先,其实根本不存在领先与落后,是我们的系统跟人家本身就不同,后面会解释一下。

第二个是准绳,为什么写准绳?是因为有一个二级分析师的朋友跟我很熟,从2014年做第一次研讨会,到今年他跟我说现在越来越看不懂一级市场给人工智能做估值的模型了,因为他们从任何的资料和数据上来判断,都觉得没办法理解估值和该企业所做的生意到底区别是什么。所以我们总结了一下我们创业的第七年,到底应该做什么?


我先解释一下旷视科技,大家都以为我们叫Face++,其实Face++是我们的人工智能开放云平台。我再重申一下,我们叫旷视科技。

我们看这么一个图,这个图上下两张照片,两张照片都取自于网上的网红照片,他们通过化妆让自己变得完全不一样,这个照片在国外主要用来做什么呢?我们经常可以看到计算机视觉公司刷人脸识别的榜单,做的事情就是给计算机两张照片,让计算机来判断不同照片中的到底是不是一个人,如果概率很高就回答YES,概率不大就回答一个NO。国外很多的人他们毕生解决的就是这个问题,中国公司用同样的一个场景解决的却是一个千古难题——证明你是你。我给大家解释一下什么地方会用到这个。第一是最近引发热议的网约车服务,而我们的技术可以证明开车的这个司机是驾照上的人,司机必须要通过人脸识别完成实名信息认证。第二是所有的互联网金融平台、新媒体平台的作者都必须通过实名认证,需要你告诉平台“你是谁”,平台不会允许和真实用户身份不一的人来使用。总结来说,我们会看到国外用这项技术只解决了一个问题,就是用来判断两个看起来完全不一样的人如何能证明他是一个人,而中国却用这个难题解决的是商业化的问题。这个界面是我们商业产品的模型图,这就是目前最大的第三方在线身份实名认证平台FaceID。同样解决一个技术问题,但中国公司不仅仅指旷视,更多会选择用这项技术解决一个商业场景的难题。中国公司的本质就是不断地通过这些AI能解决的问题找到实际应用场景。

这句话来自于去年MIT给到的一个评价,我觉得很中肯。 MIT评论说美国应该学习中国,它虽然没有直接肯定中国的模式是对的,但它认为中国AI公司现在所做的事情对整个社会或者技术是有提升的。

接下来我们讲准绳。我们判断一家公司到底是不是有泡沫,可以从这五个方面去看。

第一个方面是技术的去人力化。目前大家比较习惯于用以下几个指标判断一家公司技术好坏。第一个指标是刚才讲的某一个算法结果,算法级刷到百分之九十九点九几,那个点比千足金还要高。第二个指标是很多的算法人才组成了庞大的科学家团队,这个团队可能多达三、五百人,甚至在公司占比80%以上。第三个指标是论文产出,要知道中国在今年所有的论文产出数上已经达到了世界顶峰。但是这些就真的是对的标准吗?——并不全面。从论文这一点来看,我们看到另外一个数据是,中国论文的引用度在全球排第四位,甚至连前三都不到。原因是什么?原因在于技术本质的准绳。中国企业更偏向于可以量化的指标,而真正的技术准绳是什么?我讲的是去人力化。曾经有一位BAT公司级别很高的人来旷视参观,我感受非常深。我们用很长一段时间来讲算法的突破,但他们其实没有太在意,最后讲到数据标准的问题,所有人的眼睛泛起了一个火花,来问我们“数据从哪买的,数据的标注是谁来做的”。所以我们看到一个本质问题是,多数企业目前研究团队中,可能100人中的80%根本做的不是Researcher该做的事情,他做的是数据清理。人工智能给的定义是人类给计算机一个正确答案,让计算机不断地寻求正确答案,从而去衍生其他的东西。所以你的标注如果出现了问题,对AI的理解就很有问题。目前人工智能所有领域的东西,他用的是监督式学习,就是人工判断。我们经常听到一句话是“有多少人工就有多少智能”。你的技术里面,你的百人团队是否能用一百倍的算法,实现人力成本减少。

因为卡、算力便宜,人会越来越贵,所以现在我们去看AI公司的技术本质,就是要看它的底层代码是不是自己做的,是不是能够做到在整个的系统里面降低人工干预的比例。

我们都非常关注芯片的自主研发,那么就人工智能而言,如果操作平台、操作引擎不是我们自己的,往上往下所有的芯片这些东西我们都不可能去直接掌控。这些关键技术才是我们去判断一家公司的准绳。为什么谷歌要开源TensorFlow?你用我的TensorFlow就要买我的TPU,你买TPU就要用谷歌所有一切的工具,这样谷歌就成了数据的窗口。之前互联网公司抢的是流量,现在的AI公司抢的是数据,他们通过这个才能实现真正的掌控,所以真正的AI公司不要去用那些所谓的可以量化的数量去衡量它,我们就看一家公司的算法引擎,是不是能够为数据进行一些可控性的处理,它是不是能够创造自己的操作引擎。我可以讲目前80%的中国人工智能公司,算法引擎都是通过开源平台加上自己的一部分能动性演化出来的。

第二个方面,商业的从0到1,这个阶段我们可以把人工智能当成一个工具,解决很多人无法解决的问题。比如说网约车的问题,我们无法用人工给每一辆网约车做实时验证,但我们的FaceID可以让手机成为一个理解、认证人脸信息的工具。

但是我们要看到,如果人工智能只是作为一个工具,它的门槛相对较低,所以接下来我们要讲第三个方面,商业的从1到N,人工智能从技术工具到数据结构化、可视化的演变。

我们可以拿安防场景来举例。最近网上热评张学友是中国最成功的刑警,开一次演唱会抓一次人。但演唱会场景却与真实的安防场景有很大的差异。演唱会场景的人脸识别技术只是一个工具,在整个抓捕过程中需要多人、长时间参与。从跟进监控屏幕的报警信息、指挥中心传递信息给分局,到分局研判结果的返回,再到分配警力去现场搜寻,整个过程需要40分钟到1个小时。只有在演唱会这类相对封闭的场景下,才能允许这么长的耗时。

但是在一个地铁里,我们了解到警方的要求是从在逃嫌疑犯出现开始,要两分钟之内完成定位,并且让警员实施抓捕。为什么是两分钟?如果做不到两分钟这个人坐地铁就走了,这就是技术到商业最基本的要求。我们会发现,目前很多场景下我们只是倾向于用技术来证明它可以解决问题,但是却忽略了商业对于技术其实也有要求。地铁里出现的人是活动的,民警站点也是活动的,在这个场景只有三环。第一环是在下电梯的时候快速定位,第二环是对他的脸和特征进行一个匹配,再从脸部信息延展到人体包括背部信息也能准确识别,这就是一个警察所具备的功能,这就是一项技术驱动商业化真正要实现的事情。所以中国有很多安防企业用AI做这件事情,但是他们只证明了AI能够成为一个工具,但是真正要去实现商业化,不仅是成为一个工具,而是可以通过AI技术模拟出人具备的特性,这样才能实现商业价值的从1到N。

第四个方面我要讲AI带来的产业升级。我拿旷视在零售店的落地来举例。旷视对于新零售的理解是重构零售行业整个供应链。在我们这个视频的场景里,顾客拿了一个牛奶,这个拿牛奶过程中的数据可以实时反馈给这家店的网上仓储存储供应商。我们为什么学日本零售?因为他们有两件事情是我们根本比不了了。第一是他们的毛利率,他比我们同样的零售体系可能高一个数量级。第二是例如711这类便利店可以实现每天三次补货,它对店铺中的关键数据有深厚理解,每家店从货品摆放到货源补充都可以满足顾客需求。我们传统的便利店是缺乏这项能力的。每家店都需要一个好的店长,711成功之处在于它可以复制很多店长。但中国便利店太多,我们很难实现让每家店的店长都具备标准化素质,所以我们需要一个系统。在这个场景需求下,我们用AI技术赋能零售店里的摄像头和货架,通过这种设备就可以像店长一样观察和分析来到这家店的一般有哪类人,他们对什么东西感兴趣,会看什么东西、最后会买什么东西。最后能帮助零售商家实现人效、平效等多方面的提升。这就是技术走向商业化实现数据联通,让技术去解决商业本质上的问题,而不只是把商店里的人流热圈画出来就可以了。

第五个方面,我们去看周期

第一层包括银行、安防还有媒体,里面基本上巨头林立了。拿安防举例,我们可以看到,不管是传统巨头还是我们这样的新入者,都已经在安防行业里驻兵两年以上。真正的机会在第二层,手机、物流、零售、保险、制造。这里为什么说手机会是接下来一到两年的重要指标?现在的手机是一个通讯工具,但未来手机会向个人助理方向演进,它将具备很强大的智能管控功能。比如拍照,我拍出来不好看,但摄影师却可以拍出获奖作品,这是因为使用者的能力不一样。 AI要解决的就是把个人能力的差异降到最低,你不用会拍照,你会用手机就可以了。 最后一层是自动驾驶、医疗、AR还有家用机器人,这部分的周期相对更长一些。

我特地选了中美这张图作为今天的总结。中国要用AI解决城市的问题,而美国想维持自己的基础霸权。为什么我讲中国要解决城市的问题?其实灵感来自于之前看的罗振宇推荐的《大国宪制》,其中提到中国是一个很大的国家,要维持中国的运转和其他国家的运营方式都不一样。中国已经提了很多年的智慧城市建设,也有越来越多企业在关注和提倡。我们要去理解这件事情。伴随技术的发展与成熟,未来城市的运行与管理离不开两大核心:一是计算力,二是大数据。我们现在之所以会定义某些城市为一个不可再膨胀的超大型城市,是因为目前的算力和数据无法再维持更多的用户,不可维持就意味着城市的运营管理、资源使用和污染等都变得不可控。但如果我们真正实现了城市大脑的话,就有可能让城市得到更加良性的发展。这就是为什么中国一直提倡人工智能技术的应用,因为基于对中国现状的真正了解。

最后再次感谢主办方的邀请,谢谢大家!

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023