商汤科技:用AI“驱动”汽车

2019-05-23 08:56:38爱云资讯

科技公司跨界汽车圈早已是常见之事,但除了像BAT这样的巨头值得关注外,还有一类企业同样值得关注,那就是AI(人工智能)公司。

日前,在商汤科技举办的第二届人工智能峰会上,除了连发11款AI产品及解决方案外,还详细介绍了其在自动驾驶和智能车载系统方面的布局。同时,值得一提的是,商汤还发布了一款专为儿童编程设计的自动驾驶小车SenseRover Pro/Mini。

作为国内AI领域的独角兽企业之一,商汤在计算机视觉和深度学习领域的技术积累,决定了其进入汽车圈的路径。

首先,在自动驾驶方面,商汤属于感知层面玩家,其基于原创的计算机视觉感知技术,以及自研可快速部署深度学习模型的FPGA计算平台,仅通过单一摄像头就可提供车道线、可行驶区域、道路信息、行人、车辆等信息。同时,还可为客户提供多传感器融合的自动驾驶解决方案。

其次,在智能车载系统方面,在上个月上海车展期间,商汤已经展示了其基于SenseDrive1.0架构的智能座舱系统,其希望基于自身优势,打造首个以计算机视觉技术为基础的交互方式。

而在此次峰会上,商汤则是对外公布其SenseDrive2.0整体架构,即“端+云”一体化。所谓的端,指的是移动端和车机端,移动端主要提供终端入口,包括人脸注册、Face ID等,车机端则为DMS+ADAS驾驶安全预警系统,可为驾驶员提供精准实时的安全预警。云则是指平台云,基于平台云,商汤可为客户提供商业洞察、OTA升级等功能。

事实上,不管是自动驾驶,还是智能车载系统,在某种层面上都需要AI技术支持,而商汤除了可以为智能网联车提供基础的视觉模块外,还可以基于自己的平台和核心技术,帮助帮助厂商打造自己的系统,并把深度学习平台提供给合作伙伴,让他们用收集到的数据建立自己的应用。

自动驾驶底层技术

当前,自动驾驶大致有两种研发方向,一种是用激光雷达为主的传感器做自动驾驶,这种方案很依赖三维的高精地图。另外一种,则是以摄像头为主,并辅助雷达传感器,使得整体的成本能够做的比较低,可帮助量产,符合家用市场需求。某种意义上商汤属于后者,基于在计算机视觉AI技术方向的技术储备,致力于推动量产的自动驾驶解决方案。

商汤科技起源于香港中文大学的一个研究团队。2010年,商汤科技创始人兼CEO徐立于香港中文大学攻读博士学位,与深度学习视觉领域应用的先驱汤晓鸥教授以及其带领的香港中文大学多媒体实验室的师兄弟联系紧密。

商汤联合创始人、香港中文大学教授汤晓鸥

2011年,汤晓鸥、徐立所在实验室的几十个博士、教师开始研究深度学习。这是学术界最早涉猎深度学习的华人团队。

2011至2013年间,在CVPR和ICCV两大全球计算机视觉世界顶级学术会议上, 29篇涉及深度学习的文章中,有14篇出自该实验室。这个团队,成为了后来商汤的中坚力量。

2014年,商汤团队宣布:基于原创的人脸识别算法,商汤识别准确率达到98.52%,超越人眼97.53%的识别准确度。计算机人脸识别准确率首次超越人眼!

随后,从2014年6月起,汤晓鸥团队开始发表DeepID系列算法,逐步将人脸识别准确率提升至99.55%,推动技术落地的同时,也使得我国在该领域跃居世界领先地位。

在深度学习方面,商汤科技构建了深度学习基础库PPL (Parrots Primitive Library),部署了深度学习平台SenseParrots。训练模型是深度学习的核心要素,而商汤的训练平台主要基于GPU,其目标是分布式、高性能、可扩展。

因此,商汤在北京、上海等地设立了超算中心,有超过15000块GPU来支持算法训练,其中包含17个GPU的集群,每个集群针对一个垂直算法领域做特定化的训练。最大一个集群的规模接近2000块CPU。超算中心带来的强大算力,是他们支撑人工智能算法不断迭代的核心要素之一。

近年来,随着自动驾驶的普及与发展,越来越多的公司开始重视AI对自动驾驶底层架构的作用,尤其是深度学习方面。据了解,以前Mobileye是用传统算法做自动驾驶,而近年来则开始使用深度学习算法,其性能大幅度提升。

前文也有所言,商汤原始团队是国内最早接触深度学习技术的团队,这使得其相较于其他公司,已经具备了先发的技术积累优势。

商汤创始人兼CEO徐立

此外,在2017年的一次采访中,徐立曾表示,商汤只做算法优化和结构创新,数据则选择和OEM合作。硬件方面,则是英伟达为商汤提供强大的支持。

基于此,于商汤而言,即使其进入汽车领域不久,但若他们的深度学习网络算法有颠覆式创新,在自动驾驶领域实现弯道超车也不是不可能。

不过,当前行业中尚未出现成熟的多模态的深度学习框架,怎么把各种数据进行融合做一些深度学习训练,还是一个开放性的问题。未来,如果算法还有大的突破,现在的格局可能被颠覆,当然,不限于汽车行业。

当然,除了深度学习,商汤的计算机视觉技术也是处于领先水平。

基于此,在视觉方面,徐立此前曾表示,商汤已经总结出了大概20多个视觉算法模块,从前端的相机,到相机成像、标定,背后的识别、理解、场景化,再到最后的路径规划,都包含在内。这些模块可以嵌在现有的ADAS系统里 ,也可以为未来的自动驾驶提供核心的技术支撑。

可量产的自动驾驶解决方案

虽然商汤进入自动驾驶领域的时间不算早,但其却希望通过自身技术赋能打造可量产的自动驾驶技术方案。

为实现该愿景,商汤科技研发总监石建萍表示,在过去三年时间内,商汤主要在感知技术、自研的FPGA的平台以及车规级质量标准三方面努力。

据现场介绍,商汤科技自动驾驶解决方案是全新的自动驾驶/辅助驾驶方案,其基于商汤科技原创的计算机视觉感知技术,仅通过单一摄像头就可提供车道线、可行驶区域、道路信息、行人、车辆等信息。这也将有望降低自动驾驶解决方案的搭建成本,从而推动量产。

另外,商汤自动驾驶解决方案配备了自研可快速部署深度学习模型的FPGA计算平台,适配性强,能够快速推广到不同系统的车辆上使用。

此外,车规级质量标准是进入汽车行业非常重要的核心。而为了进入汽车行业的工业体系,商汤正在建立自己的质量体系,并开始在智能车舱、辅助驾驶平台上推进其质量标准,以便于提供更符合客户要求量产相关的产品。

而在商汤联手本田自主研发的L4级别自动驾驶解决方案中,除了上述自动驾驶方案所具备的功能外,其还可以搭配多种不同传感器,支持感知、分析预测、决策规划控制、城市级三维地图重建及无人车高精度定位能力等技术功能,以便于实现多层次的自动驾驶系统。

自2017年进军自动驾驶领域以来,商汤在该行业中不断取得突破。首先是与OEM厂商本田合作,共同发力适合乘用车场景的L4级自动驾驶方案。

2018年,商汤完成杭州、上海半开放场地内实现无接管自动驾驶,2019年,在日本落地“AI自动驾驶公园”,将用于自动驾驶汽车的研发和测试,并面向公众开放。除此之外,石建萍还表示,商汤在自动驾驶方面今年还将会有更多的落地技术。

以视觉为核心的智能座舱

当前,在整个汽车行业中,智能座舱已经呈现爆发之势。众多车企、科技公司纷纷开始研发智能座舱相关产品,在人机交互方面,大部分企业所选择的皆为语音交互。反观商汤,其基于自身优势,致力于打造首个以计算机视觉技术为基础的交互方式。

事实上,在上个月上海车展期间,商汤的智能座舱产品已经进行了亮相。据现场介绍,该智能座舱产品是基于其SenseDrive1.0解决方案,从而可为下一代车载智能系统提供刷脸开门、身份识别、疲劳检测、分心检测、视线追踪、手势识别、乘客属性分析七大功能。

这七大功能具体来说:

刷脸开门:当“司机”靠近车侧时,将触发车门把手处的微动开关,进而唤醒人脸识别功能。此时,系统自动将车门上方摄像头抓拍的人脸,与车机或云端注册过的车主进行比对,确认车主身份并解锁车门。在人脸比对的过程中,系统还将同时启动活体检测,确保解锁的准确性。这一功能不但可解决车主携带钥匙的不便,极大解放双手,同时保障了车辆安全。

商汤刷脸开门技术

身份识别:以人脸识别、活体检测技术为核心,可提供“车载系统-云平台-手机APP”之间的信息互通,以实现车辆权限管理。比如,在共享租车等应用场景中,它可帮助实现对驾驶员及车辆的授权管理。同时,这一功能还可记录、同步车主的个性化需求,辅助进行车内空调、音响、座椅、氛围灯、后视镜角度等智能设置。

疲劳检测、分心检测:通过红外单目摄像头捕捉人脸图像,应用商汤科技的人工智能技术对眼睛的正闭眼状态、打哈欠频率进行综合判别,输出驾驶员正常状态的判定;同时,对司机的头部转交和视线方向进行追踪,以确认驾驶员的注意力是否在路面上。如果司机正处在“疲劳”或者“分心”状态,系统就会发出不同级别的报警信号。

商汤车载系统的手势交互功能

手势识别:借助商汤科技领先的手势识别算法,可实现用手势调节音量、切换歌曲、控制车窗等,就像科幻般的“隔空操作”。目前,商汤科技已开发超过20种标准动静态手势, 并可支持客户订制。

视线追踪:通过摄像头捕捉图像,利用商汤科技的人工智能技术捕捉人的头部和眼睛动态,实时识别驾驶员正在注视的车内区域,如主驾遮阳板、主驾前方、仪表盘、中控显示屏、内后视镜、左右后视镜等,并可根据不同车型灵活配置,满足车辆需求。

乘客属性分析:应用商汤科技的人脸属性检测与物体检测技术,它可在不同光照条件以及各种光照角度下,识别车内人员的性别、年龄、车内位置、情绪等,并可根据需求实现定制化的物品检测,如对手机、笔记本电脑等贵重物品的精准检测。未来,这一功能可应用于对后座儿童的特别看护,遗失物体检测与告知等场景。

其实,像上述刷脸开门、身份识别、手势识别等功能在不少车型上搭载应用。但相比于其他智能车舱产品,商汤的这套解决方案对于硬件要求比较低,其用自身多年积累的图像图例算法可以弥补硬件的不足,而这关乎整车厂非常看重的成本,稳定高效且成本低廉正是商汤科技的核心竞争力所在。

此外,在上海车展期间,商汤科技还阐述了其智能座舱的四大优势:

其一,解决方案内容完备:只需借助IR摄像头,配合车规主流芯片就能覆盖车内和车外的完整视觉解决方案。等同于将人脸识别设备、疲劳检测设备、注意力检测设备、手势识别设备、分心动作识别和属性检测设备六合一的效果。

其二,识别算法高精度:针对红外摄像头深度优化,迎接车内复杂的光照条件的挑战, 满足全天候识别检测需求。

其三,低成本:CPU指令集级优化,毫秒级响应,更低成本硬件平台同样技术性能。

其四,多平台支持:支持不同软硬件平台,X86,GPU, ARM 架构芯片和Linux/Android系统。

而在此次商汤举办的人工智能峰会分论坛上,商汤则主要是公布其SenseDrive2.0整体架构,即“端+云”一体化。

前文也有所言,所谓的端,指的是移动端和车机端,移动端主要提供终端入口,包括人脸注册、Face ID等,车机端则为DMS+ADAS驾驶安全预警系统,可为驾驶员提供精准实时的安全预警。云则是指平台云,基于平台云,商汤可为客户提供商业洞察、OTA升级等功能。

当前,商汤智能车舱DMS的实地验证和测算已经大面积展开,同时,该智能座舱未来还将跨界融合智慧交通、AI互娱(零售/广告)、车联网/物联网以及AR技术等。

展望汽车2030年

随着智能网联汽车的发展,未来智能汽车将像手机一样,成为连接人与外界最重要的移动智能设备。尤其在人工智能、新能源、共享出行和V2X 等社会趋势的支持下,汽车产业迸发出无限的发展空间。

在商汤看来,未来汽车的四大主题,将是自动驾驶、智能网联、共享汽车以及节能减排,其中,前三大趋势将在未来10到20年间对现有汽车生态圈产生重要影响,并首先在欧美成熟市场,之后迅速传播到中国等发展中国家。

此外,在基于视觉方案的车载安全市场上,商汤方面统计,预计到2025年,其将占据27%的市场份额。而在车辆移动定位方面,将从80%缩减至20%。

当前,随着AI技术的发展以及底层技术的不断进步,传统车企与AI企业结合,将成为未来智能汽车领域主流趋势之一,传统车企拥有成熟的车辆控制技术及量产经验优势,借助人工智能头部企业领先的AI技术,能够实现更为平滑、稳健的自动驾驶、智能车舱等技术路线落地。

同时,随着国家将人工智能、5G等高新技术作为未来发展的“基建”,将对智能汽车发展带来重要帮助。而商汤科技作为AI行业领军者之一,势必将在未来的汽车行业中扮演重要角色。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023