颠覆自动驾驶的AI相机来了!光速执行深度学习
2018-08-21 14:49:47AI云资讯1782
斯坦福研究人员研究出一套小型AI成像系统。成像精度和速度均达到电子计算处理器水平,它采用双层光学-电子混合计算技术,在低光照条件下具备更强的成像能力,每个立体像素上的光电子密度最高可达几十个,同时节约了大量本该用于计算的时间和成本。

如今,自动驾驶汽车和无人驾驶飞机背后的图像识别技术依赖于人工智能:计算机本质上学会了自己识别物体,比如识别狗、过马路的行人或停车的汽车。主要问题是,目前运行人工智能算法的计算机对于手持医疗设备等未来应用来说显得过于庞大和缓慢。
现在,斯坦福大学的研究人员已经设计出一种新型的AI相机系统,它可以更快、更高效地对图像进行分类,有朝一日,这种系统可以小到足以嵌入设备本身,这在今天是不可能实现的。这项研究发表在8月17日的Nature Scientific Reports上。
“自动驾驶汽车的后备箱里有一台体积相对较大、速度相对较慢、能耗较高的电脑。”该研究负责人、斯坦福大学电气工程助理教授Gordon Wetzstein表示,未来的应用程序将需要更快、更小的设备来处理图像流。
AI相机:双层光电混合计算机
现在,Wetzstein和论文第一作者、研究生Julie Chang朝着这一技术迈出了一步,他们将两种类型的计算机结合在一起,创造了一种专为图像分析设计的光电混合计算机。
原型相机的第一层是一种光学计算机,它不需要数字计算的高功耗数学运算。第二层是传统的数字电子计算机。
光学计算机层通过物理预处理图像数据进行操作,以多种方式对其进行过滤,否则电子计算机就必须用数学方法对其进行过滤。由于过滤是在光线穿过自定义光学时自然发生的,所以这一层的输入功率为零。这为混合系统节省了大量的本该用于计算的时间和能量。
“我们已经把人工智能的一些数学知识拓展到了光学领域。”Chang说。
这样做的结果是更少的计算、更少的内存调用和更少的时间来完成这个过程。在跳过了这些预处理步骤之后,剩下的分析将以相当大的优势进入数字计算机层。“数百万次计算都是在光速下进行的。”
成像精度和速度堪比电子计算机处理器
在速度和精度方面,这款原型机与现有的电子计算机处理器相媲美。
虽然他们目前的原型机还处在实验台上,不会被归类为小型设备,但研究人员说,他们的系统有一天会被小型化,以适合手持摄像机或无人机。
在模拟和真实世界的实验中,研究小组使用该系统成功地识别了飞机、汽车、猫、狗等自然图像。
Wetzstein说:“我们系统的某些未来版本在自动驾驶汽车等快速决策应用中尤其有用。”
除了缩小原型尺寸之外,Wetzstein, Chang和他们在斯坦福计算机成像实验室的同事们现在正在寻找方法使光学元件做更多的预处理。最终,他们要用更小、更快的技术将取代现在在自动驾驶汽车、无人机和其他识别周围世界的设备上使用的计算机。
相关原理及论文
卷积神经网络(CNN)在各种计算机视觉应用中表现出色,但其高性能也伴随着高昂的计算成本。尽管人们可以通过算法和专用硬件来提高效率,但由于能源预算紧张,在嵌入式系统中部署卷积神经网络仍然很困难。
我们在本文中探索一种互补策略,在电子计算之前加上一层光学计算,以提高图像分类任务的性能,同时增加最小的电子计算成本或处理时间。我们提出了一种基于优化衍射光学元件的光学卷积层设计,并在两个模拟测试中验证了我们的设计:经过训练的光学相关器,以及光电双层卷积神经网络。我们在仿真模型和光学原型中证明,我们的光学系统的分类精度可以与类似的电子计算方案相媲美,同时大大节省了计算成本。
相关文章
- L3上路:自动驾驶爆发前夜,MGU执行器守护最底层安全
- ASTROX全球首发,开创未来出行机器人自动驾驶新范式
- 意大利驻华大使打卡文远知行Robotaxi,点赞中国领先自动驾驶科技
- 开启实体商业“自动驾驶”时代:大吉肆龙虾智能体首发重塑盈利底层逻辑
- 特斯拉全自动驾驶功能已处于召回边缘
- 优步向Rivian投资12.5亿美元 双方达成新自动驾驶出租车协议
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
- 《运输策略蓝图》发布 百度杨楠:香港是孵化自动驾驶业务的宝地
- 酷哇发布 WAM 2.0 世界模型,加速构建“自动驾驶+机器人”RoboCity 新基建
- Waymo融资160亿美元,欲将自动驾驶出租车业务推向全球
- 自动驾驶新能源重卡赛道最大单笔融资来了!深向科技完成11.77亿元Pre-IPO轮融资
- 特斯拉在得克萨斯州奥斯汀推出无人监管的自动驾驶出租车服务
- 豪赌自动驾驶!喜相逢拟控股毫米波雷达“黑马”
- 喜相逢“杀入”上游:砸向自动驾驶的感知心脏
- 主线科技获评“2025最具投资潜力奖”,自动驾驶卡车商业化进程加速
- 英伟达CES预言自动驾驶未来,文远知行融合双技术路线领跑行业
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









