京东探索稀疏三维空间点云Global Context论文入选NeurIPS2020
2020-12-05 10:18:17AI云资讯1202
近日,第34届神经信息处理系统大会(Conference on Neural Information Processing Systems,简称NeurIPS,NIPS)在线上召开。作为全球顶级的机器学习和计算神经科学会议,今年的NIPS依然受到了学者们的高度关注,甚至由于其线上开放的特性缓解了往年抢票难的问题,而将获得更多的“听众”。
据悉,今年NeurIPS稿件录取率为20.09%,创下历史新低。在如此严苛的录取标准之下,京东AI深度学习与语音语义实验室提交的探索稀疏3D点云Global Context的论文《Group Contextual Encoding for 3D Point Clouds》成功入选。今年以来,京东AI深度学习与语音语义实验室的研究成果频获国际认可,此前还有多篇论文入选国际语音和语言处理顶会比如ACL 2020、AAAI 2020、INTERSPEECH 2020等。
Global Context对视觉感知至关重要,可以根据语义信息提高物体识别的准确率,但目前针对3D点云的Global Context的研究还不够充分,特别是在三维空间的情况下,数据呈现高维、稀疏的特点,对传统深度学习算法提出了挑战。因此,京东AI研究院基于其研究实习生计划与东京大学合作了《Group Contextual Encoding for 3D Point Clouds》,针对这一研究领域提出了Group Contextual Encoding的Global Context学习方法。

从目前已有3D点云Global Context的研究成果来看,比如LG-PointNet++ 【1】,其复杂度为,N是输入点的个数。当场景复杂时,输入点数较多会导致耗费相当大的算力。Contextual Encoding Layer【2】的复杂度是,是一种有效率的方法,K是该方法里code word数目。但是点云数据稀疏导致的过拟合现象(overfitting),会影响性能的提升,导致在ScanNet,SUN-RGBD数据集上3D检测性能随着Codeword数目K的增长,性能却很快就饱和不再增长。虽然目前有一些深度补全的算法可以解决数据稀疏这个问题,但是这些算法都存在结构复杂、耗费计算资源的问题,因此,京东AI研究院决定探索简单有效的方法。
首先要解决数据的稀疏问题。通过把特征通道分组,从而获得更多的等效数据,如图1所示,如果把通道分成G组特征子向量,数据就相对应增广了G倍。再将分组后的特征子向量通过Encoding layer得到Global context,从而有利于在分组后的特征子空间学习全局上下文, 然后通过channel attention的形式作用于分组后的特征。最后通过Concat操作恢复为原特征的尺寸。如此操作既解决了数据的稀疏问题,又解决算法结构复杂、算力耗费巨大的问题。

图1:Group Contextual Encoding方法图。
随后,京东AI研究院又将这种方法在多个3D数集上进行验证,不仅证实这种方法简单有效,还刷新了SOTA方法的性能。将这种方法应用在PointNet++ Backbone上,并部署到VoteNet模型。如表1所示,在ScanNet数据集以mAP@0.25指标测评时,该方法领先VoteNet 【3】 2.2mAP,增幅已然明显,但更令人惊喜的是,在更加严格的mAP@0.5 的指标下,如表2所示,该方法领先Waymo、Facebook AI Research以及Stanford大学提出的 VoteNet高达6.57 mAP,可视化结果如图2所示。
表1:ScanNet数据集mAP@0.25评测指标的结果。

表2:ScanNet数据集mAP@0.5评测指标的结果。


图2:ScanNet数据集的结果可视图。在SUN-RGBD数据集,我们的方法也领先VoteNet 3mAP,具体定量以及定性结果如表3和图3所示。
表3:SUN-RGBD数据集mAP@0.25评测指标的结果.


图3:SUN-RGBD数据集的结果可视图。
京东自2017年开始全面向技术转型,用技术重塑了京东的生态系统,逐渐突破零售边界,拓展至数字科技、物流、健康等众多领域。一直以来,消费者们更多的在购物、物流等环节体验到京东技术的进步,如今,京东在人工智能领域的长足进展不仅获得学术界的认可,也逐渐被更多的用户所知悉,京东的智能语音技术也已经在智能外呼机器人、客服语音机器人等电话交互场景中实现成熟应用,此次提出的Group Contextual Encoding方法也可以应用在下游的AR(增强现实)、MR(混合现实)以及机器人,自动驾驶等领域,推动这些领域的发展。京东技术将不仅赋能金融、医疗、教育、健康等行业,还将在更多领域为用户提供便利。
相关文章
- 双节引爆礼赠热潮 夏日消暑品类井喷 京东超市618开门红战报发布
- 京东与越疆科技完成战略签约 推动工业机器人产品加速消费场景拓展
- 京东方、TCL科技布局玻璃基封装业务,剑指先进封装新蓝海
- 京东采销探厂直播走进舒福德智能床工厂,行业标杆携手解锁数字睡眠新体验
- 京东集团与三一集团战略合作升级,加强数智化采购供应链合作
- BOE(京东方)全球首发原生千帧FHD 护眼电竞显示器 真千帧硬实力引领电竞高刷新时代
- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- BOE(京东方)赋能电竞新旗舰ROG枪神10 Plus超竞版 首创BLMB动态无拖影技术开启电竞新纪元
- 以科学标尺重新定义视觉体验! 京东方发布OLED显示通透感核心研究成果,赋能行业首个通透度标准落地,为用户提供至臻显示体验
- 共建数亿目标用户 中国移动携手京东发布AI-eSIM“1+3+9”多生态智能服务体系
- 京东方UB Cell 5.0 RGBX:解锁BT.2020 130%极致色域,登顶显示色域新高峰
- 京东发布《2026中国家庭饮水跃迁白皮书》 净水器换新用户达50%
- BOE(京东方)2026年一季度喜迎开门红 业务增长与股东回馈并重
- BOE(京东方)光幕技术闪耀2026北京车展 赋能合作伙伴共筑智能出行新未来
- 四维图新与京东科技签署战略合作,共拓AI智能体新赛道
- 四维图新与京东科技达成战略合作
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









