英伟达的STEAL AI让神经网络拥有更好的计算机视觉
2019-06-18 15:02:52AI云资讯1441
来自英伟达(Nvidia)、多伦多大学(University of Toronto)和多伦多矢量人工智能研究所(Vector Institute for Artificial Intelligence)的研究人员设计了一种方法,可以更精确地探测和预测物体的起点和终点。这些知识可以改进现有计算机视觉模型的推理,并为未来的模型标记训练数据。
在研究人员的实验中,语义细化的边缘对齐学习(steal)能够将最先进的casenet语义边界预测模型的精度提高4%。更精确地识别物体的边界可以应用于计算机视觉任务,从图像生成到三维重建到物体检测。
STEAL可用于改进现有的CNNs或边界检测模型,但研究人员还认为它可以帮助他们更有效地标记或注释计算机视觉模型的数据。为证明这一点,STEAL方法用于改进城市景观,这是2016年首次在计算机视觉和模式识别(CVPR)会议上引入的城市环境数据集。

在GitHub上,STEAL框架以像素为单位学习和预测对象边缘,研究人员称之为“主动对齐”。“在训练过程中对注释噪声进行明确的推理,以及为网络提供一个从端到端排列不当的标签中学习的分级公式,也有助于产生结果。”
据arXiv报道,研究者在4月发表的一篇论文中说:“我们进一步表明,我们预测的边界比最新的DeepLab-v3分割输出得到的边界明显更好,同时使用了更轻量级的架构。”并在6月9日进行了修订。
“魔鬼就在边缘:从嘈杂的注释中学习语义边界”将在本周于加州长滩举行的CVPR 2019年会议上分享。英伟达在今天的一篇博客文章中说,近12篇部分由英伟达研究公司撰写的研究论文将在会议上以口头陈述的形式分享。
相关文章
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
- 英特尔在英伟达GTC大会的完美时机亮相:智能体AI将CPU变为新瓶颈
- 英伟达CEO黄仁勋庆祝GeForce 3问世25周年:没有GeForce,就没有AI
- 英伟达发布Nemotron 3 Super开源智能体AI模型:或成为OpenClaw的理想选择
- 英伟达CEO黄仁勋将AI比作一个五层蛋糕,称其潜力尚未被完全发掘
- Teclab绕过英伟达RTX 50显存时钟限制,将RTX 5070 Ti超频至超过36Gbps
- 全力奔赴AI推理时代,英伟达/微美全息大举进军开启空前爆发盛宴!
- 英伟达将推出新款GeForce RTX 5050显卡,搭载9GB GDDR7显存
- 英伟达将向两家光子技术公司注资40亿美元,抢占AI竞争制高点
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









