对人工智能来说,区分原图和镜像图是如此轻松
2020-07-07 13:51:18AI云资讯560

研究人员发现,人工智能学会了通过捕捉意外线索,区分原始图像和反射像。
据美国“优睿科”网站7月2日消息称,美国康奈尔大学的研究人员在“2020年计算机视觉和模式识别会议”中公布了“手性视觉”(Visual Chirality)的相关研究成果。
他们开发的算法可以通过捕捉头发、视线方向和胡子等意想不到的细节区分原图与反射图。该发现对于训练机器学习模型和检测伪造图像具有巨大的启示意义。
论文作者、计算机科学副教授Noah Snavely介绍道:“宇宙中的万事万物是不对称的。如果你翻转一个图像,那么肯定会有不同之处。我对收集信息的新方法研究很感兴趣。”
Snavely表示,对于人工智能来说,区分原始图像和反射像是一项很简单的任务。一般来说,一套基本的深度学习算法就能快速学习如何识别图像是否被翻转,并进行分类,精确率高达60%至90%。对于AI捕捉到的许多线索来说,人类是很难能注意到的。
在这项研究中,该团队开发了一项技术来创建一幅热图,并指出图像中哪些部分是算法感兴趣的内容,以便了解算法是如何做出这类决定的。
不出所料,他们发现,AI最常用的线索是文本,在每一种书面语言中,文本倒置都是最明显的不同之处。
为了获取更多信息,他们将带有文本的图像从数据集中删除,由此发现模型集中关注的另一组特征包括手表、衬衫纽扣、脸和手机方向以及其他跟惯用右手习惯相关的因素。
Snavely认为,检查反射像与原始图像的区别可以揭示机器学习中可能存在的偏差,而这些偏差可能导致不准确的结果。
他说:“这给计算机视觉领域带来了一个开放性问题——什么时候适合用翻转来增强数据集,什么时候不合适?我希望这能让人们更多地思考这些问题,并着手开发相关工具来理解它与算法偏差的联系。”
了解反射现象会如何改变原图像,也有助于使用人工智能来识别伪造或篡改的图像。这是一个在互联网上日益受到关注的问题。
Snavely 说:“如果你想鉴别某个图像的真伪,这可能就是一个可用于图像取证的新工具。”
相关文章
- 全球计算机视觉大赛,英特灵达再登冠军之巅
- 睿云联AI团队在计算机视觉顶会CVPR人脸防欺诈竞赛中斩获亚军
- 推进计算机视觉技术创新,微美全息研究基于融合图卷积网络的图像融合点云语义分割
- DHL趋势报告:人工智能驱动的计算机视觉技术正对行业产生重要影响
- 传音影像团队图像超分辨领域的论文被国际计算机视觉顶级会议ICCV 2023录用
- IDC发布中国计算机视觉解决方案厂商评估,联汇科技作为主要厂商上榜
- 推动计算机视觉技术创新,微美全息研究基于语义分割的机器视觉算法
- 腾讯云智能2项计算机视觉行业标准获工信部立项,助力建设AI标准体系
- 格灵深瞳三季报公布 可能成为首家盈利的AI计算机视觉A股上市公司
- 合合信息技术专家受邀出席RACV2022,探索计算机视觉与图形学未来增量
- 特斯联实现计算机视觉科研突破,多项研究成果入选CVPR、TPAMI等国际顶会顶刊
- 格灵深瞳专注计算机视觉领域,自主研发核心算法
- 百分点科技:基于计算机视觉的语义分割技术如何在水域监控上发挥作用
- 百分点感知智能实验室:计算机视觉理论和应用研究
- 计算机视觉产业知识产权联盟成立,美图公司携手行业伙伴助力产业升级
- 中兴通讯斩获全球计算机视觉顶级会议CVPR 2021多项荣誉
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









