Google 图像识别 AI 眼中的世界是怎样的?
2018-09-03 17:52:46AI云资讯963
Google 在 2015 I/O 大会上推出的 Google Photos 不仅仅是一个相册,它可以将相册中同一个人物的照片整合在一起,比如回顾一个婴儿从小到大的成长轨迹。通过人工智能的长期学习,它甚至可以自动判断对你重要的时刻、重要的人、和重要的事物。
在其中起到关键作用的是 Google 的图片识别 AI 。它通过学习大量的图片、调整算法来提高识别的精确度。
但是工程师们要如何知道 AI 对图片识别的准确性呢?
通过一个被称为 Inceptionism 的项目,Google 工程师潜入了 AI 的 “梦境”。他们先输入一张图片,让它识别图片中关键的部分;再让 AI 输出一张图片,表达它对图片的理解。

Google 的图片识别 AI 具有 30 层神经网络,每一层对应着不同的抽象程度,比如最低层次能识别光线、色彩,下一层次能识别图片的边缘等等。这样一层层的“训练”需要大量的数据。每一层都能提取出更高层次的细节,而最后一层会决定 AI 对图片的理解。
比如你想知道输入怎样的图片会让 AI 认为是“香蕉”,可以从一张满是噪点的图片开始,然后慢慢调整,直到它输出你想让它识别的事物。

在测试中,当试图询问哑铃是什么时,Google AI 输出了带手臂的哑铃,在输入学习的图片库中,哑铃都是和手臂一起出现的。那么提高认识精确度的办法就是,在训练学习中多输入一些哑铃单独出现的图片。

在不同的层次输入图片会得出不同的结果,比如在一些测试中,就出现了这些多眼多足的“神兽”。

Google 还专门为这些图片建了一个相册。有的如同超现实主义的艺术作品,有的则十分惊悚。这些图片至少能够表明,AI 眼中的世界显然与人类还有很大的差距。
而用户对此的反应也不一而足。有人看了以后评论道:
“这是我见过最恐怖的东西。如果 AI 眼中的世界是我们永远都不可能看到的,那么我们要怎么回应它们的行为?”
而另一位用户则认为:
“我很怀疑这是我们可以称为‘智能’的东西。它很奇特、吸引人、很酷,但是计算机并不是在绘画或者做梦,它只是在遵循设定的程序而已。”
相关文章
- Google发布AI领域新进展:涉及抗灾、生成式AI和语言模型
- Google Pixel Fold显示屏规格曝光
- Aqara绿米亮相Google I/O大会,支持Matter协议助力智能家居互通互联
- Google发布搭载Tensor处理器的Pixel 6a 售价449美元
- Google正在使用人工智能“更准确地检测更广泛的个人危机搜索”
- 飞书深诺荣膺三项Google 2021年优秀合作伙伴大奖,在出海营销机构中独占鳌头
- 神州数码旗下GoPomelo荣获Google Cloud年度合作伙伴大奖
- Google推出第四代定制AI芯片TPU v4
- Google AI再曝黑人女员工离职,这是所有科技公司都将面对的问题
- Google实验允许“听到颜色的声音”
- 谷歌开发的双击手势操作 可触发Google Assistant
- VR/AR大战或一触即发,苹果/Google/微美全息等布局5G商用的竞速赛
- 取代Android TV!谷歌或在3月推出全新的Google TV
- 诺基亚与Google签约以构建基于云的5G网络
- Google和苹果,为什么都想让你安装新系统
- Google最新的AR化妆功能曝光,微美全息AR+AI人脸识别精确解锁
人工智能企业
更多>>人工智能硬件
更多>>- 一飞智控携全空间解决方案及三款新品,亮相2026世界无人机大会
- 续航超强的微星全新尊爵系列,重塑轻薄本的超凡全能体验
- BOE(京东方)全球首发原生千帧FHD 护眼电竞显示器 真千帧硬实力引领电竞高刷新时代
- Neousys宸曜发布星宸系列强固嵌入式工控机,赋能工业智能升级
- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









