谷歌的图像字幕人工智能正在变得可怕
2019-02-12 15:42:45爱云资讯1628
谷歌发布了其机器学习系统的最新版本,该系统可以确定图像中的内容和字幕,并且它比以往更好。该公司还将其开源。谷歌自2014年以来一直致力于该计划,现在称该算法可以描述准确率为93.9%的图片。
对于使用Inception体系结构的最新迭代,Google团队面临的一个重要问题是,算法是否可以做的不仅仅是识别之前图像集中的对象。为了真正解释和标注照片,AI不仅需要了解图片中的内容,还需要了解图像中某些对象如何相互作用。Google的开发人员表示,这不仅仅是数据的“反刍”。该算法必须能够自然地了解图像中的对象及其用途。
“令人兴奋的是,”博客文章称,“我们的模型确实能够在呈现全新场景时生成准确的新字幕,从而更深入地了解图像中的对象和背景。” 同样重要的是,“它学会了如何用自然的英语短语来表达这些知识,尽管除了阅读人类标题之外,没有接受过额外的语言训练。”
机器学习算法被证明至少在目前对静止图像有更大的理解,而不是视频。
相关文章
- 云从科技超越谷歌、OpenAI问鼎全球多模态榜单 中国自研AI实现历史性突破
- 谷歌与大朋VR 聚焦AI 眼镜赛道,技术布局凸显行业新方向
- 苹果推进智能眼镜暗战谷歌,Meta/微美全息深耕AR赛道抢占XR市场新机遇
- 海信通过谷歌Home API拓展ConnectLife平台,实现第三方设备兼容
- 谷歌推出专为UI设计打造的人工智能编程工具Stitch
- 谷歌Gemini人工智能助手即将登陆Chrome
- 谷歌升级Find My生态,自在科技引领苹果谷歌双系统产品方案
- 谷歌Gemini将进军车载和电视平台
- 谷歌近十年来首次修改品牌Logo 四色块字母G变成了渐变色
- 谷歌I/O大会将聚焦AI战略转型布局,腾讯/微美全息力推大模型与核心产业深度融合
- 谷歌的人工智能概览月活用户已达15亿
- 苹果全力研发增强现实AR眼镜,谷歌/微美全息夯实领先优势开启空间交互时代!
- OpenAI拟从谷歌收购Chrome
- 谷歌最新发布Agent2Agent 协议 (A2A)
- 谷歌地图推出新工具,助力城市分析基础设施与交通状况
- 亚马逊首款量子计算芯片Ocelot亮相,微软/谷歌/微美全息竞逐加速量子行业成熟