谷歌的图像字幕人工智能正在变得可怕
2019-02-12 15:42:45AI云资讯1924
谷歌发布了其机器学习系统的最新版本,该系统可以确定图像中的内容和字幕,并且它比以往更好。该公司还将其开源。谷歌自2014年以来一直致力于该计划,现在称该算法可以描述准确率为93.9%的图片。

对于使用Inception体系结构的最新迭代,Google团队面临的一个重要问题是,算法是否可以做的不仅仅是识别之前图像集中的对象。为了真正解释和标注照片,AI不仅需要了解图片中的内容,还需要了解图像中某些对象如何相互作用。Google的开发人员表示,这不仅仅是数据的“反刍”。该算法必须能够自然地了解图像中的对象及其用途。
“令人兴奋的是,”博客文章称,“我们的模型确实能够在呈现全新场景时生成准确的新字幕,从而更深入地了解图像中的对象和背景。” 同样重要的是,“它学会了如何用自然的英语短语来表达这些知识,尽管除了阅读人类标题之外,没有接受过额外的语言训练。”
机器学习算法被证明至少在目前对静止图像有更大的理解,而不是视频。
相关文章
- 谷歌云客户业务负责人重返微软,出任安全主管
- 谷歌年度营收首次突破4000亿美元
- 谷歌权威发布!2026 AI Agent智能体趋势,九科信息一文带你深入解读!
- 谷歌在Chrome浏览器中新增Gemini AI驱动的自动浏览功能
- 小水智能出席谷歌创业先锋闭门会 携手Gemini构建全球化儿童AI生态
- 苹果Siri搭载Gemini技术,或为谷歌创造高达50亿美元的价值
- 苹果用谷歌Gemini AI模型推动Siri重大升级
- 谷歌母公司Alphabet旗下Wing无人机提供送货服务的沃尔玛门店将新增150家
- OpenAI狂揽软银2800亿融资,谷歌/微美全息领衔AI军备竞赛重塑大模型格局
- 高通与谷歌深化合作 拓展骁龙数字底盘与Android系统融合生态
- 火山引擎中国第一、全球第三,Tokens调用量逼近谷歌!
- 谷歌发布Gemini 3 Flash加速AI搜索并增强图像生成能力
- 易海创腾受邀出席谷歌2026代理商大会,共话出海新生态
- 谷歌“打样”智能眼镜新范式,中国厂商凭供应链强势突围
- 谷歌将在AI模式下增加信息来源索引范围
- OpenAI宣布进入“红色警报”状态,谷歌在人工智能领域加速追赶









