谷歌的图像字幕人工智能正在变得可怕
2019-02-12 15:42:45爱云资讯
谷歌发布了其机器学习系统的最新版本,该系统可以确定图像中的内容和字幕,并且它比以往更好。该公司还将其开源。谷歌自2014年以来一直致力于该计划,现在称该算法可以描述准确率为93.9%的图片。
对于使用Inception体系结构的最新迭代,Google团队面临的一个重要问题是,算法是否可以做的不仅仅是识别之前图像集中的对象。为了真正解释和标注照片,AI不仅需要了解图片中的内容,还需要了解图像中某些对象如何相互作用。Google的开发人员表示,这不仅仅是数据的“反刍”。该算法必须能够自然地了解图像中的对象及其用途。
“令人兴奋的是,”博客文章称,“我们的模型确实能够在呈现全新场景时生成准确的新字幕,从而更深入地了解图像中的对象和背景。” 同样重要的是,“它学会了如何用自然的英语短语来表达这些知识,尽管除了阅读人类标题之外,没有接受过额外的语言训练。”
机器学习算法被证明至少在目前对静止图像有更大的理解,而不是视频。
相关文章
- 多模态成新“时尚” 谷歌OpenAI万兴科技等出奇招探索多模态能力及应用
- 谷歌将探索AI写作,小美AI城惊艳亮相:AI世界中挑战与机遇并存
- 妙鸭相机海外同款火了 万兴科技旗下“Pixpic”登陆谷歌商店
- 谷歌开发者大会带来升级版Starline,微美全息推进3D显示+全息技术引领新高潮
- TalentOrg携手谷歌、爱点击,共探全球化发展策略
- 谷歌翻译现支持翻译图片内文字
- 谷歌折叠手机Pixel Fold首次在街头被发现
- 中国版“ChatGPT”真的来了,百度、微软、谷歌谁能突围?
- 谷歌Pixel Fold最新外观细节曝光:内外屏参数变化 相机模组造型熟悉
- 传音与谷歌建立全球战略合作伙伴关系,共推新兴市场数字化发展
- Poly博诣多款产品获谷歌及微软认证 加持混合办公生态
- 谷歌明年推8Gbps宽带服务 上行也不限速
- 谷歌Pixel 6a全球定价公布 新晋中端机7月21日开始发货
- Android 13亮相谷歌I/O大会,OPPO首批推出开发者预览版
- 谷歌收购数据科学公司Kaggle增强机器学习和AI业务
- 谷歌 Pixel 6 拆解,FD-SOI首次被用于5G毫米波
热门文章
头条文章
重点文章
推荐文章
热点文章