Google发布了包含500万张图片和20万个地标的AI培训数据集
2019-05-06 14:59:14爱云资讯573

如今,为了实现更为复杂的地标检测计算机视觉模型的目标,Google开源了Google-Landmarks-v2,这是一种新的、更大的地标识别资料库,包含两倍于照片和七倍于地标的信息。此外,它在其机器学习社区Kaggle上发起了两个新挑战(Landmark Recognition 2019和Landmark Retrieval 2019),并发布了区域图像检索框架Detect to Retrieve的源代码和模型。
“实例识别和图像检索方法都需要在图像数量和各种地标中使用更大的数据集,以便训练更好、更强大的系统,”谷歌人工智能软件工程师Cao Bingyi和Tobias Weyand写道。“我们希望此数据集将有助于提高实例识别和图像检索的先进水平。”
根据Bingyi和Weyand的说法,Google-Landmarks-v2包含了超过500万张来自世界各地摄影师收集的20多万个不同地标的图像。这些照片贴上了自己的图片标签,描绘了新天鹅堡、金门大桥、清水寺、哈利法塔、吉萨大狮身人面像、马丘比丘等著名景点,并将其纳入其中。然后, 谷歌的研究人员用维基媒体共享资源 (Wikimedia Commons) 的历史和鲜为人知的图像对它们进行了补充, 维基媒体基金会免费使用图片、声音和其他媒体的在线存储库。
那么,Detect to Retrieve框架是如何处理的呢?Cao和Weyand说,发布的模型,它是在原始地标数据集的80000个子集上训练的,利用了对象检测模型中的边界框,为包含感兴趣项目的图像区域赋予了“额外的权重”,显著提高了准确性。
Landmark Recognition 2019和Landmark Retrieval 2019都是开放式的,这两个版本都要求参赛者设计Landmark Detecting人工智能模型,而Landmark Retrieval 2019则要求参赛者使用人工智能系统来查找显示目标地标的图像。这两个奖项都包括总额为5万美元的现金奖,Bingyi和Weyand表示将邀请获奖团队在今年晚些时候在加利福尼亚州长滩举行的2019年计算机视觉和模式识别会议的第二次地标识别研讨会上展示他们的方法。
相关文章
- Google发布AI领域新进展:涉及抗灾、生成式AI和语言模型
- Google Pixel Fold显示屏规格曝光
- Aqara绿米亮相Google I/O大会,支持Matter协议助力智能家居互通互联
- Google发布搭载Tensor处理器的Pixel 6a 售价449美元
- Google正在使用人工智能“更准确地检测更广泛的个人危机搜索”
- 飞书深诺荣膺三项Google 2021年优秀合作伙伴大奖,在出海营销机构中独占鳌头
- 神州数码旗下GoPomelo荣获Google Cloud年度合作伙伴大奖
- Google推出第四代定制AI芯片TPU v4
- Google AI再曝黑人女员工离职,这是所有科技公司都将面对的问题
- Google实验允许“听到颜色的声音”
- 谷歌开发的双击手势操作 可触发Google Assistant
- VR/AR大战或一触即发,苹果/Google/微美全息等布局5G商用的竞速赛
- 取代Android TV!谷歌或在3月推出全新的Google TV
- 诺基亚与Google签约以构建基于云的5G网络
- Google和苹果,为什么都想让你安装新系统
- Google最新的AR化妆功能曝光,微美全息AR+AI人脸识别精确解锁