谷歌推看图配诗AI,输入蔡徐坤篮球照片后出现了天雷地火
2019-05-07 09:30:59AI云资讯1278
在人工智能(AI)开发的路径选择上,谷歌显然走的是一条既专业又欢乐的路线。有虐哭柯洁的AlphaGo,有随叫随到的智能助理,还有能将你的自拍进行艺术创作的PoemPortraits。
近日,谷歌艺术和文化实验室推出了一个名为“诗歌肖像”(PoemPortraits)的应用,它可以根据用户提供的词条,进行诗歌创作,并将其与自拍结合,最终创建同名的诗歌肖像。简单来说它有点像滤镜与诗歌的结合。

蔡徐坤原图
我们用蔡徐坤的照片和英文单词“basketball”进行了创作,一起来看下人工智能生成的效果。
人工智能配的诗歌内容大意为:
这个篮球,
在天雷地火之前就有,
太阳的缘分
是云。

PoemPortraits生成的效果图,诗歌中文翻译
诗歌加上照片,整体效果看上去是不是有点诡异,却又有无法言明的艺术气息?
人工智能让诗歌和自拍结合
据了解,目前这款应用推出了网络在线版本,是谷歌和艺术家、著名舞台设计师Es Devlin之间长期合作的成果。Es Devlin曾与英国国家剧院,Kanye West(坎爷),Beyoncé(碧昂丝)和Adele(阿黛尔)等名人合作。

PoemPortraits网络在线版屏幕截图
谷歌方面开发了诗歌生成软件,他们搭建了深度学习神经网络,使用的训练数据集是19世纪的诗集,数据量超过2500万字。搭建好的模型可以根据用户输入的词条生成诗歌文本。目前,除了线上版本外,谷歌还提供了两个线下体验点,有点类似地铁站里的照相亭,分别位于英国伦敦著名地标特拉法加广场和英国蛇形画廊。
将人工智能与艺术创作结合,一直以来都被认为是人工智能技术开发的难点。原因在于相对于下围棋、打游戏等可以直接计算且数据量丰富的项目,艺术创作很难找到标准的计算路径。不过,即便如此,研究人员利用人工智能进行艺术创作的尝试一直没有停止。
AI能作诗,写歌还会画画
微软的跨平台人工智能机器人“小冰”就曾尝试过写诗,甚至还出了本原创诗集《阳光失了玻璃窗》。小冰先后学习了自1920年以来519位中国现代诗人的作品,通过对这些诗歌上万次的学习,然后获得了现代诗的创造力,并且逐渐形成了自己的创作风格、偏好和技巧。

微软小冰
不过,作为刚出道的诗人,小冰还有不足,它的诗集中会出现一些人类不会犯的错误。比如,在《它常把我的海水洗甜》这首诗中,小冰会出现“有燃(悠然)从风雪的街心随着流漫”这样的诗歌。

微软小冰创作的诗歌
除了写诗外,人工智能还尝试过写歌。比如,谷歌发起的艺术项目Magenta,该项目首次亮相于杜伦“Moogfest科技音乐节”上。Magenta项目专注于机器理解、生成音乐能力的训练,以及创造能够进一步完善和补充人类创造力的工具。

面对用户粗糙的画作,AI给出的三个预测。 theverge 图
除了写诗、创作歌曲,谷歌还曾开发过一款能一眼看穿你画的是什么的人工智能应用Sketch-RNN。这个AI可以把你画的东西变成理想的画作,它依赖于谷歌的图像识别技术,通过一个简单的手绘图像数据库来和你的画作匹配。另外,在这个AI程序中,用户还可以尝试和它一起完成一幅画作。
当然这些尝试都还有不完美的地方,正如小冰在创作中会出现错误一样,Magenta生成的旋律单一,甚至可以说有点刺耳,Sketch-RNN有时会错误识别用户想要画的内容。Devlin也认为尽管“诗歌肖像”项目创作的诗歌有时让人很惊讶,但有时却又非常荒谬。
相关文章
- 谷歌的未来是一个无所不能的搜索框
- Google I/O 2026:Gemini 将成为谷歌年度开发者大会的主角
- 2026智能眼镜“百镜争鸣”,谷歌/阿里/微美全息引领AR/XR产业全面升级
- 谷歌发布 Chromebook 后继产品——Googlebook
- 谷歌称其首次发现并阻止了一个利用AI开发的零日漏洞
- 谷歌首款AI眼镜即将呼之欲出,微美全息(WIMI.US)扎实推进AI+AR生态落地
- 谷歌母公司发布2026年一季度财报,搜索查询量创下历史新高
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Siri悄然接入Gemini大模型,苹果反成谷歌云2026 Next大会主角
- 联合谷歌共建:戴盟发布数百万小时触觉具身数据集
- 谷歌将Marvell纳入双芯片TPU计划,ASIC AI推理格局或将重塑
- 谷歌推出Mac版Gemini人工智能应用
- Meta闭源模型Muse Spark登场,谷歌/微美全息加码投入开源AI“严阵以待”
- 谷歌正式接管母公司Alphabet旗下机器人软件企业Intrinsic
- 谷歌云客户业务负责人重返微软,出任安全主管
- 谷歌年度营收首次突破4000亿美元
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









