微软“AI画家”登场!但画功有点烂
2018-08-21 14:40:06AI云资讯818
微软深度学习技术中心的研究人员研发了一种AI,它可根据你输入的信息自动生成图片,不过,VICE杂志作者Sarah Emerson在尝试过相关DEMO后,发现这款AI的作品实在不咋地。我喜欢那些把事情做得很糟糕的技术。比如从楼上摔下来的机器人、编写疯狂卡拉ok歌曲的算法。他们始终是那么“努力”地工作。所以,一个名为AttnGAN的AI让我非常开心。这是一种运用生成性对抗网络(GAN)的机器学习算法,它被训练成基于文本输入生成图像,由微软深度学习技术中心的研究人员于今年1月发布。同时,他们的论文也发表在arXiv.org上。理论上,AttnGAN可以基于文本内容生成图片,但它目前表现的并不好,有时甚至会生成十分糟糕的图片。公正地说,当研究人员在特定的数据集(比如鸟类图像)上训练人工智能时,它能够生成令人信服的鸟类效果图。但是,当在一个更大的、包含更多不同图像的数据集中进行训练时,AttnGAN在艺术上的造诣就显得捉襟见肘了。

(AttnGAN针对特定鸟类数据集生成的图像)
AttnGAN可以针对简单的文字内容生成相应图片,比如“一只猫”。但研究人员指出,“文字描述比较复杂的鸟类,比如‘冠绿色、翅膀黄色和腹部红色的鸟’,它便无法识别。”


(纽约大学Cristobal Valenzuela基于AttnGAN制作的网页demo)
纽约大学的技术专家和研究员Cristobal Valenzuela基于AttnGAN制作了一份demo,让读者也可尝试这款AI的效果。AttnGAN是一款更大的项目——Runway(一个AI工具包,可为设计和创意平台添加人工智能功能)中的一部分,它可以创作更具创造性的内容。Valenzuela同时还在marrowa——一个交互式网站中工作,研究AI是如何像大脑一样处理信息的。 Valenzuela在Twitter上告诉我:“我之所以研究这项技术,是因为我相信人工智能有一种我们未知的创造性潜力。” Valenzuela说:“虽然有些生成出来的图片十分奇怪(比如你输入任何和人类相关的文字时),但有些人在往里输入了诗歌、歌词、语录之后,还是得到了不少激发灵感或富有诗意的图片。”除了作为一种有趣的游戏,Valenzuela相信人工智能也是一种实用的工具。比如,它可以应用在CG、数码动画的合成中,甚至能基于人们的意愿自动生成动画角色。”
相关文章
- 微软将通过动态CPU调节技术提升Windows 11的性能
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- 微软放弃Xbox Copilot人工智能
- 微软发布2026财年第三季度财报,Xbox收入下滑,云业务攀升
- 双城奔赴,智领未来:领驭科技亮相2026微软AI Tour上海·香港站
- 微软在Word、Excel和PowerPoint中推出“氛围工作”功能
- 微软为Copilot测试类似OpenClaw的AI机器人
- 微软开始从Windows 11应用中移除Copilot按钮
- 2026 AI智能体端侧变革来袭,微软/微美全息押注生成式Agent开启高成长篇章
- 微软重组AI领导层,任命新负责人雅各布·安德烈欧执掌Copilot
- 微软的Xbox模式将登陆Windows 11电脑
- 微软开发者大会将于6月在旧金山举行
- 微软将为Windows 11增加内置网络速度测试功能
- 微软通过月度安全更新对Windows安全启动证书进行升级
- 微软计划利用高温超导材料设计能效更高的数据中心
- 谷歌云客户业务负责人重返微软,出任安全主管
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









