微软“AI画家”登场!但画功有点烂
2018-08-21 14:40:06AI云资讯773
微软深度学习技术中心的研究人员研发了一种AI,它可根据你输入的信息自动生成图片,不过,VICE杂志作者Sarah Emerson在尝试过相关DEMO后,发现这款AI的作品实在不咋地。我喜欢那些把事情做得很糟糕的技术。比如从楼上摔下来的机器人、编写疯狂卡拉ok歌曲的算法。他们始终是那么“努力”地工作。所以,一个名为AttnGAN的AI让我非常开心。这是一种运用生成性对抗网络(GAN)的机器学习算法,它被训练成基于文本输入生成图像,由微软深度学习技术中心的研究人员于今年1月发布。同时,他们的论文也发表在arXiv.org上。理论上,AttnGAN可以基于文本内容生成图片,但它目前表现的并不好,有时甚至会生成十分糟糕的图片。公正地说,当研究人员在特定的数据集(比如鸟类图像)上训练人工智能时,它能够生成令人信服的鸟类效果图。但是,当在一个更大的、包含更多不同图像的数据集中进行训练时,AttnGAN在艺术上的造诣就显得捉襟见肘了。

(AttnGAN针对特定鸟类数据集生成的图像)
AttnGAN可以针对简单的文字内容生成相应图片,比如“一只猫”。但研究人员指出,“文字描述比较复杂的鸟类,比如‘冠绿色、翅膀黄色和腹部红色的鸟’,它便无法识别。”


(纽约大学Cristobal Valenzuela基于AttnGAN制作的网页demo)
纽约大学的技术专家和研究员Cristobal Valenzuela基于AttnGAN制作了一份demo,让读者也可尝试这款AI的效果。AttnGAN是一款更大的项目——Runway(一个AI工具包,可为设计和创意平台添加人工智能功能)中的一部分,它可以创作更具创造性的内容。Valenzuela同时还在marrowa——一个交互式网站中工作,研究AI是如何像大脑一样处理信息的。 Valenzuela在Twitter上告诉我:“我之所以研究这项技术,是因为我相信人工智能有一种我们未知的创造性潜力。” Valenzuela说:“虽然有些生成出来的图片十分奇怪(比如你输入任何和人类相关的文字时),但有些人在往里输入了诗歌、歌词、语录之后,还是得到了不少激发灵感或富有诗意的图片。”除了作为一种有趣的游戏,Valenzuela相信人工智能也是一种实用的工具。比如,它可以应用在CG、数码动画的合成中,甚至能基于人们的意愿自动生成动画角色。”
相关文章
- 微软通过月度安全更新对Windows安全启动证书进行升级
- 微软计划利用高温超导材料设计能效更高的数据中心
- 谷歌云客户业务负责人重返微软,出任安全主管
- 微软下一代Xbox游戏主机将搭载AMD开发的半定制系统级芯片,预计2027年发布
- 微软宣布将构建人工智能内容许可合作应用商店
- 微软为Windows 11系统测试顶部菜单栏
- 微软正式发布第二代自研AI芯片Maia 200
- 微软2026年的首个Windows 11更新可谓漏洞百出
- 微软2026年首个Windows 11更新导致部分电脑无法关机
- 传音荣获 CES 2026 微软 AI 创新奖,以实用型 AI 深化新兴市场智能体验
- 社区居民激烈抵制,微软新人工智能数据中心建设受到困扰
- 汉朔科技与微软在既有战略合作基础上深化协作:共筑数字孪生门店新基座,构建零售未来竞争力
- 传音荣获CES 2026 微软 AI 创新奖,以实用型 AI 深化新兴市场智能体验
- 微软将直接在Copilot中嵌入购买按钮,用户能够通过AI聊天对话直接完成购物
- AI办公硬件新标杆:未来智能携viaim亮相CES 2026,斩获微软人工智能创新奖
- 微软CEO萨提亚·纳德拉发表博文探讨人工智能信息垃圾问题
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









