你也能用英伟达GAN造脸了:官方实现有了,高清数据集也开源了
2019-02-07 06:59:03爱云资讯
你大概还没忘记,英伟达去年年底推出的GAN,它合成的人脸甚至骗得过肉眼。
如今,它终于有了自己的名字,叫StyleGAN。顾名思义,GAN的生成器,是借用风格迁移的思路重新发明的。
更重要的是,你现在也能自己养一只这样的GAN了:
官方实现的代码开源了,提供了许多预训练好的模型,自然也支持自己训练模型。
另外,Flicker人像照片的高清数据集 (FFHQ) 也开源了,包含70,000张高清人脸。
官方实现
首先,送上来自英伟达的友情提示:
这个实现可以用Linux跑,也可以用Windows跑,但墙裂推荐大家用Linux跑,为性能和兼容性着想。
除此之外,必需品还有Python 3.6,和TensorFlow 1.10以上 (支持GPU) 。
预训练模型
这里,用pretrained_example.py举个简易的栗子。执行的时候,脚本会从Google Drive下载一个预训练的StyleGAN生成器,然后用它来生成图像:
预训练的生成器有三种食用方法:
一是Gs.run()快速模式,这里的输入和输出都是numpy阵列:
二是用Gs.get_output_for()把生成器整合到一个更大的TensorFlow表达式里面:
三是查找Gs.components.mapping和Gs.components.synthesis,访问生成器的各个子网络。与Gs相似,这鞋子网络也表示为dnnlib.tflib.Network的独立示例。
自己训练模型
如果不满足于预训练的模型,想自己训练模型,就要先:
准备好数据集
把数据集储存为多重分辨率的TFRecords,训练和评估脚本都是在这上面跑:
数据集表示为一个目录,里面的每张图像都有多种不同的分辨率,用于高效的streaming。每个分辨率都有一个自己的*.tfrecords文件。数据有标注的话,也是用一个分开的文件来储存的。
训练吧
官方提供的训练过程分四步:
1.编辑train.py,通过取消注释或者修改某些行,来指定数据集和训练配置;
2.用train.py来运行训练脚本;
3.结果会写在一个新目录里,叫results/-;
4.训练直至完成,几天时间可能是要的。
(最好有一台英伟达高端GPU,至少11GB的DRAM,再开始训练。有很多台的话,当然更好。)
至于训练好的模型该怎样评估,大家可以去项目页自行观察。
高清无码数据集
和官方代码实现一起发布的,就是Flickr高清人脸数据集了。
那些几可乱真的人脸,就是StyleGAN吃了这个数据集,才生成的。
数据集里包含7万张1024 x 1024高清人像。英伟达说,这些照片在年龄、种族、以及图片背景上,都有很强的多样性。
并且,眼镜、墨镜、帽子这些元素,也是应有尽有。
团队说,图像是直接从Flickr上面扒下来,自动对齐自动裁剪而成。并且,数据集里收录的图片都有使用许可,无须担心。
还不去试试
有大胆想法的同学们,可以去试试了。毕竟,不是只有生成人脸这一种功能,猫片,汽车,房间……
你还想生成一些什么?
- 携手英伟达,联想能否在AI巨浪中乘风破浪?
- 完美世界游戏携手英伟达 持续探索AI在游戏场景中的应用
- 工业富联出席英伟达2024 GTC AI大会,新一代AI服务器精彩亮相
- 首创技术:维谛Vertiv作为英伟达NVIDIA独家制冷合作伙伴,引领AI应用快速发展
- 从算力到AI,ChinaJoy操盘手走上了英伟达的路
- CES开幕加热AI PC赛道 英特尔英伟达万兴科技等硬软件厂商纷纷秀肌肉
- 英伟达将全面拓展AI产品线 工业富联等核心供应商受关注
- 英伟达发布全球最强AI芯片H200,微美全息部署AI生态基建加速算力雪球滚动
- 生成式AI展现巨大发展潜力,英伟达/苹果/微美全息夯实底座助力商业化落地
- 多模态大模型发展及高频因子计算加速GPU算力 | 英伟达显卡被限,华为如何力挽狂澜?
- 从AI制造到制造AI 深度解析工业富联和英伟达合作
- 宏碁携手英伟达走进广州美术学院,RTX革新创作流!
- 搜索+AI!百度、英伟达联合举办搜索创新大赛
- 瑞承:黄仁勋讲述英伟达3次转折,学会成功的四种品质
- 黄仁勋盛赞英特尔下一代制造工艺,有望委托代工英伟达 AI 芯片
- 重磅合作!联发科与英伟达携手打造全方位AI智能座舱功能