你也能用英伟达GAN造脸了:官方实现有了,高清数据集也开源了
2019-02-07 06:59:03AI云资讯1575

你大概还没忘记,英伟达去年年底推出的GAN,它合成的人脸甚至骗得过肉眼。
如今,它终于有了自己的名字,叫StyleGAN。顾名思义,GAN的生成器,是借用风格迁移的思路重新发明的。
更重要的是,你现在也能自己养一只这样的GAN了:
官方实现的代码开源了,提供了许多预训练好的模型,自然也支持自己训练模型。

另外,Flicker人像照片的高清数据集 (FFHQ) 也开源了,包含70,000张高清人脸。
官方实现
首先,送上来自英伟达的友情提示:
这个实现可以用Linux跑,也可以用Windows跑,但墙裂推荐大家用Linux跑,为性能和兼容性着想。
除此之外,必需品还有Python 3.6,和TensorFlow 1.10以上 (支持GPU) 。
预训练模型
这里,用pretrained_example.py举个简易的栗子。执行的时候,脚本会从Google Drive下载一个预训练的StyleGAN生成器,然后用它来生成图像:
预训练的生成器有三种食用方法:
一是Gs.run()快速模式,这里的输入和输出都是numpy阵列:
二是用Gs.get_output_for()把生成器整合到一个更大的TensorFlow表达式里面:
三是查找Gs.components.mapping和Gs.components.synthesis,访问生成器的各个子网络。与Gs相似,这鞋子网络也表示为dnnlib.tflib.Network的独立示例。
自己训练模型
如果不满足于预训练的模型,想自己训练模型,就要先:
准备好数据集
把数据集储存为多重分辨率的TFRecords,训练和评估脚本都是在这上面跑:
数据集表示为一个目录,里面的每张图像都有多种不同的分辨率,用于高效的streaming。每个分辨率都有一个自己的*.tfrecords文件。数据有标注的话,也是用一个分开的文件来储存的。

训练吧
官方提供的训练过程分四步:
1.编辑train.py,通过取消注释或者修改某些行,来指定数据集和训练配置;
2.用train.py来运行训练脚本;
3.结果会写在一个新目录里,叫results/-;
4.训练直至完成,几天时间可能是要的。
(最好有一台英伟达高端GPU,至少11GB的DRAM,再开始训练。有很多台的话,当然更好。)
至于训练好的模型该怎样评估,大家可以去项目页自行观察。
高清无码数据集
和官方代码实现一起发布的,就是Flickr高清人脸数据集了。
那些几可乱真的人脸,就是StyleGAN吃了这个数据集,才生成的。

数据集里包含7万张1024 x 1024高清人像。英伟达说,这些照片在年龄、种族、以及图片背景上,都有很强的多样性。
并且,眼镜、墨镜、帽子这些元素,也是应有尽有。
团队说,图像是直接从Flickr上面扒下来,自动对齐自动裁剪而成。并且,数据集里收录的图片都有使用许可,无须担心。
还不去试试
有大胆想法的同学们,可以去试试了。毕竟,不是只有生成人脸这一种功能,猫片,汽车,房间……

你还想生成一些什么?
相关文章
- 英伟达Rubin芯片落地谷歌A5X实例,多站点集群规模扩展至近百万颗GPU
- Meta携手博通强化芯片合作,英伟达/微美全息AI千亿赛道“抢滩战”打响!
- 从相干光量子计算机到开源AI模型,玻色量子与英伟达向百年伊辛模型的共同致敬
- 英伟达AI智能工厂宏图再掀热潮!特斯拉/微美全息自研芯片加固AI云计算护城河!
- 英伟达的真正实力在于基础设施,但投资融合的掌控力也不容忽视
- 美光为英伟达Vera Rubin平台量产36GB HBM4、28Gbps PCIe Gen6固态硬盘及192GB SOCAMM2内存
- 英伟达发布新一代超分辨率技术DLSS 5:神经渲染加持,颠覆性视觉提升
- 英伟达:将与比亚迪、吉利进行自动驾驶出租车业务合作
- 英特尔在英伟达GTC大会的完美时机亮相:智能体AI将CPU变为新瓶颈
- 英伟达CEO黄仁勋庆祝GeForce 3问世25周年:没有GeForce,就没有AI
- 英伟达发布Nemotron 3 Super开源智能体AI模型:或成为OpenClaw的理想选择
- 英伟达CEO黄仁勋将AI比作一个五层蛋糕,称其潜力尚未被完全发掘
- Teclab绕过英伟达RTX 50显存时钟限制,将RTX 5070 Ti超频至超过36Gbps
- 全力奔赴AI推理时代,英伟达/微美全息大举进军开启空前爆发盛宴!
- 英伟达将推出新款GeForce RTX 5050显卡,搭载9GB GDDR7显存
- 英伟达将向两家光子技术公司注资40亿美元,抢占AI竞争制高点
人工智能企业
更多>>人工智能硬件
更多>>- 一飞智控携全空间解决方案及三款新品,亮相2026世界无人机大会
- 续航超强的微星全新尊爵系列,重塑轻薄本的超凡全能体验
- BOE(京东方)全球首发原生千帧FHD 护眼电竞显示器 真千帧硬实力引领电竞高刷新时代
- Neousys宸曜发布星宸系列强固嵌入式工控机,赋能工业智能升级
- BOE(京东方)OLED技术赋能联想YOGA Air 14 Ultra 定义超轻薄AI PC新标杆
- iQOO 15T正式发布:天玑9500 Monster版加持 全能体验无短板
- 从“+AI”到“AI+”:天禧AI 4.0加持,联想AI主机领衔L3级终端震撼登场
- 拾年匠音,声来不凡,致敬1000X系列十周年 索尼发布1000X十周年典藏版头戴降噪耳机
人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









