作为我的论文《基于分辨率的gan插值用于域间的可控图像合成》的一部分,我使用浮世绘人脸图像的数据集来训练stylegan模型,本文包含该数据集的链接和该数据集的详细信息。
更新
v2 - 删除了28张质量不好的图像(对准不良或没有正面)。
v1 - 最初发行的版本,被使用在与分辨率相关的gan插值的论文中,用于域之间的可控图像合成。
数据集 浮世绘人脸数据集包含来自浮世绘照片的5209张脸部图像。图像像素为1024x1024、jpeg格式,并已根据ffhq数据集所使用的过程进行对齐。上面是数据集中(几乎)所有图像的地图,对图像进行了绘制,以使相似的面孔看起来靠近在一起[2]。为了便于显示, 图像已缩小为256x256。 细节 图片是从数个博物馆网站上下載来的,然后我使用amazon rekognition尝试从每个图片中检测面部和面部标志。rekognition在这两个任务上都做得很合理,但是显然并不完美,很多面部都被遗漏了,并且许多图像中都存在对齐错误。同时,许多图像的分辨率並不是很高,因此为了生成1024x1024分辨率的可用数据集,我使用了在manga109数据集上训练的预训练的esrgan [3]模型来按需放大图像,尽管这些图像会留下一些瑕疵,但大体上的结果还是不错的。 其他数据集
kaokore是浮世绘人脸的另一个数据集[4],它具有更多的多样性和标签,但是图像分辨率较低且人脸未对齐。 许可和使用 此数据集是根据``知识共享署名-相同方式共享4.0国际许可证''提供的。 如果使用数据集,请引用为“aligned ukiyo-e faces dataset, justin pinkney 2020”或一个bibtex条目:
1. pinkney, justin n. m., and doron adler. ‘resolution dependent gan interpolation for controllable image synthesis between domains’. arxiv:2010.05334[cs, eess], 20 october 2020.http://arxiv.org/abs/2010.05334. 2. 为了生成此图像,我首先使用在imagenet上预训练的resnet50从每个图像中提取cnn的特征。然后使用umap将这些高维特征向量投影到二维,最后使用lapjv算法完成网格划分。 3. wang, xintao, ke yu, shixiang wu, jinjin gu, yihao liu, chao dong, chen change loy, yu qiao, and xiaoou tang. ‘esrgan: enhanced super-resolution generative adversarial networks’. arxiv:1809.00219[cs], 1 september 2018.http://arxiv.org/abs/1809.00219. 4. tian, yingtao, chikahiko suzuki, tarin clanuwat, mikel bober-irizar, alex lamb, and asanobu kitamoto. ‘kaokore: a pre-modern japanese art facial expression dataset’. arxiv:2002.08595[cs, stat], 20 february 2020.http://arxiv.org/abs/2002.08595.
11种三相异步电动机常见故障与对应的维修方法(2/2)
石墨烯产业正在迎来“开花结果”之日
变频器开环控制和闭环控制系统
小米5c:完全颠覆前代设计/纤薄有质感
推进AI芯片生态建设丨上海皇华受邀出席XceedCon 2023,与昆仑芯签订战略合作!
使用浮世绘人脸图像的数据集来训练StyleGAN模型
阿牛巴流量计
基于dSPACE单板系统DS1104试验平台实现双绕组感应发电机系统的设计
有容微时钟芯片的技术特点及应用场景的介绍
四种SOC修正算法介绍
升压型DC-DC开关转换器ADP1614的主要特性及应用电路
TI Q1财报:消费电子和数据中心降30%;汽车增长大约5%;工业芯片持平
关于在差异化市场中找准最佳发展方向的介绍和分析
基于3568的消防图显方案
随着客厅格局改变随意挪动 索尼家庭影院颠覆传统
UBS:2030年自动驾驶出租车市场价值或达2万亿美元
稳压二极管的原理以及稳压管的选型技巧
使用VIvado封装自定IP并使用IP创建工程
工业智能网关助力打造智慧水务数据看板
第十六届电路保护与电磁兼容技术研讨会11月上海开幕