带有神经网络的生成生态学

图片



几年前,我的阅读列表上有一篇名为GAN Progress and Evolution的文章,旨在提高质量,稳定性和增加变异性它描述了生成对抗网络的逐渐发展,该网络从低分辨率图像开始,并随着学习的进行而增加了粒度。由于作者使用他们的想法来创建逼真的,独特的人脸图像,因此许多出版物都致力于这一主题。



图片


GAN生成的样本图像



从这些图像来看,似乎其他神经网络将需要研究许多示例才能创建GAN产生的内容。实际上,有些因素似乎相对简单且有充分根据-例如,两只眼睛的颜色必须匹配。但是其他方面非常复杂,很难表达。因此,例如,需要什么细节才能将眼睛,嘴巴和皮肤绑在一起,形成一个完整的面部图像?当然,我是作为一个人谈论统计机器,我们的直觉会欺骗我们-可能结果是工作变化相对较少,解决方案空间比我们想象的要有限。可能最有趣的不是图像本身,而是图像对我们的可怕影响。



一段时间后,我最喜欢的播客提到了PhyloPic,这是动物,植物和其他生命形式的轮廓图像的数据库。反思这些思路,我想知道-如果您在一组非常相似的数据上训练像“渐进式GAN”一文中所述的系统,将会发生什么?我们将最终获得几种已知类型动物的多种变种,还是会有许多变体引起由神经网络驱动的推测性动物学不管结果如何,我都可以从中获得一些好的图纸作为学习墙,因此我决定通过实验来满足我的好奇心。





我改编了Progressive GAN文章中代码,并使用Google Cloud(8个NVIDA K80 GPU)和整个PhyloPic数据集的功能通过12,000次迭代对模型进行了训练。总培训时间为4天,其中包括一些错误和实验。我使用经过训练的最终模型来创建5万张单独的图像,然后花了几个小时查看结果,对图像进行分类,过滤和匹配。我还微调了一些图像,旋转它们,使所有生物都朝向同一方向(以达到视觉满意度)。这种动手方法意味着您在下面看到的是我与神经网络之间的一种协作-这是创造性的工作,我对此进行了自己的编辑。



图片







让我惊讶的第一件事是美学效果令人愉悦。当然,这在很大程度上反映了创作原始图像的艺术家的良好品味。但是,也有令人惊喜的惊喜。例如,似乎每当神经网络进入不确定性区域时-无论是尚未掌握的小片段,还是模糊的生物幻想的飞跃-图像中都会出现色差。这很好奇,因为输入集完全是黑白的,这意味着颜色不能解决训练模型时采用的任何生成问题。任何颜色都是机器头脑的纯人工产物。出人意料的是,不断引起色差的因素之一是昆虫的翅膀。这导致事实该模型会生成数百种鲜艳的“蝴蝶”变体,就像上面显示的那样。我想知道这是否可能是有用的观察方法-如果仅使用灰度图像训练模型并且仍然需要输出全彩色图像,则彩色斑点可能是显示模型无法准确显示训练集的区域的有用方法。



输出的大部分是各种完全可识别的轮廓-鸟类,各种四足动物,许多小型优美的食肉恐龙,蜥蜴腿,鱼类,甲虫,蛛网膜和类人动物。



图片



鸟类



图片



四足动物



图片



恐龙



图片



双鱼座



图片



甲虫



图片



人类



奇怪的事情





一旦我们知道的生物消失了,我们就会面临陌生的事物。我想到的一个问题是:是否会存在自然界中不存在的合理的动物身体计划(输入数据集中可能包括生物的杂种)?通过仔细的搜索和一点点pareidolia,我发现了数百只四足鸟,蛇头鹿和其他奇妙的怪物。



图片



怪物



变得更加晦涩难懂,该模型产生了奇怪的抽象图案和无法识别的实体,从而产生了某种“活泼”的感觉。无法识别的



图片



抽象生物



图片







随机抽样



在上面的图像中看不到的是结果的大量变化。我已经打印并构图了其中的几组图像,并且成百上千的小而细致的图像并排放大所产生的效果是非常惊人的。为了对整个数据集的规模有所了解,我在下面提供了一个打印示例-这是未经过滤的图像语料库中的随机样本。



图片



图片



通过完成SkillFactory付费在线课程,了解如何从头开始或成为技能和薪资水平升级的热门职业的详细信息:











All Articles