您现在的位置是:首页 >生活 > 2021-04-09 19:19:20 来源:

一名研究人员训练人工智能生成非洲面具

导读 人工智能(AI)可以产生令人毛骨悚然的逼真面孔,但部落艺术品呢?这就是人类计算机互动研究员兼卡内基梅隆大学毕业生维克多·迪比亚(Victor

人工智能(AI)可以产生令人毛骨悚然的逼真面孔,但部落艺术品呢?这就是人类计算机互动研究员兼卡内基梅隆大学毕业生维克多·迪比亚(Victor Dibia)试图用非洲面具数据集培训的人工智能系统回答的问题。

正如Dibia在一篇博客文章中所解释的那样,这项 工作的灵感来自于去年9月在南非斯泰伦博斯大学举办的2018年深度学习Indaba之旅。与会者可以使用第二代Tensor Processing Units(TPU) - 谷歌设计的芯片专门用于快速培训或推断AI模型--Dibia用于培训。

一名研究人员训练人工智能生成非洲面具

他利用谷歌的TensorFlow机器学习框架来获得一个生成性对抗网络(GAN) - 一个由两部分组成的神经网络,由 生成样本和鉴别器的生成器组成, 这些生成样本和 鉴别器试图区分生成的样本和真实样本 - 在热塑性聚氨酯。具体来说,他选择了一个深度卷积GAN或DCGAN。

GAN具有图像生成和处理的诀窍。例如,Alphabet子公司DeepMind的数据科学家最近要求GAN生成令人信服的汉堡,狗和蝴蝶照片 ,爱丁堡大学感知研究所和天文学研究所的研究人员使用GAN创建完整的人造星系图像。星团,星云和其他星际特征。

并不是他们和其他人工智能架构第一次被用来创作艺术品。他们创作了令人难忘的(如果不是完全连贯的) 假日曲调 和书面 歌词 ; 制作人性化的画作 ; 并列举了烟花的名称,仅举几例。

为了“教导”DCGAN如何创建新的面具设计,Dibia采购了一套手动策划的图像 - 总共9,300个 - 描绘了非洲面具。在训练之前,他将每个图像调整大小并裁剪,然后再将它们转换为TFRecords,这是一种存储二进制记录序列的格式。

对两个版本的DCGAN模型进行了训练,分别生成64×64像素和128×128像素的图像。

在随后的实验中,与第二个系统相比,生成64×64像素图片的模型提供了“更好的多样性”,而128×128像素的图像具有更高的质量。但是后者遭遇了模式崩溃 - 一个失败的情况,即GAN的发电机开始生产品种极少的样品。(Dibia将其归结为数据集“不足以训练这么大的模型。”)

两个AI模型中更成功的是设法提出了具有侧向方向,头发或“毛发状突起”或长方形特征的新型面具。

“我们的目标不是生成一个完美逼真的面具......而是更多地观察由此产生的GAN中编码的任何创意或艺术元素,”Dibia写道。

“在这种情况下,虽然一些生成的图像不是完整的面具,但它们擅长捕捉非洲艺术的 纹理或 感觉,”Dibia写道。“例如,我展示了一位同事,他们提到生成的图像具有'部落感觉'。”

他留待未来的工作扩展非洲面具数据集,使用条件化GAN进行实验,以及其他机器学习架构,以实现逼真和更高分辨率的图像生成。