您现在的位置是:首页 >要闻 > 2021-01-07 08:26:09 来源:

OpenAIGPT3的新模块可从文本创建唯一图像

导读 旧金山人工智能开发公司OpenAI的一组研究人员已为其GPT-3自回归语言模型添加了新模块。该模块称为DALL·E,该模块摘录具有多个特征的文本,

旧金山人工智能开发公司OpenAI的一组研究人员已为其GPT-3自回归语言模型添加了新模块。该模块称为DALL·E,该模块摘录具有多个特征的文本,对其进行分析,然后根据其所描述的内容绘制图片。OpenAI团队在描述新模块的网页上将其描述为“一个仅用于解码器的简单转换器”,并注意到他们计划提供更多有关其体系结构的详细信息以及如何在自己了解更多信息的情况下使用它。

该公司开发了GPT-3,以演示神经网络可以将文本处理和创建应用到多远。它分析用户选择的文本并基于该输入生成新文本。例如,如果用户键入“告诉我一个关于狗救火中孩子的故事”,则GPT-3可以以类似人的方式创建这样的故事。第二次相同的输入将导致故事的另一个版本的产生。

在这项新工作中,研究人员将这种功能扩展到了图形。用户输入句子,DALL·E尝试生成使用图形和其他图像描述的内容。例如,如果用户输入“带猫爪和鸟尾巴的狗”,则系统将生成具有此类特征的狗的卡通形象,而不仅仅是一个。它将产生一整行,每行都使用与原始文本稍有不同的解释来创建。

该系统能够通过使用由互联网页面组成的信息集来创建图像。对文本的每个部分都进行了研究,以试图了解其外观。对于前面的示例,它将搜索并分析数千张狗的图片。然后研究猫,猫的爪子,鸟和尾巴。然后,它将结果合并为几个图形图像,以为用户提供各种结果。