您现在的位置是:首页 >综合资讯 > 2022-06-28 16:22:13 来源:

AI现在可以和你一样玩Minecraft

导读 OpenAI的专家已经训练了一个神经网络,以与人类玩家一样高标准地玩《我的世界》。AI模型接受了70,000小时的各种游戏内镜头的训练,并辅以一

OpenAI的专家已经训练了一个神经网络,以与人类玩家一样高标准地玩《我的世界》。AI模型接受了70,000小时的各种游戏内镜头的训练,并辅以一个小型视频数据库,其中执行了特定的游戏内任务,还记录了键盘和鼠标输入。

经过微调,OpenAI发现该模型能够执行各种技能,从游泳到狩猎动物和吃肉。它还掌握了“柱子跳跃”,这是玩家在半空中将一块材料放在自己下方以获得高度的动作。

也许最令人印象深刻的是,AI能够制作钻石工具(需要按顺序执行一长串动作),OpenAI将其描述为计算机代理的“史无前例”成就。

Minecraft项目的意义在于,它展示了OpenAI在AI模型训练中部署的一项新技术的功效——称为VideoPreTraining(VPT)——该公司表示,该技术可以加速“通用计算机使用代理”的开发。

从历史上看,使用原始视频作为训练AI模型的来源的困难在于,所发生的事情很容易理解,但不一定是如何理解的。实际上,人工智能模型会吸收期望的结果,但无法掌握达到这些结果所需的输入组合。

然而,使用VPT,OpenAI将从公共网络资源中提取的大型视频数据集与精心策划的带有相关键盘和鼠标移动标记的素材池配对,以建立基础模型。

为了微调基本模型,该团队随后插入了旨在教授特定任务的较小数据集。在这种特定情况下,OpenAI使用了玩家执行早期游戏动作的镜头,例如砍伐树木和建造工作台,据说这在模型能够执行这些任务的可靠性方面产生了“巨大的改进”.

另一种技术涉及“奖励”人工智能模型以完成一系列任务中的每一步,这种做法称为强化学习。这个过程使神经网络能够以人类水平的成功率收集钻石镐的所有成分。

“VPT为让代理人通过观看互联网上的大量视频来学习行动铺平了道路。与只会产生代表性先验的生成视频建模或对比方法相比,VPT提供了在更多领域直接学习大规模行为先验的令人兴奋的可能性,而不仅仅是语言,”OpenAI在博客文章中解释道(在新标签中打开).

“虽然我们只在Minecraft中进行实验,但这款游戏非常开放,并且原生人机界面(鼠标和键盘)非常通用,因此我们相信我们的结果对于其他类似领域来说是个好兆头,例如计算机使用。”

为了激励该领域的进一步实验,OpenAI与MineRLNeurIPS竞赛合作,将其承包商数据和模型代码捐赠给试图使用AI解决复杂Minecraft任务的参赛者。大奖:100,000美元。