首页 >> 生活 >

DeepMind可以在不知道规则的情况下掌握游戏

2020-12-25 09:13:40 来源：用户：

人工智能的圣杯一直是使计算机学习人类的方式。但是，当今最强大的AI仍然依赖于某些已知规则，例如下棋或围棋的规则。然而，人类的学习在推理上常常是混乱的，随着我们的前进学习生活规则。长期以来，DeepMind一直在尝试使用游戏作为其环境和测试套件来创建此类AI。谷歌专注于人工智能研究的姊妹公司刚刚在MuZero上展示了其最新成果，MuZero是一款无需事先学习规则即可掌握游戏的AI。

DeepMind以前的AlphaGo等AI已在媒体上广泛报道，以在各自的游戏中击败人类冠军。尽管令人印象深刻，但距离最终目标还有几步之遥。特别是，AlphaGo的优势是不仅了解Go的规则，而且了解人类玩家的领域知识和数据。它的继任者AlphaGo Zero和AlphaZero仍然可以依靠规则书来学习。

虽然这些AI在具有复杂策略但视觉效果简单的游戏中表现出色，但当应用于规则不易推断的视觉复杂的游戏时，它们就会失败。那就是新的MuZero AI出现的地方，它使用了一系列的Atari游戏，例如Pac-Man女士来测试其理论。

大多数AI研究人员使用两种策略来解决学习问题，其中一种是依靠获得游戏规则或知识来进行超前搜索。基于模型的计划通过创建准确的环境模型来学习，但是代价是过于复杂。MuZero的优势在于，它仅对重要的环境部分进行建模，例如知道伞将帮助您在雨中保持干燥，而不是对所有雨滴的运动进行建模。

即使只有很少的步骤需要预先计划，MuZero能够熟练掌握游戏的效率和速度也给DeepMind留下了深刻的印象。它希望这种新的AI学习方法将被用于杂乱的现实环境中，在这些环境中不能以明确的方式制定规则。

标签： DeepMind 游戏

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！