您现在的位置是：首页 >人工智能 > 2022-07-21 16:48:42 来源：

使用人工智能训练机器人团队一起工作

导读当通信线路开放时，机器人或无人机等个体代理可以协同工作，协作完成任务。但是，如果他们没有配备正确的硬件或信号被阻塞，从而无法进行通

当通信线路开放时，机器人或无人机等个体代理可以协同工作，协作完成任务。但是，如果他们没有配备正确的硬件或信号被阻塞，从而无法进行通信怎么办?伊利诺伊大学厄巴纳-香槟分校的研究人员从这个更困难的挑战开始。他们开发了一种使用多智能体强化学习(一种人工智能)训练多个智能体协同工作的方法。

伊利诺伊州的航空工程师HuyTran说：“当代理人可以互相交谈时，会更容易。”“但我们希望以一种去中心化的方式来做到这一点，这意味着他们不会互相交谈。我们还关注代理的不同角色或工作应该是什么并不明显的情况。”

Tran说，这种情况要复杂得多，也是一个更难的问题，因为不清楚一个代理与另一个代理应该做什么。

“有趣的问题是，随着时间的推移，我们如何学会一起完成一项任务，”Tran说。

Tran和他的合作者使用机器学习来解决这个问题，方法是创建一个实用函数，该函数告诉代理什么时候做对团队有用或有益的事情。

“对于球队的进球，很难知道谁为胜利做出了贡献，”他说。“我们开发了一种机器学习技术，使我们能够识别个人代理何时为全球团队目标做出贡献。如果你从运动的角度来看，一名足球运动员可能会得分，但我们也想知道其他队友的行动“这导致了进球，就像助攻一样。很难理解这些延迟效应。”

图片来源：伊利诺伊大学航空航天工程系

研究人员开发的算法还可以识别代理或机器人何时在做对目标没有贡献的事情。“与其说机器人选择做错事，不如说是对最终目标无用的事情。”

他们使用模拟游戏来测试他们的算法，例如夺旗游戏和流行的电脑游戏星际争霸。

“星际争霸可能有点难以预测——我们很高兴看到我们的方法在这种环境下也能很好地工作。”

Tran说，这种算法适用于许多现实生活中的情况，例如监视、机器人在仓库中协同工作、交通信号控制、自动车辆协调交付或控制电网。

Tran说，SeungHyunKim在攻读机械工程的本科生时就完成了这个想法背后的大部分理论，而航空专业的学生NealeVanStralen则帮助实施了这个想法。Tran和GirishChowdhary为两名学生提供建议。这项工作最近在自治代理和多代理系统同行评审会议上提交给AI社区。

这项名为“解开多智能体强化学习中协调的后继特征”的研究发表在2022年5月举行的第21届自主智能体和多智能体系统国际会议论文集上。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇:开源平台支持隐私保护机器学习研究

下一篇:研究人员使用模糊人工智能算法来帮助记忆丧失的人

猜你喜欢

喜茶被列为被执行人

保时捷涨价绕开了中国

联想公布数字工厂产能数据

AI孙燕姿成华语乐坛新顶流

罗永浩淡出交个朋友曲线上市

苹果史上最大尺寸iPad曝光

三星OLED电视新品震撼上市

持全球先进技术与理念打造智慧品牌

海信视像3大场景黑科技首亮相

科龙空调小耳朵套系发布

ASML押宝中国市场支持7nm高端DUV光刻机可出口

微信提醒这100万保险完全免费

小米13 Ultra发布会前瞻

SpaceX将于周四重新发射

GPU新版本发布新增支持RTX4070桌面显卡

微博发布3月公益简报

最新文章

建筑中人行为模拟研究（关于建筑中人行为模拟研究介绍）

官爵系统（关于官爵系统介绍）

授张孚给事中制（关于授张孚给事中制简介）

怀远县烟草专卖局营销部徽映志愿者服务队（关于怀远县烟草专卖局营销部徽映志愿者服务队介绍）

峨眉香科（关于峨眉香科简介）

仙剑1剧情（仙剑1剧情简介）

各不相犯是什么意思（各不相犯解释）

建筑丝杠（关于建筑丝杠介绍）

授张光奇光禄少卿制（关于授张光奇光禄少卿制简介）

怀远县渔业科技发展有限责任公司（关于怀远县渔业科技发展有限责任公司介绍）

官爵等级（关于官爵等级介绍）

官爵相称（关于官爵相称介绍）

建筑业重点推广新技术应用手册（关于建筑业重点推广新技术应用手册介绍）

怀远县淝南乡中心小学（关于怀远县淝南乡中心小学介绍）

授康季荣徐州节度使郑涓昭义节度使制（关于授康季荣徐州节度使郑涓昭义节度使制简介）

峨眉酥肉豆腐脑（关于峨眉酥肉豆腐脑简介）

点击排行

热门推荐

随机推荐