基于多智能体深度强化学习的空间众包任务分配

TP391; 针对现有空间众包中的任务分配大多只考虑单边、短期利益和单一场景的问题,提出一种基于多智能体深度强化学习的空间众包任务分配算法.首先定义一种新的空间众包场景,其中工人可以自由选择是否与他人合作;然后设计基于注意力机制和A2C(advantage actor-critic)方法的多智能体深度强化学习模型进行新场景下的任务分配;最后进行仿真实验,并将该算法与其他最新的任务分配算法进行性能对比.仿真实验结果表明,该算法能同时实现最高的任务完成率和工人收益率,证明了该算法的有效性和鲁棒性....

Full description

Saved in:
Bibliographic Details
Published in吉林大学学报(理学版) Vol. 60; no. 2; pp. 321 - 331
Main Authors 赵鹏程, 高尚, 于洪梅
Format Journal Article
LanguageChinese
Published 吉林大学 计算机科学与技术学院,长春 130012 2022
Subjects
Online AccessGet full text
ISSN1671-5489
DOI10.13413/j.cnki.jdxblxb.2020437

Cover

More Information
Summary:TP391; 针对现有空间众包中的任务分配大多只考虑单边、短期利益和单一场景的问题,提出一种基于多智能体深度强化学习的空间众包任务分配算法.首先定义一种新的空间众包场景,其中工人可以自由选择是否与他人合作;然后设计基于注意力机制和A2C(advantage actor-critic)方法的多智能体深度强化学习模型进行新场景下的任务分配;最后进行仿真实验,并将该算法与其他最新的任务分配算法进行性能对比.仿真实验结果表明,该算法能同时实现最高的任务完成率和工人收益率,证明了该算法的有效性和鲁棒性.
ISSN:1671-5489
DOI:10.13413/j.cnki.jdxblxb.2020437