基于多智能体深度强化学习的空间众包任务分配
TP391; 针对现有空间众包中的任务分配大多只考虑单边、短期利益和单一场景的问题,提出一种基于多智能体深度强化学习的空间众包任务分配算法.首先定义一种新的空间众包场景,其中工人可以自由选择是否与他人合作;然后设计基于注意力机制和A2C(advantage actor-critic)方法的多智能体深度强化学习模型进行新场景下的任务分配;最后进行仿真实验,并将该算法与其他最新的任务分配算法进行性能对比.仿真实验结果表明,该算法能同时实现最高的任务完成率和工人收益率,证明了该算法的有效性和鲁棒性....
Saved in:
| Published in | 吉林大学学报(理学版) Vol. 60; no. 2; pp. 321 - 331 |
|---|---|
| Main Authors | , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
吉林大学 计算机科学与技术学院,长春 130012
2022
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1671-5489 |
| DOI | 10.13413/j.cnki.jdxblxb.2020437 |
Cover
| Summary: | TP391; 针对现有空间众包中的任务分配大多只考虑单边、短期利益和单一场景的问题,提出一种基于多智能体深度强化学习的空间众包任务分配算法.首先定义一种新的空间众包场景,其中工人可以自由选择是否与他人合作;然后设计基于注意力机制和A2C(advantage actor-critic)方法的多智能体深度强化学习模型进行新场景下的任务分配;最后进行仿真实验,并将该算法与其他最新的任务分配算法进行性能对比.仿真实验结果表明,该算法能同时实现最高的任务完成率和工人收益率,证明了该算法的有效性和鲁棒性. |
|---|---|
| ISSN: | 1671-5489 |
| DOI: | 10.13413/j.cnki.jdxblxb.2020437 |