中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

（本次检索基于用户作品认领结果）

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	Advantage Constrained Proximal Policy Optimization in Multi-Agent Reinforcement Learning 会议论文 , 昆士兰, 2023-6 作者: Li WF(李伟凡); Zhu YH(朱圆恒); Zhao DB(赵冬斌) Adobe PDF(4104Kb) \| 收藏 \| 浏览/下载：256/81 \| 提交时间：2023/06/29 multi-agent reinforcement learning policy gradient
	基于深度强化学习的连续动作空中博弈对抗决策学位论文 , 2023 作者: 李伟凡 Adobe PDF(43167Kb) \| 收藏 \| 浏览/下载：499/19 \| 提交时间：2023/06/26 强化学习深度强化学习自注意力网络智能决策多智能体系统

中国科学院自动化研究所机构知识库