CASIA OpenIR

浏览/检索结果: 共4条,第1-4条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Keep Various Trajectories: Promoting Exploration of Ensemble Policies in Continuous Control 会议论文
Advances in Neural Information Processing Systems, New Orleans, USA, 2023-12-10
作者:  Chao Li;  Chen Gong;  Qiang He;  Xinwen Hou
Adobe PDF(1457Kb)  |  收藏  |  浏览/下载:8/2  |  提交时间:2024/05/30
连续控制任务中集成策略的多样性探索研究 学位论文
, 2024
作者:  李超
Adobe PDF(7255Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/05/28
强化学习  集成学习  价值估计  多样性探索  
信息不完备条件下的复杂决策问题高效强化学习算法研究 学位论文
, 2023
作者:  赵恩民
Adobe PDF(25370Kb)  |  收藏  |  浏览/下载:203/11  |  提交时间:2023/06/08
信息不完备  复杂决策问题  强化学习  单智能体探索  不完美信息博弈  
面向兵棋推演的多智能体智能博弈决策算法研究 学位论文
, 2023
作者:  余照科
Adobe PDF(15273Kb)  |  收藏  |  浏览/下载:749/34  |  提交时间:2023/01/31
请输入关兵棋,智能决策,多智能体,深度强化学习,分布式训练键词