中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共4条，第1-4条

帮助

已选(0)清除条数/页：排序方式：
	采用分类经验回放的深度确定性策略梯度方法期刊论文自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823 作者: 时圣苗; 刘全 Adobe PDF(19798Kb) \| 收藏 \| 浏览/下载：7/3 \| 提交时间：2024/05/20 连续控制任务深度确定性策略梯度经验回放分类经验回放
	平行交通系统中的预测与控制关键技术研究学位论文工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 戴星原 Adobe PDF(14868Kb) \| 收藏 \| 浏览/下载：310/12 \| 提交时间：2022/10/09 平行交通系统交通预测交通控制深度学习强化学习
	面向Ad-Hoc协作的局部观测重建方法期刊论文中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb) \| 收藏 \| 浏览/下载：258/52 \| 提交时间：2022/06/16 多智能体深度强化学习信用分配 Ad-Hoc协作
	对抗场景中的智能体策略泛化研究学位论文工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 陈皓 Adobe PDF(13782Kb) \| 收藏 \| 浏览/下载：336/14 \| 提交时间：2022/06/16 深度强化学习多智能体策略泛化 Ad-Hoc 协作信用分配

中国科学院自动化研究所机构知识库