中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共2条，第1-2条

帮助

已选(0)清除条数/页：排序方式：
	采用分类经验回放的深度确定性策略梯度方法期刊论文自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823 作者: 时圣苗; 刘全 Adobe PDF(19798Kb) \| 收藏 \| 浏览/下载：4/1 \| 提交时间：2024/05/20 连续控制任务深度确定性策略梯度经验回放分类经验回放
	面向Ad-Hoc协作的局部观测重建方法期刊论文中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb) \| 收藏 \| 浏览/下载：242/48 \| 提交时间：2022/06/16 多智能体深度强化学习信用分配 Ad-Hoc协作

中国科学院自动化研究所机构知识库