中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共3条，第1-3条

帮助

已选(0)清除条数/页：排序方式：
	Empirical Policy Optimization for n-Player Markov Games 期刊论文 IEEE Transactions on Cybernetics, 2022, 页码: doi={10.1109/TCYB.2022.3179775} 作者: Yuanheng Zhu; Weifan Li; Mengchen Zhao; Jianye Hao; Dongbin Zhao Adobe PDF(1739Kb) \| 收藏 \| 浏览/下载：111/44 \| 提交时间：2023/04/26
	基于自适应动态规划的分布式迭代控制方法研究学位论文工学博士, 人工智能学院: 中国科学院大学, 2022 作者: 李洪阳 Adobe PDF(3786Kb) \| 收藏 \| 浏览/下载：317/26 \| 提交时间：2022/06/14 自适应动态规划，最优控制，分布式控制，智能控制，强化学习
	SADRL: Merging human experience with machine intelligence via supervised assisted deep reinforcement learning 期刊论文 NEUROCOMPUTING, 2022, 卷号: 467, 页码: 300-309 作者: Li, Xiaoshuang; Wang, Xiao; Zheng, Xinhu; Jin, Junchen; Huang, Yanhao; Zhang, Jun Jason; Wang, Fei-Yue Adobe PDF(1244Kb) \| 收藏 \| 浏览/下载：341/76 \| 提交时间：2021/12/28 Deep reinforcement learning Behavioral cloning Dynamic demonstration Double DQN

中国科学院自动化研究所机构知识库