CASIA OpenIR

浏览/检索结果: 共15条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Intrinsic Reward with Peer Incentives for Cooperative Multi-Agent Reinforcement Learning 会议论文
, Online, 18-23 July 2022
作者:  Zhang TL(张天乐);  Liu Z(刘振);  Wu SG(吴士广);  Pu ZQ(蒲志强);  Yi JQ(易建强)
Adobe PDF(2189Kb)  |  收藏  |  浏览/下载:179/51  |  提交时间:2023/06/12
Multi-UAV Cooperative Short-Range Combat via Attention-Based Reinforcement Learning using Individual Reward Shaping 会议论文
, Kyoto, Japan, October 23-27, 2022
作者:  Zhang TL(张天乐);  Qiu TH(丘腾海);  Liu Z(刘振);  Pu ZQ(蒲志强);  Yi JQ(易建强)
Adobe PDF(896Kb)  |  收藏  |  浏览/下载:124/43  |  提交时间:2023/06/12
Multi-Target Encirclement with Collision Avoidance via Deep Reinforcement Learning using Relational Graphs 会议论文
, Philadelphia, PA, USA, May 23-27, 2022
作者:  Zhang TL(张天乐);  Liu Z(刘振);  Pu ZQ(蒲志强);  Yi JQ(易建强)
Adobe PDF(4277Kb)  |  收藏  |  浏览/下载:129/33  |  提交时间:2023/06/12
LEARN EFFECTIVE REPRESENTATION FOR DEEP REINFORCEMENT LEARNING 会议论文
, Taipei, Taiwan, 26 August 2022
作者:  Zhan Yuan;  Xu Zhiwei;  Fan Guoliang
Adobe PDF(2093Kb)  |  收藏  |  浏览/下载:143/47  |  提交时间:2023/06/08
Stronger wind, smaller tree: Testing tree growth plasticity through a modeling approach 期刊论文
FRONTIERS IN PLANT SCIENCE, 2022, 卷号: 13, 页码: 17
作者:  Wang, Haoyu;  Hua, Jing;  Kang, Mengzhen;  Wang, Xiujuan;  Fan, Xing-Rong;  Fourcaud, Thierry;  de Reffye, Philippe
Adobe PDF(6783Kb)  |  收藏  |  浏览/下载:293/59  |  提交时间:2023/01/09
functional-structural plant model  mechanical model  critical wind speed  tree breakage  optimization  thigmomorphogenesis  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
作者:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:463/74  |  提交时间:2022/07/12
知识数据混合驱动的策略学习及在兵棋决策中的运用 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  刘轩
Adobe PDF(3837Kb)  |  收藏  |  浏览/下载:231/13  |  提交时间:2022/06/17
复杂对抗环境  认知智能  知识数据混合驱动  状态回溯  分层决策  陆战兵棋  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:191/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
基于深度强化学习的高铁列车运行调整方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  王银
Adobe PDF(3006Kb)  |  收藏  |  浏览/下载:192/7  |  提交时间:2022/06/16
高速铁路  智能调度  列车运行调整  列车运行图  强化学习  
面向平行交通系统的城市出行轨迹挖掘方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  李志帅
Adobe PDF(15178Kb)  |  收藏  |  浏览/下载:259/14  |  提交时间:2022/06/16
平行交通系统  城市出行轨迹挖掘  出行语义感知  出行轨迹生成  疫情传播模拟