已选(0)清除
条数/页: 排序方式: |
| Intrinsic Reward with Peer Incentives for Cooperative Multi-Agent Reinforcement Learning 会议论文 , Online, 18-23 July 2022 作者: Zhang TL(张天乐); Liu Z(刘振); Wu SG(吴士广); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(2189Kb)  |  收藏  |  浏览/下载:179/51  |  提交时间:2023/06/12 |
| Multi-UAV Cooperative Short-Range Combat via Attention-Based Reinforcement Learning using Individual Reward Shaping 会议论文 , Kyoto, Japan, October 23-27, 2022 作者: Zhang TL(张天乐); Qiu TH(丘腾海); Liu Z(刘振); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(896Kb)  |  收藏  |  浏览/下载:124/43  |  提交时间:2023/06/12 |
| Multi-Target Encirclement with Collision Avoidance via Deep Reinforcement Learning using Relational Graphs 会议论文 , Philadelphia, PA, USA, May 23-27, 2022 作者: Zhang TL(张天乐); Liu Z(刘振); Pu ZQ(蒲志强); Yi JQ(易建强) Adobe PDF(4277Kb)  |  收藏  |  浏览/下载:129/33  |  提交时间:2023/06/12 |
| LEARN EFFECTIVE REPRESENTATION FOR DEEP REINFORCEMENT LEARNING 会议论文 , Taipei, Taiwan, 26 August 2022 作者: Zhan Yuan; Xu Zhiwei; Fan Guoliang Adobe PDF(2093Kb)  |  收藏  |  浏览/下载:143/47  |  提交时间:2023/06/08 |
| Stronger wind, smaller tree: Testing tree growth plasticity through a modeling approach 期刊论文 FRONTIERS IN PLANT SCIENCE, 2022, 卷号: 13, 页码: 17 作者: Wang, Haoyu; Hua, Jing; Kang, Mengzhen; Wang, Xiujuan; Fan, Xing-Rong; Fourcaud, Thierry; de Reffye, Philippe Adobe PDF(6783Kb)  |  收藏  |  浏览/下载:293/59  |  提交时间:2023/01/09 functional-structural plant model mechanical model critical wind speed tree breakage optimization thigmomorphogenesis |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:463/74  |  提交时间:2022/07/12 |
| 知识数据混合驱动的策略学习及在兵棋决策中的运用 学位论文 工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 刘轩 Adobe PDF(3837Kb)  |  收藏  |  浏览/下载:231/13  |  提交时间:2022/06/17 复杂对抗环境 认知智能 知识数据混合驱动 状态回溯 分层决策 陆战兵棋 |
| 两人零和博弈中的对抗学习与适应算法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 吴哲 Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:191/5  |  提交时间:2022/06/17 机器博弈 两人零和博弈 纳什均衡 对手建模 元学习 |
| 基于深度强化学习的高铁列车运行调整方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 王银 Adobe PDF(3006Kb)  |  收藏  |  浏览/下载:192/7  |  提交时间:2022/06/16 高速铁路 智能调度 列车运行调整 列车运行图 强化学习 |
| 面向平行交通系统的城市出行轨迹挖掘方法研究 学位论文 , 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 李志帅 Adobe PDF(15178Kb)  |  收藏  |  浏览/下载:259/14  |  提交时间:2022/06/16 平行交通系统 城市出行轨迹挖掘 出行语义感知 出行轨迹生成 疫情传播模拟 |