CASIA OpenIR

浏览/检索结果: 共71条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
融合自适应评判的随机系统数据驱动策略优化 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990
作者:  王鼎;  王将宇;  乔俊飞
Adobe PDF(2044Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/30
自适应评判设计  数据驱动  离散系统  神经网络  Q-learning  随机最优控制  
An Empirical Study on Google Research Football Multi-agent Scenarios 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 549-570
作者:  Yan Song;  He Jiang;  Zheng Tian;  Haifeng Zhang;  Yingping Zhang;  Jiangcheng Zhu;  Zonghong Dai;  Weinan Zhang;  Jun Wang
Adobe PDF(24588Kb)  |  收藏  |  浏览/下载:17/5  |  提交时间:2024/05/23
Multi-agent reinforcement learning (RL), distributed RL system, population-based training, reward shaping, game theory  
Distributed Deep Reinforcement Learning: A Survey and a Multi-player Multi-agent Learning Toolbox 期刊论文
Machine Intelligence Research, 2024, 卷号: 21, 期号: 3, 页码: 411-430
作者:  Qiyue Yin;  Tongtong Yu;  Shengqi Shen;  Jun Yang;  Meijing Zhao;  Wancheng Ni;  Kaiqi Huang;  Bin Liang;  Liang Wang
Adobe PDF(2923Kb)  |  收藏  |  浏览/下载:13/7  |  提交时间:2024/05/23
Deep reinforcement learning, distributed machine learning, self-play, population-play, toolbox  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
无人机反应式扰动流体路径规划 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287
作者:  吴健发;  王宏伦;  王延祥;  刘一恒
Adobe PDF(4624Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/05/09
无人机  反应式路径规划  受约束扰动流体动态系统  深度强化学习  训练环境  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:10/4  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
机器人感知与控制关键技术及其智能制造应用 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 494-513
作者:  王耀南;  江一鸣;  姜娇;  张辉;  谭浩然;  彭伟星;  吴昊天;  曾凯
Adobe PDF(40511Kb)  |  收藏  |  浏览/下载:19/9  |  提交时间:2024/05/09
机器人  智能制造  视觉感知  智能控制  系统应用  信息物理系统  
兵棋推演的智能决策技术与挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:  尹奇跃;  赵美静;  倪晚成;  张俊格;  黄凯奇
Adobe PDF(4513Kb)  |  收藏  |  浏览/下载:18/9  |  提交时间:2024/05/09
兵棋推演  人机对抗  智能决策技术  博弈学习  
面向无人艇的T-DQN智能避障算法研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1645-1655
作者:  周治国;  余思雨;  于家宝;  段俊伟;  陈龙;  陈俊龙
Adobe PDF(6392Kb)  |  收藏  |  浏览/下载:24/8  |  提交时间:2024/04/24
无人艇  强化学习  智能避障  深度Q网络