CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
融合自适应评判的随机系统数据驱动策略优化 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990
作者:  王鼎;  王将宇;  乔俊飞
Adobe PDF(2044Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/05/30
自适应评判设计  数据驱动  离散系统  神经网络  Q-learning  随机最优控制  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:8/3  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
无人机反应式扰动流体路径规划 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 272-287
作者:  吴健发;  王宏伦;  王延祥;  刘一恒
Adobe PDF(4624Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/05/09
无人机  反应式路径规划  受约束扰动流体动态系统  深度强化学习  训练环境  
多智能体博弈、学习与控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 580-613
作者:  王龙;  黄锋
Adobe PDF(2088Kb)  |  收藏  |  浏览/下载:11/4  |  提交时间:2024/05/09
博弈论  多智能体学习  控制论  强化学习  人工智能  
机器人感知与控制关键技术及其智能制造应用 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 494-513
作者:  王耀南;  江一鸣;  姜娇;  张辉;  谭浩然;  彭伟星;  吴昊天;  曾凯
Adobe PDF(40511Kb)  |  收藏  |  浏览/下载:21/9  |  提交时间:2024/05/09
机器人  智能制造  视觉感知  智能控制  系统应用  信息物理系统  
兵棋推演的智能决策技术与挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:  尹奇跃;  赵美静;  倪晚成;  张俊格;  黄凯奇
Adobe PDF(4513Kb)  |  收藏  |  浏览/下载:18/9  |  提交时间:2024/05/09
兵棋推演  人机对抗  智能决策技术  博弈学习  
面向无人艇的T-DQN智能避障算法研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1645-1655
作者:  周治国;  余思雨;  于家宝;  段俊伟;  陈龙;  陈俊龙
Adobe PDF(6392Kb)  |  收藏  |  浏览/下载:24/8  |  提交时间:2024/04/24
无人艇  强化学习  智能避障  深度Q网络  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:30/8  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:70/18  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习