CASIA OpenIR

浏览/检索结果: 共17条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
扩展目标跟踪中基于深度强化学习的传感器管理方法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 7, 页码: 1417-1431
作者:  张虹芸;  陈辉;  张文旭
Adobe PDF(6523Kb)  |  收藏  |  浏览/下载:33/12  |  提交时间:2024/07/25
传感器管理  扩展目标跟踪  深度强化学习  双延迟深度确定性策略梯度  信息增益  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:64/27  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
基于多智能体强化学习的乳腺癌致病基因预测 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 5, 页码: 1246-1258
作者:  刘健;  顾扬;  程玉虎;  王雪松
Adobe PDF(9978Kb)  |  收藏  |  浏览/下载:65/23  |  提交时间:2024/05/20
乳腺癌  致病基因  基因排序  多智能体强化学习  演示学习  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:10/4  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
基于GPR和深度强化学习的分层人机协作控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2352-2360
作者:  金哲豪;  刘安东;  俞立
Adobe PDF(5643Kb)  |  收藏  |  浏览/下载:21/8  |  提交时间:2024/05/20
深度强化学习  高斯过程回归  人体控制策略感知  分层人机协作  
不确定工业过程运行指标异步更新强化学习决策算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:  李金娜;  袁林;  丁进良
Adobe PDF(1941Kb)  |  收藏  |  浏览/下载:72/29  |  提交时间:2024/05/09
运行优化控制  强化学习  数据驱动控制  自适应动态规划  安全运行  
基于因果建模的强化学习控制:现状及展望 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677
作者:  孙悦雯;  柳文章;  孙长银
Adobe PDF(1926Kb)  |  收藏  |  浏览/下载:63/18  |  提交时间:2024/05/09
强化学习控制  因果发现  因果推理  迁移学习  表示学习  
问答ChatGPT之后:超大预训练模型的机遇和挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 4, 页码: 705-717
作者:  卢经纬;  郭超;  戴星原;  缪青海;  王兴霞;  杨静;  王飞跃
Adobe PDF(2118Kb)  |  收藏  |  浏览/下载:89/23  |  提交时间:2024/05/09
预训练模型  ChatGPT  Transformer  人工智能生成内容  平行智能  社会化大闭环  
兵棋推演的智能决策技术与挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:  尹奇跃;  赵美静;  倪晚成;  张俊格;  黄凯奇
Adobe PDF(4513Kb)  |  收藏  |  浏览/下载:76/28  |  提交时间:2024/05/09
兵棋推演  人机对抗  智能决策技术  博弈学习