CASIA OpenIR

浏览/检索结果: 共32条,第1-10条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
面向算力网络的智慧调度综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103
作者:  李逸博;  李小平;  王爽;  蒋嶷川
Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/07/02
算力网络  云计算  边缘计算  资源调度  知识  
融合自适应评判的随机系统数据驱动策略优化 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 5, 页码: 980-990
作者:  王鼎;  王将宇;  乔俊飞
Adobe PDF(2044Kb)  |  收藏  |  浏览/下载:44/21  |  提交时间:2024/05/30
自适应评判设计  数据驱动  离散系统  神经网络  Q-learning  随机最优控制  
基于折扣广义值迭代的智能最优跟踪及应用验证 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 182-193
作者:  王鼎;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(2055Kb)  |  收藏  |  浏览/下载:33/9  |  提交时间:2024/05/20
自适应评判控制  可容许性  广义值迭代  智能最优跟踪  神经网络  
深度强化学习的攻防与安全性分析综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 1, 页码: 21-39
作者:  陈晋音;  章燕;  王雪柯;  蔡鸿斌;  王珏;  纪守领
Adobe PDF(3981Kb)  |  收藏  |  浏览/下载:44/18  |  提交时间:2024/05/20
深度强化学习  对抗攻击  防御  策略攻击  安全性  
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:45/7  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
机器人运动轨迹的模仿学习综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 315-334
作者:  黄艳龙;  徐德;  谭民
Adobe PDF(4795Kb)  |  收藏  |  浏览/下载:51/17  |  提交时间:2024/05/20
机器人技能学习  模仿学习  运动基元  轨迹学习  
数据驱动的保证收敛速率最优输出调节 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 4, 页码: 980-991
作者:  姜艺;  范家璐;  柴天佑
Adobe PDF(1589Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/05/20
保证收敛速率  最优输出调节  强化学习  值迭代  
采用分类经验回放的深度确定性策略梯度方法 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 7, 页码: 1816-1823
作者:  时圣苗;  刘全
Adobe PDF(19798Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/20
连续控制任务  深度确定性策略梯度  经验回放  分类经验回放  
基于GPR和深度强化学习的分层人机协作控制 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 9, 页码: 2352-2360
作者:  金哲豪;  刘安东;  俞立
Adobe PDF(5643Kb)  |  收藏  |  浏览/下载:12/5  |  提交时间:2024/05/20
深度强化学习  高斯过程回归  人体控制策略感知  分层人机协作