CASIA OpenIR

浏览/检索结果: 共585条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
A Survey on Recent Advances and Challenges in Reinforcement Learning Methods for Task-oriented Dialogue Policy Learning 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 3, 页码: 318-334
作者:  Wai-Chung Kwan;  Hong-Ru Wang;  Hui-Min Wang;  Kam-Fai Wong
Adobe PDF(2211Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/04/23
Dialogue policy learning (DPL), task-oriented dialogue system (TOD), reinforcement learning (RL), dialogue system, Markov decision process  
Offline Pre-trained Multi-agent Decision Transformer 期刊论文
Machine Intelligence Research, 2023, 卷号: 20, 期号: 2, 页码: 233-248
作者:  Linghui Meng;  Muning Wen;  Chenyang Le;  Xiyun Li;  Dengpeng Xing;  Weinan Zhang;  Ying Wen;  Haifeng Zhang;  Jun Wang;  Yaodong Yang;  Bo Xu
Adobe PDF(2121Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/04/23
Pre-training model  multi-agent reinforcement learning (MARL)  decision making  transformer  offline reinforcement learning  
A Dynamic Resource Allocation Strategy with Reinforcement Learning for Multimodal Multi-objective Optimization 期刊论文
Machine Intelligence Research, 2022, 卷号: 19, 期号: 2, 页码: 138-152
作者:  Qian-Long Dang;  Wei Xu;  Yang-Fei Yuan
Adobe PDF(2376Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/04/23
Multimodal multi-objective optimization (MMO)  dynamic resource allocating strategy (DRAS)  reinforcement learning (RL)  decision space partition  zoning search  
基于自适应动态规划的移动机器人视觉伺服跟踪控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2286-2296
作者:  罗彪;  欧阳志华;  易昕宁;  刘德荣
Adobe PDF(2335Kb)  |  收藏  |  浏览/下载:9/4  |  提交时间:2024/04/18
自适应动态规划  移动机器人  视觉伺服  轨迹跟踪  神经网络控制  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
基于滚动时域强化学习的智能车辆侧向控制算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 12, 页码: 2481-2492
作者:  张兴龙;  陆阳;  李文璋;  徐昕
Adobe PDF(7533Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/04/17
滚动时域  强化学习  智能汽车  侧向控制  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:31/7  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41
作者:  张振国;  毛建旭;  谭浩然;  王耀南;  张雪波;  江一鸣
Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:7/2  |  提交时间:2024/04/12
重大装备制造  多机器人  任务分配  运动规划  
基于平行测试的认知自动驾驶智能架构研究 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 2, 页码: 356-371
作者:  王晓;  张翔宇;  周锐;  田永林;  王建功;  陈龙;  孙长银
Adobe PDF(5843Kb)  |  收藏  |  浏览/下载:14/6  |  提交时间:2024/04/12
认知自动驾驶  平行测试  平行驾驶  车辆认知智能  
高超声速变外形飞行器建模与固定时间预设性能控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 486-504
作者:  曹承钰;  李繁飙;  廖宇新;  殷泽阳;  桂卫华
Adobe PDF(3659Kb)  |  收藏  |  浏览/下载:11/3  |  提交时间:2024/04/10
高超声速变外形飞行器  固定时间  预设性能  干扰观测器  动态面控制