CASIA OpenIR

浏览/检索结果: 共67条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:7/4  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文
, 新加坡, May 13 - 17, 2024
作者:  Zhang, Zhiyuan;  Zhang, Qichao;  Wu, Xiaoxu;  Shi, Xiaowen;  Liao, Guogang;  Wang, Yongkong;  Wang, xingxing;  Zhao, Dongbin
Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:21/8  |  提交时间:2024/06/25
Ads Allocation  Reinforcement Learning  User Response Modeling  
Review on Peg-in-Hole Insertion Technology Based on Reinforcement Learning 会议论文
, Chongqing, China, 2023-11
作者:  Shen Liancheng;  Su Jianhua;  Zhang Xiaodong
Adobe PDF(254Kb)  |  收藏  |  浏览/下载:24/11  |  提交时间:2024/06/24
—Robot Peg-in-hole Insertion  Reinforcement Learning  Meta-Reinforcement Learning  
面向复杂装配任务的机器人轨迹规划与柔顺控制技术研究 学位论文
, 2024
作者:  沈炼成
Adobe PDF(29544Kb)  |  收藏  |  浏览/下载:18/1  |  提交时间:2024/06/24
轨迹规划,装配策略,柔顺控制  
Digital Twin Driven Measurement in Robotic Flexible Printed Circuit Assembly 期刊论文
IEEE Transactions on Instrumentation & Measurement, 2023, 卷号: 72, 页码: 5007812
作者:  Yang Minghao;  Huang Zhenping;  Sun Yangchang;  Zhao Yongjia;  Sun Ruize;  Sun Qi;  Chen JinLong;  Qiang BaoHua;  Wang JingHong;  Sun FuChun
Adobe PDF(39985Kb)  |  收藏  |  浏览/下载:25/6  |  提交时间:2024/06/24
M3: Modularization for Multi-task and Multi-agent Offline Pre-training 会议论文
, London, United Kingdom, 2023.5.29-2023.6.2
作者:  Meng Linghui;  Ruan Jingqing;  Xiong Xuantang;  Li Xiyun;  Zhang Xi;  Xing Dengpeng;  Xu Bo
Adobe PDF(1302Kb)  |  收藏  |  浏览/下载:23/5  |  提交时间:2024/06/11
基于机理建模和数据驱动的机器人装配技能学习研究 学位论文
, 2024
作者:  严少华
Adobe PDF(6690Kb)  |  收藏  |  浏览/下载:46/5  |  提交时间:2024/05/29
位姿测量  对准控制  强化学习  装入控制  装配技能学习  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:43/5  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:63/6  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:50/21  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习