CASIA OpenIR

浏览/检索结果: 共55条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:10/5  |  提交时间:2024/06/25
Digital Twin Driven Measurement in Robotic Flexible Printed Circuit Assembly 期刊论文
IEEE Transactions on Instrumentation & Measurement, 2023, 卷号: 72, 页码: 5007812
作者:  Yang Minghao;  Huang Zhenping;  Sun Yangchang;  Zhao Yongjia;  Sun Ruize;  Sun Qi;  Chen JinLong;  Qiang BaoHua;  Wang JingHong;  Sun FuChun
Adobe PDF(39985Kb)  |  收藏  |  浏览/下载:20/3  |  提交时间:2024/06/24
基于强化学习与安全约束的自动驾驶决策方法 期刊论文
交通运输研究, 2023, 卷号: 9, 期号: 1, 页码: 31-39
作者:  王宇霄;  刘敬玉;  李忠飞;  朱凤华
Adobe PDF(2613Kb)  |  收藏  |  浏览/下载:24/9  |  提交时间:2024/06/11
深度强化学习  自动驾驶  决策  安全约束  
Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:  Qingxu, Fu;  Xiaolin Ai;  Jianqiang Yi;  Tenghai Qiu;  Wanmai Yuan;  Zhiqiang Pu
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:28/7  |  提交时间:2024/06/05
未知非线性零和博弈最优跟踪的事件触发控制设计 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 91-101
作者:  王鼎;  胡凌治;  赵明明;  哈明鸣;  乔俊飞
Adobe PDF(1996Kb)  |  收藏  |  浏览/下载:42/15  |  提交时间:2024/05/09
自适应评判设计  事件触发控制  神经网络  最优跟踪控制  稳定性分析  零和博弈  
基于自适应噪声的最大熵进化强化学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66
作者:  王君逸;  王志;  李华雄;  陈春林
Adobe PDF(6435Kb)  |  收藏  |  浏览/下载:33/10  |  提交时间:2024/05/09
深度强化学习  进化策略  进化强化学习  最大熵  自适应噪声  
视觉语言导航研究进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14
作者:  司马双霖;  黄岩;  何科技;  安东;  袁辉;  王亮
Adobe PDF(6272Kb)  |  收藏  |  浏览/下载:49/15  |  提交时间:2024/05/09
视觉语言导航  视觉语言理解  跨模态匹配  具身智能  
不确定工业过程运行指标异步更新强化学习决策算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472
作者:  李金娜;  袁林;  丁进良
Adobe PDF(1941Kb)  |  收藏  |  浏览/下载:49/19  |  提交时间:2024/05/09
运行优化控制  强化学习  数据驱动控制  自适应动态规划  安全运行  
欺骗攻击下具备隐私保护的多智能体系统均值趋同控制 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 425-436
作者:  应晨铎;  伍益明;  徐明;  郑宁;  何熊熊
Adobe PDF(2092Kb)  |  收藏  |  浏览/下载:42/20  |  提交时间:2024/05/09
多智能体系统  均值趋同  欺骗攻击  隐私保护  网络安全  
计算实验方法的溯源、现状与展望 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 246-271
作者:  薛霄;  于湘凝;  周德雨;  彭超;  王晓;  周长兵;  王飞跃
Adobe PDF(6491Kb)  |  收藏  |  浏览/下载:35/12  |  提交时间:2024/05/09
计算实验  人工社会  多主体建模  实验设计  路线图