已选(0)清除
条数/页: 排序方式: |
| Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang ; Zhang Hongming; Xing Dengpeng ; Bo Xu![](/image/person.jpg)
Adobe PDF(9639Kb)  |   收藏  |  浏览/下载:10/5  |  提交时间:2024/06/25 |
| Digital Twin Driven Measurement in Robotic Flexible Printed Circuit Assembly 期刊论文 IEEE Transactions on Instrumentation & Measurement, 2023, 卷号: 72, 页码: 5007812 作者: Yang Minghao ; Huang Zhenping; Sun Yangchang ; Zhao Yongjia; Sun Ruize; Sun Qi; Chen JinLong; Qiang BaoHua; Wang JingHong; Sun FuChun
Adobe PDF(39985Kb)  |   收藏  |  浏览/下载:20/3  |  提交时间:2024/06/24 |
| 基于强化学习与安全约束的自动驾驶决策方法 期刊论文 交通运输研究, 2023, 卷号: 9, 期号: 1, 页码: 31-39 作者: 王宇霄 ; 刘敬玉; 李忠飞; 朱凤华![](/image/person.jpg)
Adobe PDF(2613Kb)  |   收藏  |  浏览/下载:24/9  |  提交时间:2024/06/11 深度强化学习 自动驾驶 决策 安全约束 |
| Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文 IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040 作者: Qingxu, Fu ; Xiaolin Ai ; Jianqiang Yi ; Tenghai Qiu ; Wanmai Yuan; Zhiqiang Pu![](/image/person.jpg)
Adobe PDF(996Kb)  |   收藏  |  浏览/下载:28/7  |  提交时间:2024/06/05 |
| 未知非线性零和博弈最优跟踪的事件触发控制设计 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 91-101 作者: 王鼎 ; 胡凌治; 赵明明; 哈明鸣; 乔俊飞
Adobe PDF(1996Kb)  |   收藏  |  浏览/下载:42/15  |  提交时间:2024/05/09 自适应评判设计 事件触发控制 神经网络 最优跟踪控制 稳定性分析 零和博弈 |
| 基于自适应噪声的最大熵进化强化学习方法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 54-66 作者: 王君逸; 王志; 李华雄; 陈春林
Adobe PDF(6435Kb)  |   收藏  |  浏览/下载:33/10  |  提交时间:2024/05/09 深度强化学习 进化策略 进化强化学习 最大熵 自适应噪声 |
| 视觉语言导航研究进展 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 1, 页码: 1-14 作者: 司马双霖 ; 黄岩 ; 何科技 ; 安东 ; 袁辉; 王亮![](/image/person.jpg)
Adobe PDF(6272Kb)  |   收藏  |  浏览/下载:49/15  |  提交时间:2024/05/09 视觉语言导航 视觉语言理解 跨模态匹配 具身智能 |
| 不确定工业过程运行指标异步更新强化学习决策算法 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 461-472 作者: 李金娜; 袁林; 丁进良
Adobe PDF(1941Kb)  |   收藏  |  浏览/下载:49/19  |  提交时间:2024/05/09 运行优化控制 强化学习 数据驱动控制 自适应动态规划 安全运行 |
| 欺骗攻击下具备隐私保护的多智能体系统均值趋同控制 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 425-436 作者: 应晨铎; 伍益明; 徐明 ; 郑宁; 何熊熊
Adobe PDF(2092Kb)  |   收藏  |  浏览/下载:42/20  |  提交时间:2024/05/09 多智能体系统 均值趋同 欺骗攻击 隐私保护 网络安全 |
| 计算实验方法的溯源、现状与展望 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 246-271 作者: 薛霄; 于湘凝; 周德雨; 彭超; 王晓 ; 周长兵; 王飞跃![](/image/person.jpg)
Adobe PDF(6491Kb)  |   收藏  |  浏览/下载:35/12  |  提交时间:2024/05/09 计算实验 人工社会 多主体建模 实验设计 路线图 |