CASIA OpenIR

浏览/检索结果: 共3条,第1-3条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
面向多智能体协作的注意力意图与交流学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325
作者:  俞文武;  杨晓亚;  李海昌;  王瑞;  胡晓惠
Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/04/18
多智能体  强化学习  意图交流  注意力机制  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:254/63  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能