CASIA OpenIR

浏览/检索结果: 共67条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
FeaCo: Reaching Robust Feature-Level Consensus in Noisy Pose Conditions 会议论文
, Ottawa, Canada, 2023.10.27-2023.11.2
作者:  Gu JM(谷佳铭);  Jingyu Zhang;  Zhang MY(张沐阳);  Meng WL(孟维亮);  Xu SB(徐士彪);  Zhang JG(张吉光);  Zhang XP(张晓鹏)
Adobe PDF(5119Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/06/11
M3: Modularization for Multi-task and Multi-agent Offline Pre-training 会议论文
, London, United Kingdom, 2023.5.29-2023.6.2
作者:  Meng Linghui;  Ruan Jingqing;  Xiong Xuantang;  Li Xiyun;  Zhang Xi;  Xing Dengpeng;  Xu Bo
Adobe PDF(1302Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/06/11
Learning Superior Cooperative Policy in Competitive Multi-team Reinforcement Learning 会议论文
, Gold Coast, Australia, 2023-6
作者:  Qingxu Fu;  Tenghai Qiu;  Zhiqiang Pu;  Jianqiang Yi;  Xiaolin Ai;  Wanmai Yuan
Adobe PDF(25675Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/06/05
Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:  Qingxu, Fu;  Xiaolin Ai;  Jianqiang Yi;  Tenghai Qiu;  Wanmai Yuan;  Zhiqiang Pu
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:9/1  |  提交时间:2024/06/05
Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文
Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078
作者:  Qiu JY(邱俊彦);  Haidong Zhang;  Yiping Yang
Adobe PDF(831Kb)  |  收藏  |  浏览/下载:11/2  |  提交时间:2024/05/29
reinforcement learning  dialogue policy learning  curriculum learning  knowledge distillation  
Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning 会议论文
, Queensland, Australia, 2023-6
作者:  Yang, Chen;  Yang, Guangkai;  Chen, Hao;  Zhang, Junge
Adobe PDF(3027Kb)  |  收藏  |  浏览/下载:21/7  |  提交时间:2024/05/29
Dual Self-Awareness Value Decomposition Framework without Individual Global Max for Cooperative MARL 会议论文
, New Orleans, LA, USA, December 10-16, 2023
作者:  Zhiwei Xu;  Bin Zhang;  Dapeng Li;  Guangchong Zhou;  Zeren Zhang;  Guoliang Fan
Adobe PDF(8700Kb)  |  收藏  |  浏览/下载:13/2  |  提交时间:2024/05/28
Interaction-Aware Trajectory Prediction with Point Transformer 会议论文
, Bilbao, Bizkaia, Spain, 24-28 September 2023
作者:  Yahui, Liu;  Xingyuan, Dai;  Jianwu, Fang;  Bin, Tian;  Yisheng, Lv
Adobe PDF(519Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/05/28
trajectory prediction  
航天器威胁规避智能自主控制技术研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 2, 页码: 229-245
作者:  袁利;  姜甜甜
Adobe PDF(2092Kb)  |  收藏  |  浏览/下载:19/5  |  提交时间:2024/05/09
轨道威胁感知  自主决策规划  “感知-决策-执行”一体化  航天器智能自主控制  
基于因果建模的强化学习控制:现状及展望 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 3, 页码: 661-677
作者:  孙悦雯;  柳文章;  孙长银
Adobe PDF(1926Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/05/09
强化学习控制  因果发现  因果推理  迁移学习  表示学习