CASIA OpenIR

浏览/检索结果: 共456条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
医疗领域任务型对话系统研究 学位论文
, 2024
作者:  胡泽发
Adobe PDF(3935Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/29
医疗对话系统  任务型对话系统  对话理解  对话推理  幻觉现象  
Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文
Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078
作者:  Qiu JY(邱俊彦);  Haidong Zhang;  Yiping Yang
Adobe PDF(831Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29
reinforcement learning  dialogue policy learning  curriculum learning  knowledge distillation  
Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning 会议论文
, Queensland, Australia, 2023-6
作者:  Yang, Chen;  Yang, Guangkai;  Chen, Hao;  Zhang, Junge
Adobe PDF(3027Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/29
事件因果关系挖掘关键技术研究 学位论文
, 2024
作者:  何致涛
Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
事件因果关系识别  事件因果关系解释生成  预训练语言模型  多智能体  
基于强化学习的机器人操作策略表征与学习 学位论文
, 2024
作者:  杨依明
Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28
强化学习  机器人操作  机器人控制  策略表征  
融合专家知识与强化学习的自动驾驶策略研究 学位论文
, 2024
作者:  王宇霄
Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/05/28
自动驾驶,深度模仿学习,深度强化学习,图神经网络  
Cooperative Object Transportation for Second-order Multi-robot Systems in Dynamic Environment 会议论文
Proceedings of the 42nd Chinese Control Conference, 天津, 2023-7-24
作者:  Cai, Qiang;  Ai, Xiaolin;  Liu, Tianqi;  Pu, zhiqiang
Adobe PDF(3418Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/28
Learning Causal Dynamics Models in Object-Oriented Environments 会议论文
Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
强化学习  因果模型  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:12/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习