已选(0)清除
条数/页: 排序方式: |
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 , 2024 作者: 付清旭 Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/05/29 大规模,群体系统,协同,决策,深度强化学习,多智能体系统 |
| 医疗领域任务型对话系统研究 学位论文 , 2024 作者: 胡泽发 Adobe PDF(3935Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/29 医疗对话系统 任务型对话系统 对话理解 对话推理 幻觉现象 |
| Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文 Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078 作者: Qiu JY(邱俊彦); Haidong Zhang; Yiping Yang Adobe PDF(831Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29 reinforcement learning dialogue policy learning curriculum learning knowledge distillation |
| Explicitly Learning Policy Under Partial Observability in Multiagent Reinforcement Learning 会议论文 , Queensland, Australia, 2023-6 作者: Yang, Chen; Yang, Guangkai; Chen, Hao; Zhang, Junge Adobe PDF(3027Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/29 |
| 事件因果关系挖掘关键技术研究 学位论文 , 2024 作者: 何致涛 Adobe PDF(3575Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28 事件因果关系识别 事件因果关系解释生成 预训练语言模型 多智能体 |
| 基于强化学习的机器人操作策略表征与学习 学位论文 , 2024 作者: 杨依明 Adobe PDF(19731Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/28 强化学习 机器人操作 机器人控制 策略表征 |
| 融合专家知识与强化学习的自动驾驶策略研究 学位论文 , 2024 作者: 王宇霄 Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:13/1  |  提交时间:2024/05/28 自动驾驶,深度模仿学习,深度强化学习,图神经网络 |
| Cooperative Object Transportation for Second-order Multi-robot Systems in Dynamic Environment 会议论文 Proceedings of the 42nd Chinese Control Conference, 天津, 2023-7-24 作者: Cai, Qiang; Ai, Xiaolin; Liu, Tianqi; Pu, zhiqiang Adobe PDF(3418Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/28 |
| Learning Causal Dynamics Models in Object-Oriented Environments 会议论文 Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21 作者: Yu ZY(余忠蔚); Ruan JQ(阮景晴); Xing DP(邢登鹏) Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28 强化学习 因果模型 |
| 基于强化学习的多智能体协同决策关键问题研究 学位论文 , 2024 作者: 徐志伟 Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:12/0  |  提交时间:2024/05/28 强化学习 多智能体系统 协同与合作 分层决策 对比学习 |