已选(0)清除
条数/页: 排序方式: |
| 基于深度强化学习的大规模群体智能决策方法研究 学位论文 , 2024 作者: 付清旭 Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/29 大规模,群体系统,协同,决策,深度强化学习,多智能体系统 |
| 基于参数化网格约束的三维人体和手物交互重建 学位论文 , 2024 作者: 胡俊星 Adobe PDF(28026Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/29 单目图像 参数化网格约束 人体网格重建 手物接触估计 手物交互重建 |
| 基于解释增强的预训练语言模型知识利用关键技术研究 学位论文 , 2024 作者: 杨朝 Adobe PDF(2885Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/29 预训练语言模型 可解释性 知识迁移 知识筛选 知识激活 |
| Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文 Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078 作者: Qiu JY(邱俊彦); Haidong Zhang; Yiping Yang Adobe PDF(831Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/29 reinforcement learning dialogue policy learning curriculum learning knowledge distillation |
| Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文 IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989 作者: Yang YM(杨依明); Xing DP(邢登鹏); Xu B(徐波) Adobe PDF(2469Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/29 |
| 面向知识图谱补全的小样本学习方法研究 学位论文 , 2024 作者: 李金林 Adobe PDF(1856Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29 小样本学习 知识图谱补全 交互学习 预训练语言模型 大语言模型 |
| 基于预训练语言模型的概念体系自动构建方法研究 学位论文 , 2024 作者: 王思懿 Adobe PDF(2808Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/29 概念体系自动构建 强化学习 预训练语言模型 |
| 灵巧手机器人的类人物体交接学习研究 学位论文 , 2024 作者: 段昊男 Adobe PDF(51787Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/29 机器人学习 人机交互 物体交接 灵巧手机器人 |
| D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文 , 中国重庆, 2024.5.7-5.9 作者: Niu LY(钮龙宇); Wan J(万军) Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:9/1  |  提交时间:2024/05/28 深度强化学习 表征学习 分层学习 |
| 融合专家知识与强化学习的自动驾驶策略研究 学位论文 , 2024 作者: 王宇霄 Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28 自动驾驶,深度模仿学习,深度强化学习,图神经网络 |