CASIA OpenIR

浏览/检索结果: 共1547条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39228Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
基于参数化网格约束的三维人体和手物交互重建 学位论文
, 2024
作者:  胡俊星
Adobe PDF(28026Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/29
单目图像  参数化网格约束  人体网格重建  手物接触估计  手物交互重建  
基于解释增强的预训练语言模型知识利用关键技术研究 学位论文
, 2024
作者:  杨朝
Adobe PDF(2885Kb)  |  收藏  |  浏览/下载:3/0  |  提交时间:2024/05/29
预训练语言模型  可解释性  知识迁移  知识筛选  知识激活  
Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文
Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078
作者:  Qiu JY(邱俊彦);  Haidong Zhang;  Yiping Yang
Adobe PDF(831Kb)  |  收藏  |  浏览/下载:0/0  |  提交时间:2024/05/29
reinforcement learning  dialogue policy learning  curriculum learning  knowledge distillation  
Efficient Spatiotemporal Transformer for Robotic Reinforcement Learning 期刊论文
IEEE ROBOTICS AND AUTOMATION LETTERS, 2022, 卷号: 7, 期号: 3, 页码: 7982-7989
作者:  Yang YM(杨依明);  Xing DP(邢登鹏);  Xu B(徐波)
Adobe PDF(2469Kb)  |  收藏  |  浏览/下载:1/0  |  提交时间:2024/05/29
面向知识图谱补全的小样本学习方法研究 学位论文
, 2024
作者:  李金林
Adobe PDF(1856Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/29
小样本学习  知识图谱补全  交互学习  预训练语言模型  大语言模型  
基于预训练语言模型的概念体系自动构建方法研究 学位论文
, 2024
作者:  王思懿
Adobe PDF(2808Kb)  |  收藏  |  浏览/下载:5/0  |  提交时间:2024/05/29
概念体系自动构建  强化学习  预训练语言模型  
灵巧手机器人的类人物体交接学习研究 学位论文
, 2024
作者:  段昊男
Adobe PDF(51787Kb)  |  收藏  |  浏览/下载:9/0  |  提交时间:2024/05/29
机器人学习  人机交互  物体交接  灵巧手机器人  
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
, 中国重庆, 2024.5.7-5.9
作者:  Niu LY(钮龙宇);  Wan J(万军)
Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:9/1  |  提交时间:2024/05/28
深度强化学习  表征学习  分层学习  
融合专家知识与强化学习的自动驾驶策略研究 学位论文
, 2024
作者:  王宇霄
Adobe PDF(2599Kb)  |  收藏  |  浏览/下载:11/1  |  提交时间:2024/05/28
自动驾驶,深度模仿学习,深度强化学习,图神经网络