CASIA OpenIR

浏览/检索结果: 共679条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
, 中国重庆, 2024-5-7
作者:  Niu LY(钮龙宇);  Wan J(万军)
Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/05/28
面向高仿真场景的深度强化学习算法研究 学位论文
, 2024
作者:  钮龙宇
Adobe PDF(9528Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
深度强化学习  高仿真场景  分层学习  模仿学习  表征学习  
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
Towards Better Quantity Representations for Solving Math Word Problems 期刊论文
ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), 2024, 页码: -
作者:  Sun, Runxin;  He, Shizhu;  Zhao, Jun;  Liu, Kang
Adobe PDF(417Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/05/28
Explainable Reinforcement Learning via a Causal World Model 会议论文
Proceedings of the 32nd International Joint Conference on Artificial Intelligence, 中国澳门, 2023-08-22
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(850Kb)  |  收藏  |  浏览/下载:5/2  |  提交时间:2024/05/28
强化学习  可解释人工智能  因果推理  
Learning Causal Dynamics Models in Object-Oriented Environments 会议论文
Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/05/28
强化学习  因果模型  
基于强化学习的多智能体协同决策关键问题研究 学位论文
, 2024
作者:  徐志伟
Adobe PDF(12464Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/05/28
强化学习  多智能体系统  协同与合作  分层决策  对比学习  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
基于颅内电生理记录的面孔加工脑活动研究 学位论文
, 2024
作者:  李文路
Adobe PDF(5800Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/28
面孔检测  面孔身份识别  面孔社会特征判断  颅内电生理记录  人脑颞叶  
Efficient 3D Path Planning for Underwater Vehicle Based on Non-Uniformly Modeling 会议论文
, 2021 IEEE 17th International Conference on Automation Science and Engineering (CASE), 2021-8-23
作者:  Wang KH(王凯辉);  SU Hu(苏虎);  Zou Wei(邹伟);  Ma HX(马洪轩);  Zhang Chi(张弛);  Wang Zhiqing(王智清)
Adobe PDF(2115Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/28