CASIA OpenIR

浏览/检索结果: 共158条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:8/0  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
基于脑脉冲序列的离散时间动态系统学习控制研究 学位论文
, 2024
作者:  韩立元
Adobe PDF(32282Kb)  |  收藏  |  浏览/下载:4/0  |  提交时间:2024/06/04
离散时间动态系统  脑脉冲序列  脉冲自适应动态规划  脉冲神经网络  多尺度动力学  脑机接口  
A Bio-Inspired Integration Model of Basal Ganglia and Cerebellum for Motion Learning of a Musculoskeletal Robot 期刊论文
Journal of Systems Science and Complexity, 2024, 卷号: 37, 页码: 82-113
作者:  Jinhan Zhang;  Jiahao Chen;  Shanlin Zhong;  Hong Qiao
Adobe PDF(1513Kb)  |  收藏  |  浏览/下载:6/0  |  提交时间:2024/06/04
Deep Reinforcement Learning-Based Driving Policy at Intersections Utilizing Lane Graph Networks 期刊论文
IEEE Transactions on Cognitive and Developmental Systems, 2024, 页码: 1 - 16
作者:  Liu, Yuqi;  Zhang, Qichao;  Gao, Yinfeng;  Zhao, Dongbin
Adobe PDF(22863Kb)  |  收藏  |  浏览/下载:2/1  |  提交时间:2024/06/03
Reinforcement Learning  Autonomous Driving  Intersection Navigating  
基于序列展开模型的多智能体方法研究 学位论文
, 2024
作者:  Luo ZX(罗正昕)
Adobe PDF(13451Kb)  |  收藏  |  浏览/下载:24/0  |  提交时间:2024/05/30
多智能体  强化学习  序列展开模型  信度分配  非平稳性  
Centralized Cooperative Exploration Policy for Continuous Control Tasks 会议论文
Proceedings of the 2023 International Conference on Autonomous Agents and Multiagent Systems, London, United Kingdom, May 29–June 2, 2023
作者:  Chao Li;  Chen Gong;  Qiang He;  Xinwen Hou;  Yu Liu
Adobe PDF(2175Kb)  |  收藏  |  浏览/下载:9/2  |  提交时间:2024/05/30
continuous control tasks  cooperative exploration  
基于深度学习的视频片段拷贝检测技术研究 学位论文
, 2024
作者:  张驰
Adobe PDF(23128Kb)  |  收藏  |  浏览/下载:10/0  |  提交时间:2024/05/28
版权保护  视频片段拷贝检测  深度学习  
等周约束最优控制问题及其逆问题研究 学位论文
, 2024
作者:  李涛
Adobe PDF(2814Kb)  |  收藏  |  浏览/下载:15/1  |  提交时间:2024/05/28
最优控制  逆最优控制  等周约束  自适应动态规划  智能控制  
Constrained-cost adaptive dynamic programming for optimal control of discrete-time nonlinear systems 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2023, 卷号: 35, 期号: 3, 页码: 3251 - 3264
作者:  Wei, Qinglai;  Li, Tao
Adobe PDF(8471Kb)  |  收藏  |  浏览/下载:11/4  |  提交时间:2024/05/28
Adaptive dynamic programming  approximate dynamic programming  constrained cost  optimal control  reinforcement learning  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(5071Kb)  |  收藏  |  浏览/下载:30/3  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估