CASIA OpenIR

浏览/检索结果: 共259条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于深度强化学习的足球智能体球员策略方法研究 学位论文
, 2024
作者:  刘博寅
Adobe PDF(11380Kb)  |  收藏  |  浏览/下载:7/0  |  提交时间:2024/07/12
足球  多智能体系统  深度强化学习  互信息  内在激励  预训练  
NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks 会议论文
, Queensland, Australia, 2023-6
作者:  Hu GZ(胡光政);  Li HR(李浩然);  Liu SS(刘莎莎);  Zhu YH(朱圆恒);  Zhao DB(赵冬斌)
Adobe PDF(2785Kb)  |  收藏  |  浏览/下载:27/7  |  提交时间:2024/07/04
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
基于强化学习的多无人机协同任务规划技术 学位论文
, 2024
作者:  张梦瑶
Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:38/0  |  提交时间:2024/07/04
多无人机协同作战  任务规划  图神经网络  多旅行商问题  强化学习  
Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10
作者:  Li, Luntong;  Zhu, Yuanheng
收藏  |  浏览/下载:6/0  |  提交时间:2024/07/03
Artificial neural networks  Vectors  Task analysis  Training  Representation learning  Approximation algorithms  Optimization  Actor-critic  deep reinforcement learning (DRL)  proximal policy optimization (PPO)  shallow reinforcement learning (SRL)  
Self-Organized Routing for Autonomous Vehicles via Deep Reinforcement Learning 期刊论文
IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY, 2024, 卷号: 73, 期号: 1, 页码: 426-437
作者:  Pei, Huaxin;  Zhang, Jiawei;  Zhang, Yi;  Xu, Huile;  Li, Li
收藏  |  浏览/下载:4/0  |  提交时间:2024/07/03
Routing  Autonomous vehicles  Vehicle-to-everything  Vehicle dynamics  Estimation  Automation  Traffic congestion  self-organized  deep reinforcement learning  autonomous vehicle  
DRL-Based Adaptive Sharding for Blockchain-Based Federated Learning 期刊论文
IEEE TRANSACTIONS ON COMMUNICATIONS, 2023, 卷号: 71, 期号: 10, 页码: 5992-6004
作者:  Lin, Yijing;  Gao, Zhipeng;  Du, Hongyang;  Kang, Jiawen;  Niyato, Dusit;  Wang, Qian;  Ruan, Jingqing;  Wan, Shaohua
收藏  |  浏览/下载:2/0  |  提交时间:2024/07/03
Blockchain sharding  federated learning  reputation  deep reinforcement learning  
面向算力网络的智慧调度综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103
作者:  李逸博;  李小平;  王爽;  蒋嶷川
Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:9/5  |  提交时间:2024/07/02
算力网络  云计算  边缘计算  资源调度  知识  
AI资讯 2022年 第12期(总第104期) 其他
2022-12-01
作者:  张桂英
Adobe PDF(5975Kb)  |  收藏  |  浏览/下载:3/2  |  提交时间:2024/07/01
Optimizing Reward Function Weights and Enhancing Control Mechanisms for Bipedal Robots Using LSTM and Attention Mechanisms 会议论文
, 河北保定, 2023-8-16
作者:  Cui LZ(崔凌志);  Tianqi Deng;  Lihua Ma;  Wenhao He
Adobe PDF(541Kb)  |  收藏  |  浏览/下载:16/4  |  提交时间:2024/07/01