CASIA OpenIR

浏览/检索结果: 共339条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
A Bio-Inspired Integration Model of Basal Ganglia and Cerebellum for Motion Learning of a Musculoskeletal Robot 期刊论文
JOURNAL OF SYSTEMS SCIENCE & COMPLEXITY, 2024, 卷号: 37, 期号: 1, 页码: 82-113
作者:  Zhang, Jinhan;  Chen, Jiahao;  Zhong, Shanlin;  Qiao, Hong
收藏  |  浏览/下载:0/0  |  提交时间:2024/07/03
Basal ganglia and cerebellum  bio-inspired integration model  motion learning  muscu-loskeletal robot  reinforcement learning  
知识和数据驱动的污水处理反硝化脱氮过程协同优化控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1221-1233
作者:  韩红桂;  王玉爽;  刘峥;  孙浩源;  乔俊飞
Adobe PDF(3356Kb)  |  收藏  |  浏览/下载:8/4  |  提交时间:2024/07/02
污水处理反硝化脱氮过程  知识和数据驱动  协同优化控制  自适应知识核函数  知识引导的协同优化算法  
自适应分布式聚合博弈广义纳什均衡算法 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1210-1220
作者:  时侠圣;  任璐;  孙长银
Adobe PDF(1595Kb)  |  收藏  |  浏览/下载:7/3  |  提交时间:2024/07/02
聚合博弈  自适应  比例积分  梯度跟踪  一般线性多智能体系统  
基于自组织递归小波神经网络的污水处理过程多变量控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1199-1209
作者:  苏尹;  杨翠丽;  乔俊飞
Adobe PDF(3815Kb)  |  收藏  |  浏览/下载:5/3  |  提交时间:2024/07/02
神经网络控制  污水处理过程  自组织机制  多变量控制  
高超声速飞行器指定时间时变高增益反馈跟踪控制 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1151-1159
作者:  张康康;  周彬;  蔡光斌;  侯明哲
Adobe PDF(1479Kb)  |  收藏  |  浏览/下载:5/3  |  提交时间:2024/07/02
高超声速飞行器  指定时间控制  时变反馈  高增益反馈  非线性控制  
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
面向算力网络的智慧调度综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1086-1103
作者:  李逸博;  李小平;  王爽;  蒋嶷川
Adobe PDF(1752Kb)  |  收藏  |  浏览/下载:4/3  |  提交时间:2024/07/02
算力网络  云计算  边缘计算  资源调度  知识  
Optimizing Reward Function Weights and Enhancing Control Mechanisms for Bipedal Robots Using LSTM and Attention Mechanisms 会议论文
, 河北保定, 2023-8-16
作者:  Cui LZ(崔凌志);  Tianqi Deng;  Lihua Ma;  Wenhao He
Adobe PDF(541Kb)  |  收藏  |  浏览/下载:7/1  |  提交时间:2024/07/01
双足机器人步态生成的研究 学位论文
, 2024
作者:  崔凌志
Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:14/1  |  提交时间:2024/07/01
请双足机器人控制  混合零动力  轨迹自由强化学习  周期性步态奖励机制  动态步态优化  模型融合策略