CASIA OpenIR

浏览/检索结果: 共1823条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于异配图神经网络的社交机器人检测 学位论文
, 2024
作者:  黄海涛
Adobe PDF(3065Kb)  |  收藏  |  浏览/下载:11/0  |  提交时间:2024/07/08
社交机器人检测  图神经网络  异配性  相容性  图自监督学习  
面向多机器人博弈的深度强化学习方法 学位论文
, 2024
作者:  胡光政
Adobe PDF(17740Kb)  |  收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04
多智能体深度强化学习  多机器人博弈  极小极大Q学习  值分解  最大熵  
Boosting On-Policy Actor-Critic With Shallow Updates in Critic 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 10
作者:  Li, Luntong;  Zhu, Yuanheng
收藏  |  浏览/下载:6/0  |  提交时间:2024/07/03
Artificial neural networks  Vectors  Task analysis  Training  Representation learning  Approximation algorithms  Optimization  Actor-critic  deep reinforcement learning (DRL)  proximal policy optimization (PPO)  shallow reinforcement learning (SRL)  
Synergetic Learning Neuro-Control for Unknown Affine Nonlinear Systems With Asymptotic Stability Guarantees 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2024, 页码: 11
作者:  Zhu, Liao;  Wei, Qinglai;  Guo, Ping
收藏  |  浏览/下载:4/0  |  提交时间:2024/07/03
Approximate dynamic programming (ADP)  neural network  off-policy  optimal control  reinforcement learning (RL)  
双足机器人步态生成的研究 学位论文
, 2024
作者:  崔凌志
Adobe PDF(7077Kb)  |  收藏  |  浏览/下载:24/1  |  提交时间:2024/07/01
请双足机器人控制  混合零动力  轨迹自由强化学习  周期性步态奖励机制  动态步态优化  模型融合策略  
基于脉动阵列的脉冲神经网络专用加速器研究 学位论文
, 2024
作者:  王鹏超
Adobe PDF(6048Kb)  |  收藏  |  浏览/下载:19/1  |  提交时间:2024/06/28
脉冲神经网络  脉动阵列  神经网络加速器  高效存储  
结构启发的神经语义解析方法研究 学位论文
, 2024
作者:  张翔
Adobe PDF(3373Kb)  |  收藏  |  浏览/下载:33/0  |  提交时间:2024/06/26
自然语言理解  神经语义解析  形式化语义表示  组合泛化  
A GAN combined with Graph Contrastive Learning for Traffic Forecasting 会议论文
, New York, 2023-11
作者:  Xu BW(许宝文);  Wang XL(王学雷);  Liu ZJ(刘振杰);  Kang LW(康丽雯)
Adobe PDF(986Kb)  |  收藏  |  浏览/下载:15/7  |  提交时间:2024/06/26
Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文
, 澳大利亚, 2023-6
作者:  Zhang Qingyang;  Yang Yiming;  Ruan Jingqing;  Xiong Xuantang;  Xing Dengpeng;  Xu Bo
Adobe PDF(7948Kb)  |  收藏  |  浏览/下载:19/7  |  提交时间:2024/06/25
强化学习,分层强化学习  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/06/25