CASIA OpenIR

Browse/Search Results:  1-10 of 428 Help

Selected(0)Clear Items/Page:    Sort:
Offline reinforcement learning with representations for actions 期刊论文
INFORMATION SCIENCES, 2022, 卷号: 610, 页码: 746-758
Authors:  Lou, Xingzhou;  Yin, Qiyue;  Zhang, Junge;  Yu, Chao;  He, Zhaofeng;  Cheng, Nengjie;  Huang, Kaiqi
Favorite  |  View/Download:4/0  |  Submit date:2022/11/14
Offline reinforcement learning  Action embedding  
Solving the spike feature information vanishing problem in spiking deep Q network with potential based normalization 期刊论文
FRONTIERS IN NEUROSCIENCE, 2022, 卷号: 16, 页码: 11
Authors:  Sun, Yinqian;  Zeng, Yi;  Li, Yang
Favorite  |  View/Download:4/0  |  Submit date:2022/11/14
brain-inspired decision model  SDQN  reinforcement learning  potential normalization  spiking activity  
平行交通系统中的预测与控制关键技术研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  戴星原
Adobe PDF(14868Kb)  |  Favorite  |  View/Download:69/6  |  Submit date:2022/10/09
平行交通系统  交通预测  交通控制  深度学习  强化学习  
Multimodal Unknown Surface Material Classification and Its Application to Physical Reasoning 期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, 2022, 卷号: 18, 期号: 7, 页码: 4406-4416
Authors:  Wei, Junhang;  Cui, Shaowei;  Hu, Jingyi;  Hao, Peng;  Wang, Shuo;  Lou, Zheng
Adobe PDF(3954Kb)  |  Favorite  |  View/Download:63/9  |  Submit date:2022/06/10
Robots  Convolutional neural networks  Visualization  Informatics  Feature extraction  Task analysis  Haptic interfaces  Auditory and haptic information  deep learning  multimodal fusion  physical reasoning  unknown surface material classification (USMC)  
面向医疗场景的对话理解与生成方法研究 学位论文
博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  李梅
Adobe PDF(4843Kb)  |  Favorite  |  View/Download:102/8  |  Submit date:2022/06/30
自然语言处理  
Dynamic Event-Sampled Control of Interconnected Nonlinear Systems Using Reinforcement Learning 期刊论文
IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, 2022, 页码: 15
Authors:  Yang, Xiong;  Xu, Mengmeng;  Wei, Qinglai
Favorite  |  View/Download:38/0  |  Submit date:2022/07/25
Asymptotic stability  Interconnected systems  Decentralized control  Closed loop systems  Artificial neural networks  Optimal control  Nonlinear dynamical systems  Adaptive dynamic programming (ADP)  decentralized control  event-based control  interconnected system  reinforcement learning (RL)  
对抗场景中的智能体策略泛化研究 学位论文
工学硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  陈皓
Adobe PDF(13782Kb)  |  Favorite  |  View/Download:68/3  |  Submit date:2022/06/16
深度强化学习  多智能体  策略泛化  Ad-Hoc 协作  信用分配  
基于深度强化学习的群体协同决策方法研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  吴士广
Adobe PDF(14260Kb)  |  Favorite  |  View/Download:137/12  |  Submit date:2022/06/15
群体系统  协同决策  深度强化学习  多智能体强化学习  图注意力网络  
面向速度滑冰的智能分析及决策技术研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  杨威
Adobe PDF(4891Kb)  |  Favorite  |  View/Download:63/1  |  Submit date:2022/06/13
速度滑冰  智能分析  深度强化学习  战术决策  
网络结构搜索方法及其在气象预测中的应用研究 学位论文
工学博士学位, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
Authors:  张新邦
Adobe PDF(8827Kb)  |  Favorite  |  View/Download:86/2  |  Submit date:2022/07/01
网络结构搜索  自动机器学习  深度学习  气象预测  时空数据挖掘