CASIA OpenIR

Browse/Search Results:  1-10 of 307 Help

Selected(0)Clear Items/Page:    Sort:
Learning Control for Air Conditioning Systems via Human Expressions 期刊论文
IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS, 2021, 卷号: 68, 期号: 8, 页码: 7662-7671
Authors:  Wei, Qinglai;  Li, Tao;  Liu, Derong
Favorite  |  View/Download:16/0  |  Submit date:2021/06/15
Adaptive dynamic programming  air conditioning control  deep learning (DL)  deep Q-network (DQN)  human expressions  optimal control  reinforcement learning (RL)  Q-learning  
Multi-Agent Cognition Difference Reinforcement Learning for MultiAgent Cooperation 会议论文
, 线上, 2021-07
Authors:  Huimu, Wang;  Tenghai, Qiu;  Zhen, Liu;  Zhiqiang, Pu;  Jianqiang, Yi;  Wanmai Yuan
Adobe PDF(478Kb)  |  Favorite  |  View/Download:39/1  |  Submit date:2021/06/24
基于演化学习与对手策略的不完美信息博弈算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  张蒙
Adobe PDF(2515Kb)  |  Favorite  |  View/Download:103/1  |  Submit date:2021/06/20
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成  
Discrete-Time Non-Zero-Sum Games With Completely Unknown Dynamics 期刊论文
IEEE TRANSACTIONS ON CYBERNETICS, 2021, 卷号: 51, 期号: 6, 页码: 2929-2943
Authors:  Song, Ruizhuo;  Wei, Qinglai;  Zhang, Huaguang;  Lewis, Frank L.
Favorite  |  View/Download:5/0  |  Submit date:2021/08/15
Adaptive critic designs  adaptive dynamic programming  approximate dynamic programming  discrete-time  nonzero-sum (NZS)  off-policy  reinforcement learning (RL)  
基于视觉构图建模的图像编辑问题研究 学位论文
工学博士, 中国科学院自动化研究所: 中国科学院大学, 2021
Authors:  李德榜
Adobe PDF(43095Kb)  |  Favorite  |  View/Download:47/3  |  Submit date:2021/05/31
视觉构图建模  图像编辑  视觉美感  图像裁剪  图像子区域推荐  
基于演示示教的机器人技能模仿学习 学位论文
, 智能化大厦: 中科院自动化所, 2021
Authors:  夏鹏程
Adobe PDF(16930Kb)  |  Favorite  |  View/Download:43/4  |  Submit date:2021/06/18
演示示教  域自适应  轨迹模仿  深度强化学习  
一种基于规则迭代的无人车自学习控制方法 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院大学, 2021
Authors:  张力夫
Adobe PDF(3356Kb)  |  Favorite  |  View/Download:24/1  |  Submit date:2021/06/27
无人车控制  自主学习  规则提取  规则迭代  
基于值分解优化的多智能体深度强化学习方法研究 学位论文
工程硕士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  王凌霄
Adobe PDF(13415Kb)  |  Favorite  |  View/Download:28/2  |  Submit date:2021/06/15
深度强化学习  多智能体系统  价值函数分解算法  图神经网络  
基于多智能体强化学习的城市道路交通信号控制 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2021
Authors:  刘皓
Adobe PDF(4749Kb)  |  Favorite  |  View/Download:54/1  |  Submit date:2021/07/02
交通信号控制  强化学习  多智能体  车联网  
Improving One-Shot NAS with Shrinking-and-Expanding Supernet 期刊论文
Pattern Recognition, 2021, 卷号: 118, 期号: 0, 页码: 0
Authors:  Hu YM(胡一鸣)
Adobe PDF(1755Kb)  |  Favorite  |  View/Download:24/3  |  Submit date:2021/06/18
Neural architecture search  supernet  Search space shrinking