CASIA OpenIR

浏览/检索结果: 共37条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
Learning State-Specific Action Masks for Reinforcement Learning 期刊论文
Algorithms, 2024, 卷号: 17, 期号: 2, 页码: 60
作者:  Wang ZY(王梓薏);  Li XR(李欣然);  Sun LY(孙罗洋);  Zhang HF(张海峰);  Liu HL(刘华林);  Jun Wang
Adobe PDF(2976Kb)  |  收藏  |  浏览/下载:17/7  |  提交时间:2024/07/05
reinforcement learning  exploration efficiency  space reduction  
Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文
Machine Intelligence Research, 2023, 页码: 158
作者:  Zhang Qingyang;  Zhang Hongming;  Xing Dengpeng;  Bo Xu
Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:14/7  |  提交时间:2024/06/25
基于跨模态深度度量学习的甲骨文字识别 期刊论文
自动化学报, 2021, 页码: 791−800
作者:  张颐康;  张恒;  刘永革;  刘成林
Adobe PDF(1501Kb)  |  收藏  |  浏览/下载:14/4  |  提交时间:2024/06/24
Invisible Intruders: Label-Consistent Backdoor Attack using Re-parameterized Noise Trigger 期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2021, 卷号: 14, 期号: 8, 页码: 1-13
作者:  Bo Wang;  Fei Yu;  Fei Wei;  Yi Li;  Wei Wang
Adobe PDF(1364Kb)  |  收藏  |  浏览/下载:39/13  |  提交时间:2024/06/21
Learning Heterogeneous Agent Cooperation via Multiagent League Training 期刊论文
IFAC World Congress, 2023, 页码: IFAC PapersOnLine 56-2 (2023) 3033-3040
作者:  Qingxu, Fu;  Xiaolin Ai;  Jianqiang Yi;  Tenghai Qiu;  Wanmai Yuan;  Zhiqiang Pu
Adobe PDF(996Kb)  |  收藏  |  浏览/下载:31/9  |  提交时间:2024/06/05
Learning Multi-Resolution Features for Unsupervised Anomaly Localization on Industrial Textured Surfaces 期刊论文
IEEE Transactions on Artificial Intelligence, 2024, 页码: 1-13
作者:  Tao X(陶显);  Shaohua Yan;  Xinyi Gong;  Chandranath Adak
Adobe PDF(6034Kb)  |  收藏  |  浏览/下载:32/9  |  提交时间:2024/06/04
基于深度学习的群组推荐方法研究综述 期刊论文
自动化学报, 2024, 页码: 1-22
作者:  郑楠;  章颂;  刘玉桥;  王雨桐;  王飞跃
Adobe PDF(1984Kb)  |  收藏  |  浏览/下载:79/41  |  提交时间:2024/06/03
Learning Playing Piano with Bionic-Constrained Diffusion Policy for Anthropomorphic Hand 期刊论文
Cyborg and Bionic Systems, 2024, 卷号: 5, 页码: 0104
作者:  Yang YM(杨依明);  Wang ZC(王泽昌);  Xing DP(邢登鹏);  Wang P(王鹏)
Adobe PDF(3500Kb)  |  收藏  |  浏览/下载:26/10  |  提交时间:2024/05/30
Human-robot object handover: Recent progress and future direction 期刊论文
Biomimetic Intelligence and Robotics, 2024, 卷号: 4, 页码: 100145
作者:  Duan, Haonan;  Yang, Yifan;  Li, Daheng;  Wang, Peng
Adobe PDF(1839Kb)  |  收藏  |  浏览/下载:37/13  |  提交时间:2024/05/29
Human–robot interactions  Object handover  
基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文
模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312
作者:  关伟凡;  张希
Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:135/46  |  提交时间:2023/06/29
强化学习  模仿学习  噪声对比估计  自适应权重