CASIA OpenIR

浏览/检索结果: 共131条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
PiCor: Multi-Task Deep Reinforcement Learning with Policy Correction 会议论文
Proceedings of the AAAI Conference on Artificial Intelligence, 美国 华盛顿, 2023.02.07 - 2023.02.14
作者:  Bai FS(白丰硕);  Zhang HM(张鸿铭);  Tao TY(陶天阳);  Wu ZH(武志亨);  Wang YN(王燕娜);  Xu B(徐博)
Adobe PDF(1663Kb)  |  收藏  |  浏览/下载:171/38  |  提交时间:2023/07/05
Reinforcement Learning Algorithms  Transfer  Domain Adaptation  Multi-Task Learning  
基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文
模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312
作者:  关伟凡;  张希
Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:125/42  |  提交时间:2023/06/29
强化学习  模仿学习  噪声对比估计  自适应权重  
Potential Driven Reinforcement Learning for Hard Exploration Tasks 会议论文
, 线上, 2020-4
作者:  Zhao EM(赵恩民);  Deng SH(邓诗弘);  Zang YF(臧一凡);  Kang YX(康永欣);  Li K(李凯);  Xing JL(兴军亮)
Adobe PDF(1999Kb)  |  收藏  |  浏览/下载:77/28  |  提交时间:2023/06/29
AlphaHoldem: High-Performance Artificial Intelligence for Heads-Up No-Limit Poker via End-to-End Reinforcement Learning 会议论文
, 线上, 2022-02-22
作者:  Zhao EM(赵恩民);  Yan RY(闫仁业);  Li JQ(李金秋);  Li K(李凯);  Xing JL(兴军亮)
Adobe PDF(2593Kb)  |  收藏  |  浏览/下载:128/52  |  提交时间:2023/06/29
All for Goals: a Stylized Automated Analysis Framework in Football Matches 会议论文
, Gold Coast Convention and Exhibition Centre Queensland, Australia, June 18 - 23, 2023
作者:  Chen M(陈敏);  Pu ZQ(蒲志强);  Pan Y(潘一);  Yi JQ(易建强);  Cui YX(崔一雄);  Lida Du
Adobe PDF(1485Kb)  |  收藏  |  浏览/下载:254/163  |  提交时间:2023/06/28
DiffGAR: Model-Agnostic Restoration from Generative Artifacts Using Image-to-Image Diffusion Models 会议论文
, Beijing, China, 2022-12
作者:  Yin Yueqin;  Huang Lianghua;  Liu Yu;  Huang Kaiqi
Adobe PDF(3116Kb)  |  收藏  |  浏览/下载:123/28  |  提交时间:2023/06/26
datasets  generative modeling  image generation  image restoration  
基于扩散模型的生成图像质量改善方法研究 学位论文
, 2023
作者:  殷月琴
Adobe PDF(28050Kb)  |  收藏  |  浏览/下载:222/6  |  提交时间:2023/06/26
生成模型  图像生成  扩散模型  
Multi-Granularity Pruning for Model Acceleration on Mobile Devices 会议论文
, 线上, 2022-07
作者:  Zhao TL(赵天理);  Zhang X(张希);  Zhu WT(朱文涛);  Wang JX(王家兴);  Yang S(杨森);  Liu J(刘季);  Cheng J(程健)
Adobe PDF(1919Kb)  |  收藏  |  浏览/下载:99/44  |  提交时间:2023/06/21
Deep Neural Networks  Network Pruning  Structured Pruning  Non-structured Pruning  Single Instruction Multiple Data  
Exploration via Joint Policy Diversity for Sparse-Reward Multi-Agent Tasks 会议论文
, Macao, China, 2023-8
作者:  Pei Xu;  Junge Zhang;  Kaiqi Huang
Adobe PDF(1369Kb)  |  收藏  |  浏览/下载:233/74  |  提交时间:2023/06/19
Subspace-Aware Exploration for Sparse-Reward Multi-Agent Tasks 会议论文
, Washington DC, USA, 2023-2-7
作者:  Pei Xu;  Junge Zhang;  Qiyue Yin;  Chao Yu;  Yaodong Yang;  Kaiqi Huang
Adobe PDF(2037Kb)  |  收藏  |  浏览/下载:207/63  |  提交时间:2023/06/19
deep reinforcement learning  sparse reward  exploration  multi-agent