CASIA OpenIR

浏览/检索结果: 共6条,第1-6条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:31/7  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:6/2  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
面向多智能体协作的注意力意图与交流学习方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2311-2325
作者:  俞文武;  杨晓亚;  李海昌;  王瑞;  胡晓惠
Adobe PDF(2467Kb)  |  收藏  |  浏览/下载:11/5  |  提交时间:2024/04/18
多智能体  强化学习  意图交流  注意力机制  
基于网络演算的时间敏感网络时延上界分析模型研究 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2297-2310
作者:  胡文学;  孙雷;  王健全;  朱渊;  毕紫航
Adobe PDF(2036Kb)  |  收藏  |  浏览/下载:12/4  |  提交时间:2024/04/18
时间敏感网络  网络演算  时延上界分析模型  门控设置  
生成式对抗网络GAN的研究进展与展望 期刊论文
自动化学报, 2017, 卷号: 43, 期号: 3, 页码: 321¡332
作者:  王坤峰;  苟超;  段艳杰;  林懿伦;  郑心湖;  王飞跃
浏览  |  Adobe PDF(17119Kb)  |  收藏  |  浏览/下载:1966/636  |  提交时间:2018/01/08
生成式对抗网络  生成式模型  零和博弈  对抗学习  平行智能  Acp 方法  
Detecting Objectionable Videos 期刊论文
自动化学报, 2005, 卷号: 31, 期号: 2, 页码: 280-286
作者:  Qian Wang;  Weiming Hu;  Tienu Tan
收藏  |  浏览/下载:99/0  |  提交时间:2017/02/22