CASIA OpenIR

浏览/检索结果: 共5条,第1-5条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:13/4  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
基于文档对话系统中一种参考知识识别新方法 期刊论文
中文信息学报, 2023, 页码: 待见刊
作者:  阮星程;  向露;  宗成庆
Adobe PDF(1007Kb)  |  收藏  |  浏览/下载:130/48  |  提交时间:2023/04/25
参考知识识别  集成式自蒸馏  对话系统  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
一种同伴知识互增强下的序列推荐方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 7, 页码: 1456-1470
作者:  胡开喜;  李琳;  吴小华;  解庆;  袁景凌
Adobe PDF(1990Kb)  |  收藏  |  浏览/下载:4/2  |  提交时间:2024/04/25
序列推荐  动态兴趣  知识蒸馏  刻意训练  
一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文
自动化学报, 2022, 页码: 0
作者:  吴哲;  李凯;  徐航;  兴军亮
Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:184/43  |  提交时间:2022/06/17