CASIA OpenIR

浏览/检索结果: 共14条,第1-10条 帮助

限定条件        
已选(0)清除 条数/页:   排序方式:
基于强化学习的波动鳍推进水下作业机器人悬停控制 期刊论文
控制理论与应用, 2022, 卷号: 39, 期号: 11, 页码: 2022-2099
作者:  马睿宸;  白雪剑;  王宇;  王睿;  王硕
Adobe PDF(5386Kb)  |  收藏  |  浏览/下载:104/42  |  提交时间:2023/08/02
水下作业机器人  悬停控制  波动鳍  神经网络  强化学习  
基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文
模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312
作者:  关伟凡;  张希
Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:118/39  |  提交时间:2023/06/29
强化学习  模仿学习  噪声对比估计  自适应权重  
面向大数据领域的事理认知图谱构建与推断分析 期刊论文
中国科学:信息科学, 2020, 卷号: 50, 期号: 7, 页码: 988–1002
作者:  王军平;  张文生;  王勇飞;  孙正雅
Adobe PDF(7696Kb)  |  收藏  |  浏览/下载:99/38  |  提交时间:2023/05/05
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
作者:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:433/68  |  提交时间:2022/07/12
一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文
自动化学报, 2022, 页码: 0
作者:  吴哲;  李凯;  徐航;  兴军亮
Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:184/43  |  提交时间:2022/06/17
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
作者:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:213/37  |  提交时间:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:266/64  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能  
基于区块链的数字货币发展现状与展望 期刊论文
自动化学报, 2021, 卷号: 47, 期号: 4, 页码: 715-729
作者:  李娟娟
Adobe PDF(918Kb)  |  收藏  |  浏览/下载:221/61  |  提交时间:2021/11/12
区块链  数字货币  技术创新  机制设计  风险监管  
深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文
控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546
作者:  唐振韬;  邵 坤;  赵冬斌;  朱圆恒
Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:218/33  |  提交时间:2021/07/05
深度强化学习  AlphaGo Zero  深度学习  强化学习  人工智能  
一种针对德州扑克AI的对手建模与策略集成框架 期刊论文
自动化学报, 2021, 期号: 0, 页码: 0
作者:  张蒙;  李凯;  吴哲;  臧一凡;  徐航;  兴军亮
Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:353/94  |  提交时间:2021/06/21
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成