已选(0)清除
条数/页: 排序方式: |
| 基于强化学习的波动鳍推进水下作业机器人悬停控制 期刊论文 控制理论与应用, 2022, 卷号: 39, 期号: 11, 页码: 2022-2099 作者: 马睿宸; 白雪剑; 王宇; 王睿; 王硕 Adobe PDF(5386Kb)  |  收藏  |  浏览/下载:104/42  |  提交时间:2023/08/02 水下作业机器人 悬停控制 波动鳍 神经网络 强化学习 |
| 基于噪声对比估计的权重自适应对抗生成式模仿学习 期刊论文 模式识别与人工智能, 2023, 卷号: 36, 期号: 4, 页码: 300-312 作者: 关伟凡; 张希 Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:118/39  |  提交时间:2023/06/29 强化学习 模仿学习 噪声对比估计 自适应权重 |
| 面向大数据领域的事理认知图谱构建与推断分析 期刊论文 中国科学:信息科学, 2020, 卷号: 50, 期号: 7, 页码: 988–1002 作者: 王军平; 张文生; 王勇飞; 孙正雅 Adobe PDF(7696Kb)  |  收藏  |  浏览/下载:99/38  |  提交时间:2023/05/05 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:433/68  |  提交时间:2022/07/12 |
| 一种用于两人零和博弈对手适应的元策略演化学习算法 期刊论文 自动化学报, 2022, 页码: 0 作者: 吴哲; 李凯; 徐航; 兴军亮 Adobe PDF(15953Kb)  |  收藏  |  浏览/下载:184/43  |  提交时间:2022/06/17 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:213/37  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强; 易建强; 刘振; 丘腾海; 孙金林; 李非墨 Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:266/64  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |
| 基于区块链的数字货币发展现状与展望 期刊论文 自动化学报, 2021, 卷号: 47, 期号: 4, 页码: 715-729 作者: 李娟娟 Adobe PDF(918Kb)  |  收藏  |  浏览/下载:221/61  |  提交时间:2021/11/12 区块链 数字货币 技术创新 机制设计 风险监管 |
| 深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文 控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546 作者: 唐振韬; 邵 坤; 赵冬斌; 朱圆恒 Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:218/33  |  提交时间:2021/07/05 深度强化学习 AlphaGo Zero 深度学习 强化学习 人工智能 |
| 一种针对德州扑克AI的对手建模与策略集成框架 期刊论文 自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙; 李凯; 吴哲; 臧一凡; 徐航; 兴军亮 Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:353/94  |  提交时间:2021/06/21 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |