已选(0)清除
条数/页: 排序方式: |
| 重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41 作者: 张振国; 毛建旭; 谭浩然; 王耀南; 张雪波; 江一鸣 Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/04/12 重大装备制造 多机器人 任务分配 运动规划 |
| 基于优先采样模型的离线强化学习 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153 作者: 顾扬; 程玉虎; 王雪松 Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/04/12 离线强化学习 优先采样模型 时序差分误差 鞅 批约束深度Q学习 |
| 基于深层卷积随机配置网络的电熔镁炉工况识别方法研究 期刊论文 自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 527-543 作者: 李帷韬; 童倩倩; 王殿辉; 吴高昌 Adobe PDF(7244Kb)  |  收藏  |  浏览/下载:12/5  |  提交时间:2024/04/10 电熔镁炉 深层卷积随机配置网络 高斯差分卷积核 类激活映射图 可解释性 |
| 异策略深度强化学习中的经验回放研究综述 期刊论文 自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256 作者: 胡子剑; 高晓光; 万开方; 张乐天; 汪强龙; NERETINEvgeny Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/18 深度强化学习 异策略 经验回放 人工智能 |
| 基于不确定度的多智能体信用分配方法 期刊论文 中国科学院大学学报, 2022, 页码: 0 作者: 杨光开; 陈皓; 张茗奕; 尹奇跃; 黄凯奇 Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:418/64  |  提交时间:2022/07/12 |
| 面向Ad-Hoc协作的局部观测重建方法 期刊论文 中国科学院大学学报, 2022, 页码: 1 作者: 陈皓; 杨立昆; 尹奇跃; 黄凯奇 Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:204/36  |  提交时间:2022/06/16 多智能体 深度强化学习 信用分配 Ad-Hoc协作 |
| 知识和数据协同驱动的群体智能决策方法研究综述 期刊论文 自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17 作者: 蒲志强; 易建强; 刘振; 丘腾海; 孙金林; 李非墨 Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:254/63  |  提交时间:2022/04/02 群体智能 知识与数据协同 多智能体 决策智能 |
| 一种针对德州扑克AI的对手建模与策略集成框架 期刊论文 自动化学报, 2021, 期号: 0, 页码: 0 作者: 张蒙; 李凯; 吴哲; 臧一凡; 徐航; 兴军亮 Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:342/91  |  提交时间:2021/06/21 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成 |
| 深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文 控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546 作者: 唐振韬; 邵 坤; 赵冬斌; 朱圆恒 Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:207/33  |  提交时间:2021/07/05 深度强化学习 AlphaGo Zero 深度学习 强化学习 人工智能 |
| 深度强化学习综述:兼论计算机围棋的发展 期刊论文 控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717 作者: 赵冬斌; 邵坤; 朱圆恒; 李栋; 陈亚冉; 王海涛; 刘德荣; 周彤; 王成红 Adobe PDF(2816Kb)  |  收藏  |  浏览/下载:1719/634  |  提交时间:2017/09/13 深度强化学习 初弈号 深度学习 强化学习 人工智能 |