CASIA OpenIR

浏览/检索结果: 共10条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
重大装备制造多机器人任务分配与运动规划技术研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 21-41
作者:  张振国;  毛建旭;  谭浩然;  王耀南;  张雪波;  江一鸣
Adobe PDF(16325Kb)  |  收藏  |  浏览/下载:4/1  |  提交时间:2024/04/12
重大装备制造  多机器人  任务分配  运动规划  
基于优先采样模型的离线强化学习 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 1, 页码: 143-153
作者:  顾扬;  程玉虎;  王雪松
Adobe PDF(2677Kb)  |  收藏  |  浏览/下载:23/6  |  提交时间:2024/04/12
离线强化学习  优先采样模型  时序差分误差    批约束深度Q学习  
基于深层卷积随机配置网络的电熔镁炉工况识别方法研究 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 3, 页码: 527-543
作者:  李帷韬;  童倩倩;  王殿辉;  吴高昌
Adobe PDF(7244Kb)  |  收藏  |  浏览/下载:12/5  |  提交时间:2024/04/10
电熔镁炉  深层卷积随机配置网络  高斯差分卷积核  类激活映射图  可解释性  
异策略深度强化学习中的经验回放研究综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 11, 页码: 2237-2256
作者:  胡子剑;  高晓光;  万开方;  张乐天;  汪强龙;  NERETINEvgeny
Adobe PDF(4679Kb)  |  收藏  |  浏览/下载:3/1  |  提交时间:2024/04/18
深度强化学习  异策略  经验回放  人工智能  
基于不确定度的多智能体信用分配方法 期刊论文
中国科学院大学学报, 2022, 页码: 0
作者:  杨光开;  陈皓;  张茗奕;  尹奇跃;  黄凯奇
Adobe PDF(1076Kb)  |  收藏  |  浏览/下载:418/64  |  提交时间:2022/07/12
面向Ad-Hoc协作的局部观测重建方法 期刊论文
中国科学院大学学报, 2022, 页码: 1
作者:  陈皓;  杨立昆;  尹奇跃;  黄凯奇
Adobe PDF(1491Kb)  |  收藏  |  浏览/下载:204/36  |  提交时间:2022/06/16
多智能体  深度强化学习  信用分配  Ad-Hoc协作  
知识和数据协同驱动的群体智能决策方法研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 3, 页码: 1-17
作者:  蒲志强;  易建强;  刘振;  丘腾海;  孙金林;  李非墨
Adobe PDF(1352Kb)  |  收藏  |  浏览/下载:254/63  |  提交时间:2022/04/02
群体智能  知识与数据协同  多智能体  决策智能  
一种针对德州扑克AI的对手建模与策略集成框架 期刊论文
自动化学报, 2021, 期号: 0, 页码: 0
作者:  张蒙;  李凯;  吴哲;  臧一凡;  徐航;  兴军亮
Adobe PDF(1354Kb)  |  收藏  |  浏览/下载:342/91  |  提交时间:2021/06/21
不完美信息博弈  德州扑克  演化学习  在线对手建模  种群策略集成  
深度强化学习进展: 从 AlphaGo 到 AlphaGo Zero 期刊论文
控 制 理 论 与 应 用, 2017, 卷号: 34, 期号: 12, 页码: 1529-1546
作者:  唐振韬;  邵 坤;  赵冬斌;  朱圆恒
Adobe PDF(8232Kb)  |  收藏  |  浏览/下载:207/33  |  提交时间:2021/07/05
深度强化学习  AlphaGo Zero  深度学习  强化学习  人工智能  
深度强化学习综述:兼论计算机围棋的发展 期刊论文
控制理论与应用, 2016, 卷号: 33, 期号: 6, 页码: 701-717
作者:  赵冬斌;  邵坤;  朱圆恒;  李栋;  陈亚冉;  王海涛;  刘德荣;  周彤;  王成红
Adobe PDF(2816Kb)  |  收藏  |  浏览/下载:1719/634  |  提交时间:2017/09/13
深度强化学习  初弈号  深度学习  强化学习  人工智能