CASIA OpenIR

浏览/检索结果: 共29条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于表征学习的离线强化学习方法研究综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 6, 页码: 1104-1128
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(3333Kb)  |  收藏  |  浏览/下载:21/12  |  提交时间:2024/07/02
强化学习  离线强化学习  表征学习  历史经验数据  分布偏移  
动态资讯 2018年 第07期(总第51期) 其他
2018-07-01
作者:  张桂英
Adobe PDF(2454Kb)  |  收藏  |  浏览/下载:12/7  |  提交时间:2024/07/01
基于深度强化学习的大规模群体智能决策方法研究 学位论文
, 2024
作者:  付清旭
Adobe PDF(39071Kb)  |  收藏  |  浏览/下载:64/6  |  提交时间:2024/05/29
大规模,群体系统,协同,决策,深度强化学习,多智能体系统  
面向边缘计算平台的轻量级目标检测模型研究 学位论文
, 2024
作者:  李凯豪
Adobe PDF(8620Kb)  |  收藏  |  浏览/下载:68/3  |  提交时间:2024/05/27
深度学习  目标检测  模型轻量化  知识蒸馏  模型剪枝  
基于形态的具身智能研究:历史回顾与前沿进展 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 6, 页码: 1131-1154
作者:  刘华平;  郭迪;  孙富春;  张新钰
Adobe PDF(55262Kb)  |  收藏  |  浏览/下载:58/11  |  提交时间:2024/05/09
具身智能  形态智能  形态计算  形态控制  形态-控制协同优化  
面向复杂工业过程的虚拟样本生成综述 期刊论文
自动化学报, 2024, 卷号: 50, 期号: 4, 页码: 688-718
作者:  汤健;  崔璨麟;  夏恒;  乔俊飞
Adobe PDF(2984Kb)  |  收藏  |  浏览/下载:35/13  |  提交时间:2024/04/28
复杂工业过程  虚拟样本生成  数据驱动建模  样本覆盖区域  
数据驱动的间歇低氧训练贝叶斯优化决策方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 8, 页码: 1667-1678
作者:  陈婧;  史大威;  蔡德恒;  王军政;  朱玲玲
Adobe PDF(6031Kb)  |  收藏  |  浏览/下载:55/19  |  提交时间:2024/04/24
数据驱动控制  高斯过程  贝叶斯优化  风险不对称代价函数  高原适应能力提升  间歇性低氧训练  
面向智能血糖管理的餐前胰岛素剂量贝叶斯学习优化方法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1915-1927
作者:  史大威;  蔡德恒;  刘蔚;  王军政;  纪立农
Adobe PDF(13291Kb)  |  收藏  |  浏览/下载:82/27  |  提交时间:2024/04/24
餐前剂量决策  数据驱动建模  贝叶斯优化  临床经验  临床数据验证  
安全强化学习综述 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1813-1835
作者:  王雪松;  王荣荣;  程玉虎
Adobe PDF(1356Kb)  |  收藏  |  浏览/下载:69/30  |  提交时间:2024/04/24
安全强化学习  约束马尔科夫决策过程  学习过程  学习目标  离线强化学习  
面向复杂工业过程的贝叶斯优化方法研究与应用 学位论文
, 2023
作者:  康丽雯
Adobe PDF(3974Kb)  |  收藏  |  浏览/下载:118/3  |  提交时间:2023/06/26
复杂工业过程  贝叶斯优化  深度高斯过程  多目标优化