CASIA OpenIR

浏览/检索结果: 共43条,第1-10条 帮助

限定条件    
已选(0)清除 条数/页:   排序方式:
Deep Reinforcement Learning With Part-Aware Exploration Bonus in Video Games 期刊论文
IEEE TRANSACTIONS ON GAMES, 2022, 卷号: 14, 期号: 4, 页码: 644-653
作者:  Xu, Pei;  Yin, Qiyue;  Zhang, Junge;  Huang, Kaiqi
Adobe PDF(1480Kb)  |  收藏  |  浏览/下载:282/70  |  提交时间:2023/02/22
Deep learning  exploration  reinforcement learning  video game  
Dual-discriminator adversarial framework for data-free quantization 期刊论文
NEUROCOMPUTING, 2022, 卷号: 511, 页码: 67-77
作者:  Li, Zhikai;  Ma, Liping;  Long, Xianlei;  Xiao, Junrui;  Gu, Qingyi
Adobe PDF(1512Kb)  |  收藏  |  浏览/下载:290/64  |  提交时间:2022/11/21
Model compression  Quantized neural networks  Data-free quantization  
Dynamic-horizon model-based value estimation with latent imagination 期刊论文
IEEE Transactions on Neural Networks and Learning Systems, 2022, 页码: 1-14
作者:  Wang JJ(王俊杰);  Zhang QC(张启超);  Zhao DB(赵冬斌)
Adobe PDF(2305Kb)  |  收藏  |  浏览/下载:142/55  |  提交时间:2023/05/30
Latent world model  model-based value expansion (MVE)  reinforcement learning  reinforcement learning  
Solving the spike feature information vanishing problem in spiking deep Q network with potential based normalization 期刊论文
FRONTIERS IN NEUROSCIENCE, 2022, 卷号: 16, 页码: 11
作者:  Sun, Yinqian;  Zeng, Yi;  Li, Yang
Adobe PDF(1561Kb)  |  收藏  |  浏览/下载:199/28  |  提交时间:2022/11/14
brain-inspired decision model  SDQN  reinforcement learning  potential normalization  spiking activity  
Second-Order Global Attention Networks for Graph Classification and Regression 会议论文
, Beijing, China, August 27-28, 2022
作者:  Hu Fenyu;  Cui Zeyu;  Wu Shu;  Liu Qiang;  Wu Jinlin;  Wang Liang;  Tan Tieniu
Adobe PDF(69424Kb)  |  收藏  |  浏览/下载:174/67  |  提交时间:2023/07/06
Learning adversarial point-wise domain alignment for stereo matching 期刊论文
NEUROCOMPUTING, 2022, 卷号: 491, 页码: 564-574
作者:  Zhang, Chenghao;  Meng, Gaofeng;  Xu, Richard Yi Da;  Xiang, Shiming;  Pan, Chunhong
Adobe PDF(3885Kb)  |  收藏  |  浏览/下载:251/48  |  提交时间:2022/09/19
Stereo Matching  Domain adaptation  Point-wise linear transformation  Adversarial learning  
非线性系统自学习优化平行控制方法研究 学位论文
, 北京: 中国科学院大学人工智能学院, 2022
作者:  卢经纬
Adobe PDF(18672Kb)  |  收藏  |  浏览/下载:209/13  |  提交时间:2022/06/15
优化控制  平行控制  自适应动态规划  强化学习  非线性系统  
两人零和博弈中的对抗学习与适应算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  吴哲
Adobe PDF(6758Kb)  |  收藏  |  浏览/下载:186/5  |  提交时间:2022/06/17
机器博弈  两人零和博弈  纳什均衡  对手建模  元学习  
从视频到语言:视频描述和标题生成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022
作者:  张子琦
Adobe PDF(19170Kb)  |  收藏  |  浏览/下载:1120/14  |  提交时间:2022/06/16
视觉与语言  视频内容描述  视频标题生成  外部语言模型  开卷视频描述  中文短视频-文本基准  大规模多模态预训练  
基于自适应动态规划的分布式迭代控制方法研究 学位论文
工学博士, 人工智能学院: 中国科学院大学, 2022
作者:  李洪阳
Adobe PDF(3786Kb)  |  收藏  |  浏览/下载:265/25  |  提交时间:2022/06/14
自适应动态规划,最优控制,分布式控制,智能控制,强化学习