CASIA OpenIR

浏览/检索结果: 共3条,第1-3条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
博弈对抗环境中智能策略研究 学位论文
工学博士, 北京: 中国科学院自动化研究所, 2021
作者:  唐振韬
Adobe PDF(23513Kb)  |  收藏  |  浏览/下载:664/17  |  提交时间:2021/07/14
深度强化学习  统计前向规划  策略博弈  智能决策  游戏人工智能  
面向非平稳环境的知识迁移方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  李怀宇
Adobe PDF(13633Kb)  |  收藏  |  浏览/下载:268/10  |  提交时间:2020/06/11
元学习  持续学习  知识迁移  灾难遗忘  生成式对抗网络  
机器人持续性策略学习算法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  熊方舟
Adobe PDF(3642Kb)  |  收藏  |  浏览/下载:350/18  |  提交时间:2020/06/09
持续学习  策略学习  机器人  灾难性遗忘  状态基元