CASIA OpenIR

浏览/检索结果: 共28条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
基于用户行为预测和强化学习的推荐策略研究 学位论文
, 2024
作者:  张志远
Adobe PDF(3505Kb)  |  收藏  |  浏览/下载:26/1  |  提交时间:2024/06/25
强化学习  推荐系统  用户行为建模  
类脑心理揣测脉冲神经网络模型研究 学位论文
, 2024
作者:  Zhao,Zhuoya
Adobe PDF(23946Kb)  |  收藏  |  浏览/下载:30/2  |  提交时间:2024/06/04
类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  类脑心理揣测模型  脉冲神经网络  多智能体社会交互  区分自我和他人  
表示增强的深度强化学习算法研究 学位论文
, 2024
作者:  张清扬
Adobe PDF(37765Kb)  |  收藏  |  浏览/下载:93/7  |  提交时间:2024/06/04
请输入关键词深度强化学习,表示学习,分层强化学习,多智能体强化学习,大型语言模型  
多智能体强化学习预训练方法研究 学位论文
, 2024
作者:  孟令辉
Adobe PDF(6367Kb)  |  收藏  |  浏览/下载:70/6  |  提交时间:2024/05/28
多智能体强化学习  预训练方法  神经网络  表示学习  在线强化评估  
兵棋推演的智能决策技术与挑战 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 5, 页码: 913-928
作者:  尹奇跃;  赵美静;  倪晚成;  张俊格;  黄凯奇
Adobe PDF(4513Kb)  |  收藏  |  浏览/下载:74/26  |  提交时间:2024/05/09
兵棋推演  人机对抗  智能决策技术  博弈学习  
单目标跟踪中的智能评估技术研究 学位论文
, 2023
作者:  胡世宇
Adobe PDF(33423Kb)  |  收藏  |  浏览/下载:157/6  |  提交时间:2024/01/19
单目标跟踪  智能评估技术  视觉跟踪能力  实验环境  评估平台  
基于A-HPSO算法的无人机集群协同目标分配 期刊论文
计算机仿真, 2023, 页码: 10
作者:  沈越;  范国梁;  李丽娟
Microsoft Word(574Kb)  |  收藏  |  浏览/下载:227/61  |  提交时间:2023/06/29
粒子群算法  混合粒子群算法  自打散混合粒子群算法  无人机集群协同目标分配  
An Improved WPA Based on RHC Method and 2D-equal-step Path Generation Method is Proposed for Solving the Single UAV Online Path Planning Problem in Dynamic Mission Environment 会议论文
, 北京, 2023.4.14-2023.4.16
作者:  Shen Y(沈越);  Fan GL(范国梁)
Microsoft Word(12853Kb)  |  收藏  |  浏览/下载:151/54  |  提交时间:2023/06/29
WPA  Improved WPA  RHC  2D-equal-step path generation  
复杂对抗条件下对手意图识别关键技术研究 学位论文
, 2023
作者:  徐佳乐
Adobe PDF(3048Kb)  |  收藏  |  浏览/下载:252/10  |  提交时间:2023/06/28
不完美信息博弈  多智能体策略博弈  对手意图识别  知识与数据融合  事件图态势建模  
Exploration via Joint Policy Diversity for Sparse-Reward Multi-Agent Tasks 会议论文
, Macao, China, 2023-8
作者:  Pei Xu;  Junge Zhang;  Kaiqi Huang
Adobe PDF(1369Kb)  |  收藏  |  浏览/下载:289/91  |  提交时间:2023/06/19