已选(0)清除
条数/页: 排序方式: |
| NeuronsMAE: A Novel Multi-Agent Reinforcement Learning Environment for Cooperative and Competitive Multi-Robot Tasks 会议论文 , Queensland, Australia, 2023-6 作者: Hu GZ(胡光政) ; Li HR(李浩然) ; Liu SS(刘莎莎); Zhu YH(朱圆恒) ; Zhao DB(赵冬斌)![](/image/person.jpg)
Adobe PDF(2785Kb)  |   收藏  |  浏览/下载:27/7  |  提交时间:2024/07/04 |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏![](/image/person.jpg)
Adobe PDF(7273Kb)  |   收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 面向多机器人博弈的深度强化学习方法 学位论文 , 2024 作者: 胡光政![](/image/person.jpg)
Adobe PDF(17740Kb)  |   收藏  |  浏览/下载:21/0  |  提交时间:2024/07/04 多智能体深度强化学习 多机器人博弈 极小极大Q学习 值分解 最大熵 |
| 基于强化学习的多无人机协同任务规划技术 学位论文 , 2024 作者: 张梦瑶![](/image/person.jpg)
Adobe PDF(2880Kb)  |   收藏  |  浏览/下载:38/0  |  提交时间:2024/07/04 多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习 |
| Memory-Adaptive Vision-and-Language Navigation 期刊论文 Pattern Recognition, 2024, 卷号: 153, 页码: 110511 作者: Keji He ; Ya Jing ; Yan Huang ; Zhihe Lu ; Dong An ; Liang Wang![](/image/person.jpg)
Adobe PDF(3831Kb)  |   收藏  |  浏览/下载:32/11  |  提交时间:2024/06/26 Vision-and-Language Navigation Memory bank History noises Memory-Adaptive Model |
| Adaptive Multi-Agent Coordination among Different Team Attribute Tasks via Contextual Meta-Reinforcement Learning 会议论文 , 河南开封, 2024年5月17-19日 作者: Huang, Shangjing ; Zhao, Zijie; Zhu, Yuanheng ; Zhao, Dongbin![](/image/person.jpg)
Adobe PDF(15515Kb)  |   收藏  |  浏览/下载:15/6  |  提交时间:2024/06/26 |
| 跨模态信息融合的文本图像翻译方法研究 学位论文 , 2024 作者: 马聪
Adobe PDF(11285Kb)  |   收藏  |  浏览/下载:38/5  |  提交时间:2024/06/26 文本图像翻译 跨模态信息融合 多任务学习 跨模态对比学习 参数高效微调 |
| 数据驱动的可控植物生长环境建模与调控 学位论文 , 2024 作者: 赵晓璇![](/image/person.jpg)
Adobe PDF(4026Kb)  |   收藏  |  浏览/下载:16/0  |  提交时间:2024/06/25 数据驱动 温室气候模型 环境参数 温室气候调控 深度强化学习 |
| Towards Zero-Shot Generalization: Mutual Information-Guided Hierarchical Multi-Agent Coordination 会议论文 , 日本, 2024-6 作者: Zhang Qingyang ; Xu Bo![](/image/person.jpg)
Adobe PDF(8862Kb)  |   收藏  |  浏览/下载:15/5  |  提交时间:2024/06/25 强化学习,分层强化学习 |
| Balancing Exploration and Exploitation in Hierarchical Reinforcement Learning via Latent Landmark Graphs 会议论文 , 澳大利亚, 2023-6 作者: Zhang Qingyang ; Yang Yiming ; Ruan Jingqing; Xiong Xuantang; Xing Dengpeng ; Xu Bo![](/image/person.jpg)
Adobe PDF(7948Kb)  |   收藏  |  浏览/下载:19/7  |  提交时间:2024/06/25 强化学习,分层强化学习 |