已选(0)清除
条数/页: 排序方式: |
| 基于强化学习动作空间精简的时序决策任务算法研究 学位论文 , 2024 作者: 王梓薏 Adobe PDF(7273Kb)  |  收藏  |  浏览/下载:30/1  |  提交时间:2024/07/04 时序决策 强化学习 动作空间约简 分层强化学习 动作掩码 |
| 基于强化学习的多无人机协同任务规划技术 学位论文 , 2024 作者: 张梦瑶 Adobe PDF(2880Kb)  |  收藏  |  浏览/下载:37/0  |  提交时间:2024/07/04 多无人机协同作战 任务规划 图神经网络 多旅行商问题 强化学习 |
| Optimizing Reward Function Weights and Enhancing Control Mechanisms for Bipedal Robots Using LSTM and Attention Mechanisms 会议论文 , 河北保定, 2023-8-16 作者: Cui LZ(崔凌志); Tianqi Deng; Lihua Ma; Wenhao He Adobe PDF(541Kb)  |  收藏  |  浏览/下载:16/4  |  提交时间:2024/07/01 |
| Autonomy Evaluation of Unmanned Systems Based on Task Models 期刊论文 Machine Intelligence Research, 2024, 页码: 1-16 作者: Yi Zou; Zehao Ni; Xun Lei; Chi Zhang Adobe PDF(1801Kb)  |  收藏  |  浏览/下载:29/8  |  提交时间:2024/06/27 |
| 基于多模态表征学习与融合的情感识别研究 学位论文 , 2024 作者: 孙立才 Adobe PDF(5844Kb)  |  收藏  |  浏览/下载:35/4  |  提交时间:2024/06/27 情感识别 表征学习 自监督学习 多模态融合 注意力机制 |
| 自然语言嵌入的深度强化学习探索方法研究 学位论文 , 2024 作者: 郭洲蕊 Adobe PDF(7588Kb)  |  收藏  |  浏览/下载:31/1  |  提交时间:2024/06/26 深度强化学习 自然语言 探索 |
| Fourier U-Shaped Network for Multi-Variate Time Series Forecasting 会议论文 , Mexico City, Mexico, 2023-11 作者: Xu BW(许宝文); Wang XL(王学雷); Liu CB(刘承宝); Li S(李铄) Adobe PDF(770Kb)  |  收藏  |  浏览/下载:18/8  |  提交时间:2024/06/26 |
| Latent Landmark Graph for Efficient Exploration-Exploitation Balance in Hierarchical Reinforcement Learning 期刊论文 Machine Intelligence Research, 2023, 页码: 158 作者: Zhang Qingyang; Zhang Hongming; Xing Dengpeng; Bo Xu Adobe PDF(9639Kb)  |  收藏  |  浏览/下载:13/6  |  提交时间:2024/06/25 |
| 基于视觉-语言引导的机器人导航研究 学位论文 , 2024 作者: 何科技 Adobe PDF(29796Kb)  |  收藏  |  浏览/下载:57/5  |  提交时间:2024/06/25 视觉语言导航、数据稀缺、时序信息挖掘噪声、跨模态对齐、异常行为 |
| User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文 , 新加坡, May 13 - 17, 2024 作者: Zhang, Zhiyuan; Zhang, Qichao; Wu, Xiaoxu; Shi, Xiaowen; Liao, Guogang; Wang, Yongkong; Wang, xingxing; Zhao, Dongbin Adobe PDF(2077Kb)  |  收藏  |  浏览/下载:21/8  |  提交时间:2024/06/25 Ads Allocation Reinforcement Learning User Response Modeling |