CASIA OpenIR

浏览/检索结果: 共8条,第1-8条 帮助

限定条件                    
已选(0)清除 条数/页:   排序方式:
基于预训练语言模型的端到端概念体系构建方法 会议论文
, 中国哈尔滨市, 2023-8-5
作者:  王思懿;  何世柱;  刘康;  赵军
Adobe PDF(794Kb)  |  收藏  |  浏览/下载:6/4  |  提交时间:2024/05/31
D2AH-PPO: Playing ViZDoom With Object-Aware Hierarchical Reinforcement Learning 会议论文
, 中国重庆, 2024.5.7-5.9
作者:  Niu LY(钮龙宇);  Wan J(万军)
Adobe PDF(1645Kb)  |  收藏  |  浏览/下载:12/2  |  提交时间:2024/05/28
深度强化学习  表征学习  分层学习  
Explainable Reinforcement Learning via a Causal World Model 会议论文
Proceedings of the 32nd International Joint Conference on Artificial Intelligence, 中国澳门, 2023-08-22
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(850Kb)  |  收藏  |  浏览/下载:10/4  |  提交时间:2024/05/28
强化学习  可解释人工智能  因果推理  
Learning Causal Dynamics Models in Object-Oriented Environments 会议论文
Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21
作者:  Yu ZY(余忠蔚);  Ruan JQ(阮景晴);  Xing DP(邢登鹏)
Adobe PDF(2176Kb)  |  收藏  |  浏览/下载:8/1  |  提交时间:2024/05/28
强化学习  因果模型  
基于解耦图神经网络的知识图谱表示学习方法 会议论文
, 广西桂林, 2022-7-29
作者:  邵朋朋
Adobe PDF(1639Kb)  |  收藏  |  浏览/下载:61/13  |  提交时间:2023/07/03
基于强化学习和非正交多址接入的车联网无线资源分配 会议论文
, 杭州, 中国, 11月22-24日
作者:  韩双双;  李卓珩;  杨林瑶;  王晓
Adobe PDF(2801Kb)  |  收藏  |  浏览/下载:287/67  |  提交时间:2020/03/18
基于拍卖和边际效益的自主信号交叉口建模方法 会议论文
, China, 2017
作者:  赵伊瑶;  沈震;  张淅鹏;  熊刚;  朱凤华;  刘陶忠
Adobe PDF(811Kb)  |  收藏  |  浏览/下载:303/83  |  提交时间:2017/12/31
Research on ADHDP Based Traffic Signal Control Method 会议论文
Proceedings of The Seventh Chinese Conference on Social Computing, Fuzhou, China, 2015
作者:  Liu, Yu-Liang
Adobe PDF(932Kb)  |  收藏  |  浏览/下载:236/53  |  提交时间:2016/06/27
Adhdp  Traffic Signal Control  Adaptive Control