CASIA OpenIR

浏览/检索结果: 共87条,第1-10条 帮助

限定条件                
已选(0)清除 条数/页:   排序方式:
Reward Estimation with Scheduled Knowledge Distillation for Dialogue Policy Learning 期刊论文
Connection Science, 2023, 卷号: 35, 期号: 1, 页码: 2174078
作者:  Qiu JY(邱俊彦);  Haidong Zhang;  Yiping Yang
Adobe PDF(831Kb)  |  收藏  |  浏览/下载:52/19  |  提交时间:2024/05/29
reinforcement learning  dialogue policy learning  curriculum learning  knowledge distillation  
Active Impact Motion for a Quadruped Robot 会议论文
, Hong Kong, China, 20-21 August 2020
作者:  Shang LL(尚琳琳);  Wang Wei;  Yi Jianqianng
Adobe PDF(1147Kb)  |  收藏  |  浏览/下载:185/60  |  提交时间:2022/06/23
A Hybrid Multiagent Collision Avoidance Method for Formation Control 会议论文
, Shenyang, China, Aug. 8-11, 2019
作者:  Sui Zezhi;  Pu Zhiqiang;  Yi Jianqiang;  Xiong Tianyi
浏览  |  Adobe PDF(776Kb)  |  收藏  |  浏览/下载:244/90  |  提交时间:2020/07/08
Formation Control with Collision Avoidance through Deep Reinforcement Learning 会议论文
, Budapest, Hungary, Hungary, July 14-19, 2019
作者:  Sui Zezhi;  Pu Zhiqiang;  Yi Jianqiang;  Xiong Tianyi
浏览  |  Adobe PDF(2431Kb)  |  收藏  |  浏览/下载:258/84  |  提交时间:2020/07/08
Path Planning of Multiagent Constrained Formation through Deep Reinforcement Learning 会议论文
, Rio de Janeiro, Brazil, July 8-13, 2018
作者:  Sui Zezhi;  Pu Zhiqiang;  Yi Jianqiang;  Tan Xiangmin
浏览  |  Adobe PDF(1849Kb)  |  收藏  |  浏览/下载:236/57  |  提交时间:2020/07/08
Optimal UAVs formation transformation strategy based on task assignment and Particle Swarm Optimization 会议论文
, Takamatsu, Japan, Aug 6-9, 2017
作者:  Sui Zezhi;  Pu Zhiqiang;  Yi Jianqiang
浏览  |  Adobe PDF(1500Kb)  |  收藏  |  浏览/下载:228/73  |  提交时间:2020/07/08
多机器人编队协同路径规划方法研究 学位论文
工学博士, 北京: 中国科学院大学, 2020
作者:  眭泽智
Adobe PDF(14824Kb)  |  收藏  |  浏览/下载:794/25  |  提交时间:2020/07/08
多机器人编队  协同路径规划  队形变换  队形保持与协同避碰  深度强化学习  
无人平台的任务规划技术研究 学位论文
, 中国北京: 中国科学院大学, 2020
作者:  张海莹
Adobe PDF(3199Kb)  |  收藏  |  浏览/下载:218/10  |  提交时间:2020/06/09
无人平台  任务规划技术  深度强化学习  路径规划  粒子群优化算法  
Autonomous Navigation with Improved Hierarchical Neural Network Based on Deep Reinforcement Learning 会议论文
, 中国 广州, 2019.07.27-2019.07.30
作者:  Zhang, Haiying;  Qiu, Tenghai;  Li, Shuxiao;  Zhu, Chengfei;  Lan, Xiaosong;  Chang, Hongxing
浏览  |  Adobe PDF(349Kb)  |  收藏  |  浏览/下载:320/101  |  提交时间:2020/06/09
Autonomous Navigation  DDPG  Improved Hierarchical Neural Network  Curriculum Learning  
融合多源数据知识的复杂工业过程优化决策方法研究 学位论文
, 北京: 中国科学院大学, 2019
作者:  刘承宝
Adobe PDF(60574Kb)  |  收藏  |  浏览/下载:548/4  |  提交时间:2019/06/17
多源数据融合  知识获取  生成式对抗网络  智能优化决策  锂离子电池单体电芯一致性分选