中国科学院自动化研究所机构知识库(CASIA OpenIR): 检索

浏览/检索结果: 共3条，第1-3条

帮助

已选(0)清除条数/页：排序方式：
	User Response Modeling in Reinforcement Learning for Ads Allocation 会议论文 , 新加坡, May 13 - 17, 2024 作者: Zhang, Zhiyuan; Zhang, Qichao; Wu, Xiaoxu; Shi, Xiaowen; Liao, Guogang; Wang, Yongkong; Wang, xingxing; Zhao, Dongbin Adobe PDF(2077Kb) \| 收藏 \| 浏览/下载：46/20 \| 提交时间：2024/06/25 Ads Allocation Reinforcement Learning User Response Modeling
	Self-Modifying State Modeling for Simultaneous Machine Translation 会议论文 , Bangkok, Thailand, August 11–16, 2024 作者: Donglei, Yu; Xiaomian, Kang; Yuchen, Liu; YU, Zhou; Chengqing, Zong Adobe PDF(924Kb) \| 收藏 \| 浏览/下载：29/15 \| 提交时间：2024/06/20
	Learning Causal Dynamics Models in Object-Oriented Environments 会议论文 Proceedings of the 41st International Conference on Machine Learning, 奥地利, 维也纳, 2024-07-21 作者: Yu ZY(余忠蔚); Ruan JQ(阮景晴); Xing DP(邢登鹏) Adobe PDF(2176Kb) \| 收藏 \| 浏览/下载：51/19 \| 提交时间：2024/05/28 强化学习因果模型

中国科学院自动化研究所机构知识库