CASIA OpenIR

浏览/检索结果: 共11条,第1-10条 帮助

已选(0)清除 条数/页:   排序方式:
从视频到语言:视频标题生成与描述研究综述 期刊论文
自动化学报, 2022, 卷号: 48, 期号: 2, 页码: 375-397
作者:  汤鹏杰;  王瀚漓
Adobe PDF(8546Kb)  |  收藏  |  浏览/下载:2/0  |  提交时间:2024/05/20
视频描述  卷积神经网络  循环神经网络  语段生成  情感表达  逻辑语义  
基于语境辅助转换器的图像标题生成算法 期刊论文
自动化学报, 2023, 卷号: 49, 期号: 9, 页码: 1889-1903
作者:  连政;  王瑞;  李海昌;  姚辉;  胡晓惠
Adobe PDF(3362Kb)  |  收藏  |  浏览/下载:13/5  |  提交时间:2024/04/24
图像标题生成  注意力机制  转换器  视觉连贯性  
基于多域学习的视觉场景解析研究 学位论文
, 中科院自动化所: 中科院自动化所, 2021
作者:  王玉玺
Adobe PDF(13008Kb)  |  收藏  |  浏览/下载:300/17  |  提交时间:2022/01/10
多域学习  视觉场景解析  无监督域自适应  语义分割  图像分类  
基于视觉与语言的行人理解 学位论文
, 自动化研究所智能化大厦1610: 中国科学院大学自动化研究所, 2021
作者:  荆雅
Adobe PDF(21773Kb)  |  收藏  |  浏览/下载:343/12  |  提交时间:2021/06/21
情境识别  行人检索  行人分割  多模态对齐  关系学习  
机器人自主柔性作业中的视觉检测与定位方法研究 学位论文
中国科学院大学, 中国科学院自动化研究所: 中国科学院自动化研究所, 2020
作者:  黄一锟
Adobe PDF(7705Kb)  |  收藏  |  浏览/下载:300/6  |  提交时间:2020/07/03
机器人自主柔性作业  目标检测  管状焊点检测  先验知识模型  
基于多信息融合的端到端语音合成方法研究 学位论文
, 中国科学院自动化研究所: 中国科学院大学, 2020
作者:  邹雨巷
Adobe PDF(1954Kb)  |  收藏  |  浏览/下载:301/11  |  提交时间:2020/06/10
语音合成  多信息融合  端到端  
多域学习及其在检索、聚类和分类中的应用研究 学位论文
, 中国科学院自动化研究所: 中国科学院自动化研究所, 2018
作者:  梁坚
Adobe PDF(10072Kb)  |  收藏  |  浏览/下载:404/11  |  提交时间:2019/06/10
多域学习  跨模态检索  子空间学习  多视角聚类  域自适应学习  
面向机器翻译的语言预处理与性能优化 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  汪春奇
Adobe PDF(2217Kb)  |  收藏  |  浏览/下载:210/4  |  提交时间:2018/06/08
机器翻译  序列标注  中文分词  半监督学习  半自回归  
语音合成声学建模技术研究 学位论文
, 北京: 中国科学院研究生院, 2018
作者:  王文富
Adobe PDF(4177Kb)  |  收藏  |  浏览/下载:415/8  |  提交时间:2018/06/07
语音合成  声学建模  门控循环混合密度网络  卷积输出层  对抗学习  端到端  
面向语种识别的深度神经网络建模方法研究 学位论文
, 北京: 中国科学院研究生院, 2017
作者:  耿旺
Adobe PDF(5822Kb)  |  收藏  |  浏览/下载:491/9  |  提交时间:2017/07/06
语种识别  神经网络模型  总体差异空间建模  注意力模型  端到端