已选(0)清除
条数/页: 排序方式: |
| 会议场景智能语音处理技术研究 学位论文 工学博士, 中国科学院自动化研究所: 中国科学院自动化研究所, 2022 作者: 范志赟 Adobe PDF(3323Kb)  |  收藏  |  浏览/下载:256/12  |  提交时间:2022/09/15 会议场景,语音识别,说话人转换点检测,说话人自适应 |
| 自然场景文本检测与识别技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2020 作者: 盛芬芬 Adobe PDF(14633Kb)  |  收藏  |  浏览/下载:497/21  |  提交时间:2020/06/12 自然场景图像 文本检测 文本识别 端到端提取 深度学习 |
| 基于深度神经网络的字幕行识别方法研究 学位论文 , 北京: 中国科学院研究生院, 2017 作者: 翟传磊 Adobe PDF(6784Kb)  |  收藏  |  浏览/下载:286/2  |  提交时间:2017/06/22 深度神经网络 图像文本行识别 链接时序分类 注意力机制 |
| 电视节目结构化分析与摘要技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2013 作者: 徐夙 Adobe PDF(13971Kb)  |  收藏  |  浏览/下载:153/0  |  提交时间:2015/09/02 逻辑单元分割 条件随机场模型 图片摘要 图片摘要可视化 Logical Unit Segmentation Conditional Random Field Still-image Abstract Still-image Visualization |
| 视音频全局时序特征在疑似广告检测中的应用研究 学位论文 , 中国科学院自动化研究所: 中国科学院大学, 2012 作者: 张波 Adobe PDF(7235Kb)  |  收藏  |  浏览/下载:161/0  |  提交时间:2015/09/02 广告检测 广告分割 视频分析 多模态融合 在线学习 Commercial Detection Commercial Segmentation Video Analysis Multi-model Fusion Online Learning |
| 汉语CALL系统声调语调评估诊断技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2009 作者: 柯登峰 Adobe PDF(2325Kb)  |  收藏  |  浏览/下载:283/0  |  提交时间:2015/09/02 计算机辅助语言学些 韵律 声调 语调 评估 诊断 Call Prosody Tone Intonation Assessment Diagnosis |
| 音频信息检索关键技术研究 学位论文 , 中国科学院自动化研究所: 中国科学院研究生院, 2009 作者: 王磊 Adobe PDF(1915Kb)  |  收藏  |  浏览/下载:222/0  |  提交时间:2015/09/02 哼唱音乐检索 音频模板检索 音频分类 广播新闻条目自动分割 Query By Singing/humming Audio Template Searching Audio Classification Broadcasting News Story Segmentation |