一种视频字幕文本提取和识别的方法
刘成林; 白博; 殷飞
2011-10-17
公开日期2012-01-25
授权国家CN
专利类型发明
摘要本发明公开了一种视频字幕文本提取和识别的方法,其步骤包括:输入视频中字幕区域的图像;将输入图像转化为灰度图;判断字幕区域中字符排列的方向;将竖直排列的字幕区域逆时针旋转90°得到水平字幕区域;对字幕区域进行分行得到单行字幕图像;对单行字幕区域图像自动判断前景颜色,得到单行字幕二值图像;对单行字幕二值图像进行过切分得到字符片段序列;对过切分后的单行字幕二值图像进行文本行识别。本方法能有效分割水平和竖直的视频字幕文本行,准确判断字符前景颜色并滤除噪声,并得到准确的字符切分与识别结果,可以适用于视频和图像内容编辑、索引与检索等多种用途。
专利号CN201110315054.3
专利状态授权
文献类型专利
条目标识符http://ir.ia.ac.cn/handle/173211/8571
专题模式识别国家重点实验室_模式分析与学习
作者单位中国科学院自动化研究所
推荐引用方式
GB/T 7714
刘成林,白博,殷飞. 一种视频字幕文本提取和识别的方法. CN201110315054.3[P]. 2011-10-17.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[刘成林]的文章
[白博]的文章
[殷飞]的文章
百度学术
百度学术中相似的文章
[刘成林]的文章
[白博]的文章
[殷飞]的文章
必应学术
必应学术中相似的文章
[刘成林]的文章
[白博]的文章
[殷飞]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。