一种基于白像素增量比的字幕图像分割算法被引量：1

Caption Image Segmentation Method Based on White Pixels Increment Ratio

下载PDF

导出

摘要字幕分割是指对检测定位到的视频字幕图像进行分割,使其字符像素与本底背景像素分离,二值化为可供OCR软件识别的字幕图像。为了克服字幕图像分割中容易出现的过分割及欠分割现象,提出一种基于字幕区域和外扩区域"白像素"数量增量比判决的字幕图像分割算法,该算法通过逐步改变图像分割阈值,以分析图像分割结果作为反馈来判决当前分割效果的好坏,从而确定最优分割阈值。大量结果表明,该算法性能良好,其分割效果远优于传统的OTSU算法、K均值聚类等经典算法。 Video caption segmentation is the process of extracting binary text pixels from caption image for inputting OCR recognition software. In order to overcome the shortcomings of the over-segmentation and under-segmentation problems of the traditional segmentation methods, a method is proposed based on ＂white pixels＂ increment ratio. This method finds the optimal threshold using a feed-back model by gradually changing the segmenting thresh- old. In order to verify the performance of the proposed segmentation method, several experiments under different complex conditions are designed. The experiment results show that the proposed method can resolve the over-segmenting and under-segmenting problems of the traditional segmentation meth-ods such as the OTSU algorithm and the K-means clustering algorithm.

作者任通程江华金阳库锡树

机构地区国防科技大学电子科学与工程学院

出处《电视技术》北大核心 2014年第5期190-193,共4页 Video Engineering

关键词视频字幕图像分割白像素增量比二值化 video caption image segmentation white pixels increment ratio binarization

分类号 TN911.73 [电子电信—通信与信息系统] TP91 [自动化与计算机技术]

引文网络
相关文献

参考文献6

1LYU M R,SONG J Q,CAI M. Comprehensive method for multilingnal video text detection,localization,and extraction[J].IEEE Trans Circuit and Systems for Video Technology,2005,(2):243-255.
2BERNSEN J. Dynamic thresholding of grey-level images[A].Paris,France:[s.n.],1986.1251-1255.
3NIBLACK W. An introduction to digital image processing[M].New Jersey:Prentice-Hall Press,1985.
4SAUVOLA J,PIETIKAINEN M. Adaptive document image binarization[J].{H}Pattern Recognition,2000,(2):225-236.
5王一丁,蒋小森.基于梯度增强的新闻字幕分割算法[J].计算机辅助设计与图形学学报,2009,21(8):1170-1174. 被引量：6
6宋砚,刘安安,张勇东,林守勋.基于聚类的视频字幕提取方法[J].通信学报,2009,30(2):136-140. 被引量：10

二级参考文献22

1JAIN A K, YU B. Automatic text location in images and video frames[J]. Pattern Recognition, 1998, 31 ( 12):2055-2076.
2KIM K I, JUMG K, KIM H. Texture-based approach for text detection in images using support vector machines and continuously adaptive mean shift algorithm[J]. IEEE Transaction on PAMI, 2003, 25( 12): 1631-1639.
3WU V, MANMATHA R, RISEMAN E M. Textfinder: an automatic system to detect and recognize text in images[J]. IEEE Transaction on PAMI, 1999, 21(11): 1224-1229.
4OTSU N. A threshold selection method from gray-level histograms[J]. IEEE Transaction on Systems, Man and Cybernetics, 1979, 9(1):62-66.
5XI J HUA X S, CHEN X R, et al. A video text detection and recognition system[A]. Proceedings of IEEE International Conference on Multimedia Expo[C]. Tokyo, Japan, 2001.873-876.
6SATO T, KANADE T, HUGHES E, et al. Video OCR for digital news archives[A], Proceedings of IEEE Workshop on Content-Based Access of Image and Video Database[C]. India, 1998.52-60.
7SOBEL I. Machine Vision for Three-Dimensional Scenes[M]. Orlando, USA, Academic Press, 1990. 376-379.
8LYU M R, SONG J Q, CAI M. A comprehensive method for multilingual video text detection, localization, and extraction[J]. IEEE Transaction on Circuits and Systems for Video Technology, 2005, 15(2):243-255.
9WERNICKE A, LIENHART R. On the segmentation of text in videos[A]. Proceedings of IEEE International Conference on Multimedia Expo[C]. New York, USA, 2000.
10YE Q X, HUANG Q H, GAO W, et al. Fast and robust text detection in images and video frames[J]. Image and Vision Computing, 2005, 23(6): 565-576.

共引文献14

1刘海涛,老松杨,郭金林,白亮.一种快速新闻视频标题字幕探测与定位方法[J].计算机应用研究,2011,28(8):3148-3150. 被引量：1
2陈树越,张世林.基于灰度差分和二维最大熵阈值的新闻字幕检测[J].计算机应用研究,2011,28(8):3195-3197. 被引量：3
3刘毅,毛震东,张冬明,张勇东,林守勋.低质量汉字的分块搜索两级识别法[J].计算机辅助设计与图形学学报,2012,24(2):170-175. 被引量：2
4苏畅,胡晓冬,王斌辅,尚凤军.基于笔画相关加权的视频图像文字识别[J].计算机应用,2012,32(8):2305-2308. 被引量：4
5李琼.基于颜色分析的新闻视频字幕区提取方法研究[J].安徽电子信息职业技术学院学报,2013,12(3):6-9.
6李钦瑞,吕学强,李卓,刘坤.Logistic视频字幕增强模型[J].中国图象图形学报,2014,19(5):683-692. 被引量：1
7陈梓洋,王宇飞,钱侃,张超,孙知信.自然场景下基于区域检测的文字识别算法[J].计算机技术与发展,2015,25(7):230-233. 被引量：7
8董晓峰,顾晓文,王业,朱国防.电网倒闸操作票智能监护系统设计[J].中国电力,2015,48(12):16-22. 被引量：12
9王志衡,郭超,刘红敏.基于模板匹配的新闻图像字幕行切分算法[J].北京邮电大学学报,2016,39(3):49-53. 被引量：2
10买迪娜.马合木提.语义信息缺失下的新闻视频检索系统研究[J].计算机与网络,2017,43(6):73-75.

同被引文献10

1SHIRAKAWA S, NAGAO T. Evolutionary. image segmentation based on muhiobjective clustering[ C]//Proc. 2009 IEEE Congress on Evo- lutionary Computation. NY, USA : IEEE Press ,2009:2466 -2473.
2BANDYOPADHYAY S, MAULIK U, MUKHOPADHYAY A. Mul- tiobjective genetic clustering for pixel classification in remote sensing imagery. [J]. IEEE Trans. Geoscience and Remote Sensing,2007, 45(5) :1506-1511.
3HANDL J,KNOWLES J. An evolutionary approach t{, muhiobjec- rive clustering[ J ]. IEEE Trans. Evolutionary Compulation,2007, 11(1) :56-76.
4王璐,胡晰远,彭思龙.基于分块的空间变化抖动模糊图像的全局模糊去除[J].计算机辅助设计与图形学学报,2012,24(6):766-774. 被引量：4
5靳璐,付梦印.基于遗传模糊核聚类的图像分割[J].模式识别与人工智能,2013,26(2):205-210. 被引量：19
6江成顺,汪先超.两相图像变分分割凸松弛模型快速算法[J].计算机学报,2013,36(5):1086-1096. 被引量：1
7李永乐,娄静涛,张茂军,王炜,熊志辉.基于全向总变分最小化的折反射散焦模糊图像复原方法[J].光学学报,2013,33(8):99-105. 被引量：8
8李磊,金良海,宋恩民.基于区域合并和图割的非监督彩色图像分割算法[J].华中科技大学学报（自然科学版）,2013,41(12):44-47. 被引量：2
9陈恺,陈芳,戴敏,张志胜,史金飞.基于萤火虫算法的二维熵多阈值快速图像分割[J].光学精密工程,2014,22(2):517-523. 被引量：84
10王冬冬,张炜,金国锋,杨正伟,田干.尖点突变理论在红外热波检测图像分割中的应用[J].红外与激光工程,2014,43(3):1009-1015. 被引量：13

引证文献1

1周苑,周岩.基于变尺度进化的多目标图像分割算法[J].电视技术,2015,39(17):21-24. 被引量：1

二级引证文献1

1薛茹,Liping LIU,陈锋,石方夏.基于二维最大熵和教与学优化算法的图像分割[J].电视技术,2017,41(7):116-121.

1扫描仪使用技巧[J].网友世界,2004(4):73-73.
2王建宇,张峰,周献中,史迎春,骆文.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512. 被引量：10
3唐英干,刘冬,关新平.一种改进的模糊熵红外图像分割方法[J].激光与红外,2006,36(4):321-323. 被引量：10
4乔增伟,孙卫祥.C4.5算法的两点改进[J].江苏工业学院学报,2008,20(4):56-59. 被引量：10
5Cyril Clocher.半导体行业助力安防实现“绿色环保”[J].A&S（安全&自动化）,2012(1):97-98.
6黄同,邵思飞.基于CDF9-7小波和自适应Otsu算法的视频字幕分割[J].现代电子技术,2014,37(9):50-52.
7周军,徐奕,周源华.基于局部能量特征的视频字幕分割[J].中国图象图形学报（A辑）,2002,7(11):1134-1138. 被引量：1
8金丽亚,曹卫国.一种TM遥感影像的分割算法[J].装甲兵工程学院学报,2006,20(5):69-71. 被引量：1
9赵志强,侯玉雪.数码图像知多少(一)[J].数码印刷,2004(12):56-57.
10左奇,史忠科.基于模糊理论的图像分割方法[J].西北工业大学学报,2003,21(3):313-316. 被引量：4

电视技术

2014年第5期

浏览历史

内容加载中请稍等...

一种基于白像素增量比的字幕图像分割算法被引量：1

参考文献6

二级参考文献22

共引文献14

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于白像素增量比的字幕图像分割算法 被引量：1

参考文献6

二级参考文献22

共引文献14

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于白像素增量比的字幕图像分割算法被引量：1