利用小波变换和K均值聚类实现字幕区域分割被引量：10

Segmentation of Caption Region Using Wavelet Transform and K-Mean Clustering

下载PDF

导出

摘要提出一种字幕区域分割算法.首先对图像做小波变换和重构,并抽取字幕区域特征,再分块计算统计特征;然后对子块进行K均值聚类,实现字幕区域分割.与已有算法相比,该算法简单,不需要设置阈值.实验结果表明,即使在复杂背景下,对于字体、大小和位置都不确定的字幕,该算法仍具有良好的分割效果. An algorithm is proposed in the paper to segment caption region. By the algorithm, firstly, the caption features are extracted by wavelet transformation and reconstruction on the image, and secondly, statistic features are calculated block by block. At last blocks are classified by K-mean clustering method. In comparison with other algorithms, the algorithm is simpler and no requirement for setting any threshold. Experimental results show that the proposed algorithm performs well, even for captions with unknown font, size, and position.

作者王建宇张峰周献中史迎春骆文

机构地区南京理工大学自动化学院南京大学工程管理学院武汉通信指挥学院仿真中心

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第10期1508-1512,共5页 Journal of Computer-Aided Design & Computer Graphics

基金江苏省自然科学基金(BK2004137)

关键词字幕分割小波变换 K均值聚类 caption extraction wavelet transform K-mean clustering

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1谢毓湘,栾悉道,吴玲达,老松杨.新闻视频帧中的字幕探测[J].计算机工程,2004,30(20):167-168. 被引量：15
2蔡波,周洞汝,胡宏斌.数字视频中字幕检测及提取的研究和实现[J].计算机辅助设计与图形学学报,2003,15(7):898-903. 被引量：16
3Li H P,et al.Automatic text detection and tracking in digital video[J].IEEE Transactions on Image Processing,2000,9(1):147-156
4章东平,祝金标,刘济林.自动定位彩色图像中的文本[J].浙江大学学报（工学版）,2005,39(2):229-233. 被引量：5
5黄晓东,周源华.用小波变换及颜色聚类提取的视频图像内中文字幕[J].计算机工程,2003,29(1):43-44. 被引量：11
6Wu V,Nanmatha R,Risema E.Text finder:an automatic system to detect and recognize text in images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1999,21(11):1224-1229
7Jain A K,et al.Automatic text location in images and video frames[J].Pattern Recognition,1998,31(12):2055-2076
8庄越挺,刘骏伟,吴飞,潘云鹤,张引.基于支持向量机的视频字幕自动定位与提取[J].计算机辅助设计与图形学学报,2002,14(8):750-753. 被引量：38
9李朝晖,余英林,张为,邹艳碧.小波-神经网络在视频文本自动检测中的应用[J].广州大学学报（综合版）,2001,15(5):36-39. 被引量：1
10戴青云,余英林.一种基于小波与形态学的车牌图象分割方法[J].中国图象图形学报（A辑）,2000,5(5):411-415. 被引量：110

二级参考文献37

1万雯.文旅融合背景下高职旅游管理专业人才培养模式研究[J].旅游纵览（下半月）,2019(12):205-206. 被引量：10
2[1]Y Wang, Z Liu, J Huang. Multimedia content analysis using audio and visual information[J]. IEEE Signal Processing Magazine, 2000, 17(6):12～36
3[2]R Lienhart, F Stuber. Automatic text recognition in digital videos[A]. In: Proceedings of ACM Multimedia, Boston, 1996.11～20
4[3]Zhong Yu, Zhang Hongjiang, Jain Anil K. Automatic caption localization in compressed video[J]. Pattern Analysis and Machine Intelligence, 2000, 22(4):385～392
5[4]V Vapnik. The Nature of Statistical Learning Theory[M]. New York: Springer, 1995
6[5]M Schmidt. Identifying speaker with support vector networks[A]. In: Proceedings of Interface'96, Sydney, 1996
7[6]T Joachims. Text categorization with support vector machines: Learning with many relevant features[A]. In: Proceedings of the 10th European Conference on Machine Learning, Chemnitz, Germany, 1998.137～142
8[7]Yuan Qi. Learning algorithms for video and audio processing: Independent component analysis and support vector machine based approaches[R].College Park: University of Maryland at College Park, LAMP-TR-056(CAR-TR-951), 2000
9[8]Edgar Osuna, Robert Freund, Federico Girosi. Training support vector machines: An application to face detection[A]. In: Proceedings of Computer Vision and Pattern Recognition, Puerto Rico, 1997.130～136
10[9]C J C Burges. A tutorial on support vector machines for pattern recognition[J]. Data Mining, and Knowledge Discovery, 1998, 2(2):121～167

共引文献181

1侯培国,赵静,刘明.基于小波变换和行扫描的车牌定位方法[J].系统仿真学报,2006,18(z2):811-813. 被引量：11
2王洪建.基于HSV颜色空间的一种车牌定位和分割方法[J].仪器仪表学报,2005,26(z2):371-373. 被引量：28
3贾冬勤,王洪元,程起才.基于自适应阈值Canny算子的视频文本定位方法[J].常州大学学报（自然科学版）,2014,26(1):47-51. 被引量：2
4傅宇浩.基于彩色信息与数学形态学相结合的车牌定位与分割方法[J].公路交通科技（应用技术版）,2008,4(3):136-139.
5王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
6古红英,潘红,吴飞,庄越挺,潘云鹤.虹膜自相似性识别方法研究[J].计算机辅助设计与图形学学报,2004,16(7):973-977. 被引量：7
7余棉水,黎绍发.基于边缘与SVM的车牌自动定位与提取[J].计算机应用研究,2004,21(10):131-133. 被引量：8
8杨家辉,王建英.基于色彩分割与体态纹理分析的车牌定位方法[J].交通运输工程与信息学报,2004,2(1):99-105. 被引量：3
9张二虎,张绪进,段敬红.一种改进的基于DCT压缩域的图像字符定位方法[J].计算机工程与应用,2004,40(27):97-98.
10曹刚,游志胜,赵树龙.基于小波隐性马尔可夫树模型的车牌定位[J].电子科技大学学报,2004,33(5):515-518. 被引量：4

同被引文献94

1王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
2李峰,黄达人,毕宁,戴青云.基于多进制小波变换的纹理图像分割[J].模式识别与人工智能,2004,17(3):286-290. 被引量：7
3张华,曾琪明,李小凡,高亮,刘贻华,张树义.大图像分块法在InSAR处理中的应用探讨[J].测绘通报,2005(9):18-20. 被引量：4
4黄申,徐成,屈景辉,廖琪梅.基于小波理论对掌纹主线提取和修复[J].中国图象图形学报,2006,11(8):1139-1149. 被引量：14
5刘宇驰,栾悉道,戴端辉,吴玲达.多模态体育视频语义分析[J].计算机科学,2007,34(1):109-111. 被引量：6
6金国英,陶霖密,徐光,张翔.基于HHMM的多线索融合和事件推理方法[J].清华大学学报（自然科学版）,2007,47(1):112-115. 被引量：4
7田岩岩,齐国清.基于小波变换模极大值的边缘检测方法[J].大连海事大学学报,2007,33(1):102-106. 被引量：29
8田有文,李天来,李成华,朴在林,孙国凯,王滨.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180. 被引量：87
9李雪妍,郭树旭,郜峰利.基于小波模极大值的视频文本区域的提取[J].计算机工程,2007,33(5):26-28. 被引量：4
10Chen J Y,Li Y H,Wu L D,et al.Semantic event detection in soccer video by integrating multi-features using Bayesian network[C] ∥Proceedings of 2004 International Symposium on Intelligent Multimedia,Video and Speedh Procceding.Oct.2004.

引证文献10

1朱成军,蒲菊华,薛玲,熊璋.基于词组学习的视频文本检测方法[J].计算机工程,2008,34(13):185-187. 被引量：4
2张玉珍,魏带娣,王建宇,戴跃伟.基于多模态融合的足球视频语义分析[J].计算机科学,2010,37(7):273-276. 被引量：4
3刘玉芹,苑玮琦,郭金玉.分块Radon变换在低对比度掌纹特征提取中的应用[J].光电工程,2011,38(10):110-114.
4王琦,陈临强,梁旭.视频中的字幕提取[J].计算机工程与应用,2012,48(5):177-178. 被引量：6
5胡秋霞,田杰,何东健,宁纪锋.基于改进型C-V模型的植物病斑图像分割[J].农业机械学报,2012,43(5):157-161. 被引量：15
6李敏强,哈力旦.阿布都热依木,闫轲.一种改进型局部二值模式的维吾尔文定位算法[J].河南科技大学学报（自然科学版）,2015,36(3):43-47. 被引量：7
7邹凌,徐逸,周仁来.密度K-means算法在认知重评脑功能连接中的应用[J].计算机辅助设计与图形学学报,2015,27(5):841-846. 被引量：3
8王之琼,王培,于戈,康雁.双侧特征融合的乳腺肿块检测[J].计算机辅助设计与图形学学报,2015,27(6):1024-1031. 被引量：6
9纵清华,王志宇,过仲阳,马品.基于小波变换和K-means算法的遥感影像分类[J].杭州师范大学学报（自然科学版）,2016,15(2):203-207. 被引量：1
10褚玉伟,罗晓博,屈珂,陶煜波,林军,林海.DBSCAN和K-Means混合聚类的牙齿特征自动识别[J].计算机辅助设计与图形学学报,2018,30(7):1276-1283. 被引量：8

二级引证文献54

1徐峰,梁学战.新闻视频帧中的标题字幕探测[J].中国科技信息,2009(23):117-118. 被引量：3
2陈树越,张世林.基于灰度差分的新闻视频标题字幕探测[J].计算机与数字工程,2010,38(11):145-147.
3陈树越,张世林.基于灰度差分与变异直方图的新闻标题字幕探测[J].常州大学学报（自然科学版）,2010,22(4):43-46.
4哈力旦.A,库尔班.买提木沙.基于小波变换的图像中维吾尔文字定位[J].计算机工程,2011,37(8):197-198. 被引量：10
5张玉珍,丁思捷,王建宇,戴跃伟,陈钱.基于HMM的融合多模态的事件检测[J].系统仿真学报,2012,24(8):1638-1642. 被引量：4
6任梅,詹永照,潘道远,孙佳瑶.基于概率超图的视频事件语义检测[J].计算机应用,2012,32(11):3014-3017. 被引量：1
7张晓丽,智敏.网球视频中慢镜头的自适应阈值探测法[J].计算机工程与科学,2013,35(4):99-103. 被引量：5
8田杰,胡秋霞,马孝义.基于高斯分布改进C-V模型的植物病斑彩色图像分割[J].农业工程学报,2013,29(16):166-173. 被引量：12
9袁媛,李淼,陈晟,江海洋,董俊.复杂背景黄瓜叶部病害图像分割方法[J].农业机械学报,2013,44(10):233-237. 被引量：29
10程玉柱,陈勇,张浩.基于MMC与CV模型的苗期玉米图像分割算法[J].农业机械学报,2013,44(11):266-270. 被引量：18

1黄同,邵思飞.基于CDF9-7小波和自适应Otsu算法的视频字幕分割[J].现代电子技术,2014,37(9):50-52.
2任通,程江华,金阳,库锡树.一种基于白像素增量比的字幕图像分割算法[J].电视技术,2014,38(5):190-193. 被引量：1
3赵冬琴.复杂背景下的人脸检测[J].山西电子技术,2017(2):27-28.
4周军,徐奕,周源华.基于局部能量特征的视频字幕分割[J].中国图象图形学报（A辑）,2002,7(11):1134-1138. 被引量：1
5潘文文,孙晓飞,王霞.基于全局显著性检测的手绘草图图像检索[J].成都工业学院学报,2014,17(4):18-20. 被引量：1
6周书臣,王倩.基于Contourlet变换的抗几何攻击数字水印算法[J].现代电子技术,2012,35(16):62-65.
7彭晓明,陈武凡,马茜.基于B样条的快速弹性图像配准方法[J].计算机工程与应用,2006,42(11):186-189. 被引量：11
8李荣,乔俊飞,韩红桂.一种改进型离散Hopfield学习算法[J].控制与决策,2014,29(2):241-245. 被引量：10
9武治国,李桂菊.动态目标识别中的实时复杂巡航场景运动检测[J].液晶与显示,2014,29(5):844-849. 被引量：7
10朱国平,吴小俊.基于GVF-Snake的运动目标跟踪[J].江南大学学报（自然科学版）,2008,7(4):408-413. 被引量：1

计算机辅助设计与图形学学报

2006年第10期

浏览历史

内容加载中请稍等...

利用小波变换和K均值聚类实现字幕区域分割被引量：10

参考文献10

二级参考文献37

共引文献181

同被引文献94

引证文献10

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

利用小波变换和K均值聚类实现字幕区域分割 被引量：10

参考文献10

二级参考文献37

共引文献181

同被引文献94

引证文献10

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

利用小波变换和K均值聚类实现字幕区域分割被引量：10