-
题名改进SIFT算法在文字图像匹配中的应用
被引量:17
- 1
-
-
作者
胡海青
谭建龙
朱亚涛
龚国成
刘金刚
-
机构
首都师范大学计算机科学联合研究院
中国科学院计算技术研究所
河北农业大学信息科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
2013年第1期239-243,共5页
-
基金
国家"863"计划基金资助项目(2011AA010705)
国家自然科学基金资助项目(61003295)
-
文摘
使用SIFT算法对文字图像进行特征提取时,产生的特征点数目较少,且不同文字产生的特征向量存在强干扰性,导致匹配准确率较低。为此,提出一种改进的SIFT算法。该算法利用二值化图像代替灰度图像,增加特征点数目,并取消SIFT的旋转不变性。实验结果证明,与标准SIFT算法相比,改进SIFT算法能有效提高文字图像匹配的准确率。
-
关键词
文字图像
模板匹配
尺度不变特征变换算法
极值点
特征向量
特征提取
-
Keywords
text image
template matching
Scale Invariant Feature Transform(SIFT) algorithm
extreme point
feature vector
feature extraction
-
分类号
TN911.73
[电子电信—通信与信息系统]
-
-
题名基于多模式分析自动解析新闻视频(英文)
被引量:3
- 2
-
-
作者
王伟强
高文
-
机构
中国科学院计算技术研究所
哈尔滨工业大学计算机科学与工程系
-
出处
《软件学报》
EI
CSCD
北大核心
2001年第9期1271-1278,共8页
-
基金
国家自然科学基金
国家 86 3高科技发展计划~~
-
文摘
提出一种结合视觉、声音、文字等多种模式信息自动解析新闻视频的方法 ,并对音频特征的提取以及综合多种模式信息解析新闻视频的算法进行了详细的探讨 .多种模式信息的使用有效地弥补了仅基于图像分析技术分割新闻条目的不足 ,从而使该方法对不同方式存在的新闻条目在分割时具有更广泛的适应性 .在包含 184 10 0帧的测试数据集上 ,对于新闻条目边界点的检测 ,系统获得了 95 .1%查全率 ,93.3%的正确率 .实验结果证明了该方法的有效性、强壮性 .
-
关键词
MPEG-2
多模式分析
新闻视频
自动解析
图像分析
-
Keywords
algorithms
Feature extraction
image segmentation
Signal detection
Speech processing
text processing
-
分类号
TN919.81
[电子电信—通信与信息系统]
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于手机平台的SIFT算法研究
被引量:1
- 3
-
-
作者
寇宏达
程茂
-
机构
河北农业大学信息学院
-
出处
《河北农业大学学报》
CAS
CSCD
北大核心
2013年第4期120-123,共4页
-
基金
河北农业大学理工基金项目(LG20120604)
-
文摘
由于文字图像的特殊性,产生的特征点数目少,且不同文字产生的特征向量存在强干扰性,导致匹配结果不理想。对SIFT算法进行研究,提出一种对文字模板匹配更有效的SIFT改进算法,改进后的算法能有效增加特征点的数目,消除非匹配点的干扰。经实验测试,SIFT改进算法比原来算法明显提高了文字模版匹配的准确率。
-
关键词
文字图像
模板匹配
SIFT算法
特征提取
-
Keywords
text image
template matching
SIFT algorithm
feature extraction
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于K-means的图像文字识别与提取研究
被引量:3
- 4
-
-
作者
岳建杰
赵旦峰
-
机构
哈尔滨工程大学信息与通信工程学院
-
出处
《应用科技》
CAS
2015年第2期17-20,共4页
-
基金
黑龙江省科技攻关计划资助项目(GC12A305)
-
文摘
针对当前图像文字识别与提取的最新发展状况,提出一种基于K-means的图像文字识别与提取算法,其主要处理步骤包括图像的预处理、像素点聚类处理、图层的选择与优化以及最终的文字切分等。经过上机对算法进行测试,该算法能够有效提高图像文字识别与提取的准确率与执行效率,并可以针对不同环境下的图片文字进行有效识别。
-
关键词
K—means
图像文字提取
文字识别
二值化处理
-
Keywords
K-means
extraction of image text
character recognition
binarization
-
分类号
TN971.1
[电子电信—信号与信息处理]
-
-
题名基于Android图片文字朗读软件的盲人电子眼
被引量:3
- 5
-
-
作者
余佳
黄智超
蒋端保
梁治峰
杨兵
帖军
-
机构
中南民族大学计算机科学学院
-
出处
《软件导刊》
2012年第8期96-98,共3页
-
基金
中南民族大学大学生科研创新基金项目(KYCX110405Z)
中南民族大学中央高校基本科研业务费专项资金项目资助(CZY11007)
-
文摘
针对盲人阅读困难的问题,开发了一款基于Android的应用软件,主要采用了OCR和TTS技术。OCR技术用于识别图片中的文字,并转化为文本,TTS技术用于朗读文本中的文字。软件安装在Android手机系统中,通过手机摄像头拍摄文字图片,OCR识别图片中的文字,并将图片文字转成文本文字,TTS将文本文字朗读出来。实际应用显示,软件对图片文字有很好的识别率。
-
关键词
OCR技术
TTS技术
ANDROID
二值化聚类的图像文字提取算法
-
Keywords
OCR Technology
TTS Technology
Android
image binarization for text extraction algorithm
-
分类号
TP317.4
[自动化与计算机技术—计算机软件与理论]
-