期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于Tesseract-OCR的农村房地一体归档系统研究 被引量:2
1
作者 谭静 《黑龙江科学》 2024年第12期154-157,共4页
农村房地一体档案是对农村宅基地、集体建设用地使用权及房屋所有权进行确权登记的重要依据,将签章后的纸质档案转为电子档案进行存储对不动产权证书办理具有重要意义。由于目前缺乏能识别档案内容并进行分类归档的工具,设计并实现了基... 农村房地一体档案是对农村宅基地、集体建设用地使用权及房屋所有权进行确权登记的重要依据,将签章后的纸质档案转为电子档案进行存储对不动产权证书办理具有重要意义。由于目前缺乏能识别档案内容并进行分类归档的工具,设计并实现了基于Tesseract-OCR的农村房地一体归档系统。使用光学字符识别(Optical Character Recognition,OCR)对档案扫描图像进行识别,训练校正字库,提取图像中的文字信息,实现档案资料的分类存储。运用四川省某县的部分房地一体档案进行系统测验,应用结果表明,系统的识别归档准确率为96.5%,能满足房地一体档案归档需求,降低了人工识别归档的繁琐性,极大提高了归档的工作效率,提升了档案分类的准确度。 展开更多
关键词 光学字符识别 tesseract 农村房地一体 登记档案 扫描图像
在线阅读 下载PDF
基于模板匹配和Tesseract的票据归类和索引 被引量:5
2
作者 邱立可 王晓年 +1 位作者 朱劲 蒋平 《计算机与现代化》 2010年第7期132-135,共4页
现在大量的纸质凭证都需要通过扫描存入计算机,但如何对这些凭证进行归类和检索成为一个主要问题。随着OCR技术的发展,已有软件产品能够完成扫描件的识别和管理。但在很多情况下只需对扫描件进行归类和建立索引,并不需要对整张票据进行... 现在大量的纸质凭证都需要通过扫描存入计算机,但如何对这些凭证进行归类和检索成为一个主要问题。随着OCR技术的发展,已有软件产品能够完成扫描件的识别和管理。但在很多情况下只需对扫描件进行归类和建立索引,并不需要对整张票据进行OCR识别。本文提出一种快速、有效的基于模板匹配的票据分类方法,然后借助开源软件Tes-seract实现数字和字母的识别,完成票据的分类和索引功能。所提出的方法简便、高效,有效地降低了企业成本。另外,为了提高识别率,根据待识别对象的特征对图像进行预处理,实验表明该方法可以极大提高识别率,对专业的OCR软件也具借鉴意义。 展开更多
关键词 光学字符识别 模板匹配 图像增强 tesseract
在线阅读 下载PDF
基于Tesseract-OCR的燃气表自动识别研究 被引量:8
3
作者 冯玉田 侯玖廷 顾乐易 《电子测量技术》 2019年第21期82-86,共5页
设计了摄像直读式燃气表自动抄表系统,通过图像处理和OCR技术对燃气表读数进行识别。采用在图像HSV空间进行直方图均衡和中值滤波对燃气表图像进行预处理,提高了适应性。在用Tesseract光学字符识别引擎进行字符特征提取中,提出了基于颜... 设计了摄像直读式燃气表自动抄表系统,通过图像处理和OCR技术对燃气表读数进行识别。采用在图像HSV空间进行直方图均衡和中值滤波对燃气表图像进行预处理,提高了适应性。在用Tesseract光学字符识别引擎进行字符特征提取中,提出了基于颜色和轮廓的定位算法分割燃气表读数区域,使得系统具有更好的稳定性。识别中针对燃气表字体训练Tesseract,从而实现了较高的识别正确率。实验中,通过对多个品牌的燃气表进行测试,识别准确率达到98.7%。本文设计的燃气表自动识别系统具有识别准确率高、鲁棒性好、识别速度快等特点,可为燃气表自动抄表或自助抄表提供有效的技术途径。 展开更多
关键词 燃气表自动抄表 图像处理 图像识别 tesseract-OCR
原文传递
Tesseract视觉耦合支持向量机的字符识别算法 被引量:5
4
作者 钱伟强 《系统仿真技术》 2016年第3期218-222,249,共6页
为了解决当前字符识别算法严重依赖固定匹配模板,使其难以识别形态多变的手写字符的问题,本文提出了Tesseract视觉耦合支持向量机的字符识别算法。首先,通过开源视觉库Tesseract自带图像预处理工具,对字符图像进行边缘检测处理,提取字... 为了解决当前字符识别算法严重依赖固定匹配模板,使其难以识别形态多变的手写字符的问题,本文提出了Tesseract视觉耦合支持向量机的字符识别算法。首先,通过开源视觉库Tesseract自带图像预处理工具,对字符图像进行边缘检测处理,提取字符的边缘特征;再通过训练工具cowboxer,快速训练出字符特征文件,通过识别函数与定位函数,准确完成字符的初步识别。然后,引入支持向量机,通过训练字符特征向量,开发训练字库,对初步识别中的遗漏目标完成字符的补偿识别,有效确保字符的识别正确率。实验结果显示:与当前识别算法相比,本文算法的识别精度与抗干扰性更高。 展开更多
关键词 字符识别 支持向量机 tesseract视觉 特征向量
在线阅读 下载PDF
基于Tesseract_OCR文字识别的研究 被引量:22
5
作者 曾悦 马明栋 《计算机技术与发展》 2021年第11期76-80,共5页
光学字符识别(optical character recognition,OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机... 光学字符识别(optical character recognition,OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字。该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析。文字信息提取模块包括图像预处理、文字信息区域的截取和修正、字符分割,对输入的图片进行处理,以降低随机噪声,确保文字信息区域包含完整的文字信息,提高识别的准确性。使用Tesseract的OCR引擎对处理后的文字信息区域部分进行识别,提取出图片中的文字信息。微软基础类库(Microsoft foundation classes,MFC),是微软公司实现的一个C++类库,主要封装了一部分的API函数,灵活性大。最后,在VS2015环境下使用微软基础类库实现了一个文字识别系统,并对样本图片库进行系统的测试。测试结果表明,该系统具有更高的识别率。 展开更多
关键词 光学字符识别 文字识别 tesseract框架 微软基础类库 C++
在线阅读 下载PDF
基于Tesseract文字识别的预处理研究 被引量:7
6
作者 章安 马明栋 《计算机技术与发展》 2021年第1期73-76,174,共5页
针对Tesseract文字识别框架对输入图像的像素要求,以及图像采集过程中可能出现的歪斜、黑边等情况,基于文字识别流程,对预处理阶段的二值化、缩放、边框处理与倾斜矫正进行研究与C++代码的实现。对文字识别OCR(optical character recogn... 针对Tesseract文字识别框架对输入图像的像素要求,以及图像采集过程中可能出现的歪斜、黑边等情况,基于文字识别流程,对预处理阶段的二值化、缩放、边框处理与倾斜矫正进行研究与C++代码的实现。对文字识别OCR(optical character recognition,光学字符识别)的流程进行了概述,重点研究图像缩放与二值化过程,利用双线性插值算法逐像素、逐行分别对横纵坐标进行线性插值,完成图像缩放;利用最大类间方差法、聚类的思想,遍历灰度值,获取最佳二值化阈值,实现图像的二值化。参考OpenCV库函数,提出图像边框与偏移的处理思路。在VS2015环境下基于Tesseract框架,对整个流程进行实现,介绍了Tesseract框架的接口与功能、输入与输出参数。图像的预处理对文字识别必不可少,有利于Tesseract之后的识别工作。 展开更多
关键词 OCR 文字识别 预处理 tesseract框架 C++
在线阅读 下载PDF
基于Tesseract-OCR的复杂发票自适应识别 被引量:8
7
作者 孙瑞彬 钱夔 +1 位作者 徐伟敏 路红 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2021年第3期349-354,共6页
针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域... 针对复杂发票任意区域下的特定表格内容提取与实时识别问题,提出了一种基于Tesseract-OCR引擎的自适应识别方法.首先利用OpenCV对发票图像进行预处理滤波、自适应阈值等一系列预处理得到二值图像;然后利用形态学中的开运算提取表格全域线段,进行表格位置提取,并结合表格交点坐标与自定义模板,实现表头与内容自适应适配;最后利用jTessBoxEditor对表格区域内容进行字库训练优化,最终实现基于Tesseract-OCR的字符识别.实验结果表明该方法具有高准确识别率,支持感兴趣区域自适应识别,具备高可用性. 展开更多
关键词 发票识别 tesseract-OCR OPENCV 字库训练 自适应识别
在线阅读 下载PDF
一个基于Tesseract OCR Engine的Wrapper的设计与实现 被引量:4
8
作者 池浩 《科技传播》 2011年第23期199-199,共1页
Tesseract OCR Engine是现如今准确率最高的开源字符图像识别引擎之一。本文侧重于利用C++/CLI的语言特性,设计并实现一个可供.Net平台应用程序使用的Tesseract Wrapper。
关键词 tesseract OCR ENGINE WRAPPER 设计与实现
在线阅读 下载PDF
基于Tesseract引擎样本训练的验证码识别 被引量:8
9
作者 潘浩 李兰 《信息与电脑》 2020年第1期138-139,142,共3页
笔者利用OCR算法引擎Tesseract的样本训练方法,对简单验证码和复杂验证码进行识别。使用预处理后的单字符图片作为训练样本,对算法进行样本训练,以提高算法对普通字符验证码的识别率,并且使其可以识别较为复杂的字符验证码。实验结果证... 笔者利用OCR算法引擎Tesseract的样本训练方法,对简单验证码和复杂验证码进行识别。使用预处理后的单字符图片作为训练样本,对算法进行样本训练,以提高算法对普通字符验证码的识别率,并且使其可以识别较为复杂的字符验证码。实验结果证明,样本训练后的算法对简单验证码的识别率达到了99%以上,且可以对原本几乎无法识别的复杂验证码进行有效识别。 展开更多
关键词 tesseract 验证码识别 样本训练 OCR算法
在线阅读 下载PDF
基于Tesseract-OCR的字符识别技术在特定场合的应用 被引量:7
10
作者 吴鸣 《湖南城市学院学报(自然科学版)》 CAS 2020年第5期58-61,共4页
基于谷歌开源OCR引擎Tesseract的字符识别技术,针对某特定应用场合,设计并实现了一个图片字符识别系统.首先,对尺寸一致的样本图片进行分割、灰度化和二值化预处理;其次,利用Tesseract对特定字符进行针对性的训练以提高字符识别率;最后... 基于谷歌开源OCR引擎Tesseract的字符识别技术,针对某特定应用场合,设计并实现了一个图片字符识别系统.首先,对尺寸一致的样本图片进行分割、灰度化和二值化预处理;其次,利用Tesseract对特定字符进行针对性的训练以提高字符识别率;最后,进行字符的识别和矫正.Python环境下的实验验证结果表明:经过训练后的Tesseract字库可以有效地提高字符识别的准确率和识别速度;同时,灰度图比二值图更适合本特定场合的图片字符识别. 展开更多
关键词 字符识别 OCR tesseract 灰度图 二值图
在线阅读 下载PDF
基于Tesseract中文全血化验单信息提取研究 被引量:1
11
作者 梁国贤 陈广华 梁国胜 《电脑编程技巧与维护》 2020年第4期96-100,128,共6页
设计基于Tesseract引擎针对全血化验单内容的识别系统。利用混合边缘检测算子对图片进行边缘检测,排除背景噪声。通过透视变换、霍夫直线检测对图像进行倾斜校正,利用投影法切分不同类型字符识别区域,对切分的项目名称和结果利用二维OT... 设计基于Tesseract引擎针对全血化验单内容的识别系统。利用混合边缘检测算子对图片进行边缘检测,排除背景噪声。通过透视变换、霍夫直线检测对图像进行倾斜校正,利用投影法切分不同类型字符识别区域,对切分的项目名称和结果利用二维OTSU(大津算法)法对相应的图像进行二值化。利用Tesseract引擎使用集束搜索算法和K-近邻算法(KNN)进行预识别,经过校正后,重新训练生成全血化验单识别字库,利用生成字库进行识别。经过实验,该系统识别率为96.4%。该系统的实现,弥补了市场空白,避免手动输入的繁琐,提高了效率,有助于历史医疗数据保存和医疗大数据的发展。 展开更多
关键词 文字识别 图像处理 全血化验单识别 tesseract引擎
在线阅读 下载PDF
基于tesseract训练的电力告警信号特征识别方法 被引量:1
12
作者 陈东海 王猛 +1 位作者 吴昱浩 杨淇 《电子设计工程》 2023年第17期137-140,145,共5页
为缩小电力告警信号峭度指标极值差水平,增强电网主机对告警信号特征的识别准确性,提出基于tesseract训练的电力告警信号特征识别方法。在tesseract训练布局环境中,分别识别信号字符的特定行区域与列区域,完成基于tesseract训练的信号... 为缩小电力告警信号峭度指标极值差水平,增强电网主机对告警信号特征的识别准确性,提出基于tesseract训练的电力告警信号特征识别方法。在tesseract训练布局环境中,分别识别信号字符的特定行区域与列区域,完成基于tesseract训练的信号字符标记。在此基础上,提取关键电力告警信号特征,通过计算识别阈值方式,完成特征信号参量暂态传输行为处理,实现基于tesseract训练的电力告警信号特征识别方法设计。实验结果表明,与多特征组合识别方法相比,文中方法在tesseract训练引擎作用下,电力告警信号峭度指标极值差水平得到较好控制,提升了电网主机对告警信号特征的准确识别能力。 展开更多
关键词 tesseract训练 电力告警信号 特征识别 行区域 列区域 暂态行为
在线阅读 下载PDF
基于MSER和Tesseract的自然场景图像文字识别 被引量:9
13
作者 蒋弘毅 朱丽平 欧樟鹏 《电脑知识与技术》 2017年第11X期213-216,共4页
针对传统OCR技术对自然场景下的图像文本识别率低的问题,设计和实现了自然场景的图像文字自动识别系统。该系统主要采用了改进的MSER场景文本定位算法,利用Tesseract对图像文字样本进行训练,然后进行场景图像文字识别,并在MFC环境下实... 针对传统OCR技术对自然场景下的图像文本识别率低的问题,设计和实现了自然场景的图像文字自动识别系统。该系统主要采用了改进的MSER场景文本定位算法,利用Tesseract对图像文字样本进行训练,然后进行场景图像文字识别,并在MFC环境下实现。实验结果表明,训练后的Tesseract库对场景图像文字识别有显著提升。 展开更多
关键词 场景图像 二值化 MSER tesseract 文字识别
在线阅读 下载PDF
基于OpenCV和Tesseract的快递地址信息识别研究 被引量:1
14
作者 肖铭涵 邓定南 +2 位作者 林厚健 陈俊波 黄勇源 《电子测试》 2022年第22期51-54,共4页
本文设计了一种基于Open CV和Tesseract-OCR的快递地址信息识别系统,包括硬件采集系统和软件处理系统。软件处理系统包括预处理模块和字符识别模块。利用Open CV搭建图像预处理模块,实现快递单图像的颜色识别、灰度化处理、阈值化处理... 本文设计了一种基于Open CV和Tesseract-OCR的快递地址信息识别系统,包括硬件采集系统和软件处理系统。软件处理系统包括预处理模块和字符识别模块。利用Open CV搭建图像预处理模块,实现快递单图像的颜色识别、灰度化处理、阈值化处理、形态学处理等功能。利用Tesseract-OCR搭建字符识别模块,对预处理后图像实现快递地址信息的识别。对简单快递地址信息和复杂快递地址信息进行了识别实验。实验结果表明,所提方法可实现准确的快递地址信息识别,可应用于快递分类,提高快递分拣效率。 展开更多
关键词 快递分类 tesseract Open CV 字符识别
在线阅读 下载PDF
基于Tesseract-OCR的快递单中手机号码识别应用的实现 被引量:8
15
作者 李毅荣 郭磊 张漫杨 《电子测试》 2018年第22期8-10,共3页
本文利用Tesseract-OCR的开源引擎,实现了Android平台上的印刷数字识别,并将其应用在网上购物的印刷字体快递单上的手机号码识别。识别过程通过手机拍照,并在预览界面中画出一个矩形框来获取快递单上手机号码的主要位置,再利用Tesseract... 本文利用Tesseract-OCR的开源引擎,实现了Android平台上的印刷数字识别,并将其应用在网上购物的印刷字体快递单上的手机号码识别。识别过程通过手机拍照,并在预览界面中画出一个矩形框来获取快递单上手机号码的主要位置,再利用Tesseract-OCR的tesseract-two工具集并配合其英文字符语言文件进行图像布局分析和字符分割及其识别,最终将识别出来的手机号码进行拨打。 展开更多
关键词 ANDROID tesseract-OCR 手机号码 快递单
在线阅读 下载PDF
基于YOLO_v3和Tesseract5.0的高铁摩擦片编码识别算法研究 被引量:3
16
作者 李文龙 汪日伟 《天津理工大学学报》 2020年第6期24-28,41,共6页
为了解决高铁摩擦片编码识别应用中的字符区域分割和方向矫正问题,本文提出了基于YOLO_v3和Tesserac5.0的字符识别算法.首先,利用YOLO_v3网络截取含有字符的感兴趣区域,其次利用本文提出的单行字符矫正算法对图像进行矫正.最后,将灰度... 为了解决高铁摩擦片编码识别应用中的字符区域分割和方向矫正问题,本文提出了基于YOLO_v3和Tesserac5.0的字符识别算法.首先,利用YOLO_v3网络截取含有字符的感兴趣区域,其次利用本文提出的单行字符矫正算法对图像进行矫正.最后,将灰度化、阈值化后的字符图像输入到基于长短期记忆网络的Tesseract5.0算法中实现字符识别.实验结果表明,本算法有效解决了字符区域提取的问题,并解决了单行字符无法使用方向检测的问题.与传统算法相比具有较好的鲁棒性和较高的精度. 展开更多
关键词 YOLO_v3 tesseract5.0 角度纠正
在线阅读 下载PDF
基于Tesseract-OCR文本识别的检票系统研究 被引量:3
17
作者 聂霜霜 杨轶男 +1 位作者 卫晶 马建钟 《现代信息科技》 2022年第5期1-4,10,共5页
通过对已有手写字符识别相关技术和应用实例进行研究,发现Tesseract文本识别方法具有经济、可训练、识别准确等优点,设计了基于Tesseract文本识别的特殊手写字符检票系统。此系统结合数字图像处理技术,以谷歌开源OCR引擎Tesseract的字... 通过对已有手写字符识别相关技术和应用实例进行研究,发现Tesseract文本识别方法具有经济、可训练、识别准确等优点,设计了基于Tesseract文本识别的特殊手写字符检票系统。此系统结合数字图像处理技术,以谷歌开源OCR引擎Tesseract的字符识别技术为核心,并通过训练字库实现对多种选民手写选票的准确识别。测试结果表明,该系统具有实时性、交互性、高可靠性等特点,为纸质选票的传统人工唱票计票方式提供了智能解决方案。 展开更多
关键词 手写字符识别 选票识别系统 图像处理 tesseract-OCR
在线阅读 下载PDF
基于Tesseract的会计票据图像识别系统设计研究 被引量:2
18
作者 李沛霖 吕巍 +1 位作者 姚琳 尚丹梅 《中国管理信息化》 2021年第17期107-110,共4页
随着信息技术的快速发展,会计信息处理逐渐呈现智能化趋势,会计票据图像的识别及管理是会计信息智能化实现的重要组成部分。通过对会计票据图像识别系统的分析,对图像进行去噪声、二值化、倾斜矫正等预处理,然后使用Tesseract识别引擎... 随着信息技术的快速发展,会计信息处理逐渐呈现智能化趋势,会计票据图像的识别及管理是会计信息智能化实现的重要组成部分。通过对会计票据图像识别系统的分析,对图像进行去噪声、二值化、倾斜矫正等预处理,然后使用Tesseract识别引擎对样本票据图像进行预识别,校正识别完成后生成识别字库,最终利用字库进行会计票据图像识别。经试验该系统识别准确率较高,基本满足会计工作需求。通过探讨会计票据图像的识别方法,旨在为相关研究提供参考,推动会计信息处理的自动化和智能化。 展开更多
关键词 图像处理 会计票据 光学字符识别 tesseract
在线阅读 下载PDF
基于tesseract.js Web图片文字搜索定位浏览器扩展 被引量:1
19
作者 张斌和 《电脑知识与技术》 2023年第28期60-62,86,共4页
该研究设计和开发了一种基于tesseract.js的Web图片文字搜索定位的浏览器扩展,旨在为用户提供在Web浏览器中准确搜索和定位图片中的文字的便捷工具。该扩展利用tesseract.js作为OCR引擎,直接在浏览器中识别图片中的文字、提供搜索定位... 该研究设计和开发了一种基于tesseract.js的Web图片文字搜索定位的浏览器扩展,旨在为用户提供在Web浏览器中准确搜索和定位图片中的文字的便捷工具。该扩展利用tesseract.js作为OCR引擎,直接在浏览器中识别图片中的文字、提供搜索定位功能。实验结果表明,该扩展程序具有准确性和性能,能快速识别图像中的文字并提供准确的搜索定位结果。与传统OCR方法相比,该扩展消除了对专门硬件设备和繁重前期处理的依赖,为图像文字搜索与定位提供了轻量级、方便和高效的解决方案。该扩展可用于网页搜索、文本分析和信息抽取等任务,并具有广泛的应用潜力。 展开更多
关键词 tesseract.js OCR 图像文字搜索 浏览器扩展 搜索定位
在线阅读 下载PDF
Tesseract验证码识别探究 被引量:1
20
作者 胡晓辉 《工业控制计算机》 2021年第2期112-112,115,共2页
验证码(CAPTCHA)是"Completely Automated Public Turing test to tell Computers and Humans Apart"(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。目前已成为互联网上绝大部分... 验证码(CAPTCHA)是"Completely Automated Public Turing test to tell Computers and Humans Apart"(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。目前已成为互联网上绝大部分网站为保证网站数据安全,防止恶意入侵、恶意灌水,而采用的通行安全机制。采用Tesseract引擎探究图像验证码识别技术的使用,以Python语言为例,详细说明Tesseract在图像验证码识别中使用技巧。 展开更多
关键词 tesseract 验证码识别 图像处理
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部