期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Tesseract_OCR文字识别的研究 被引量:22
1
作者 曾悦 马明栋 《计算机技术与发展》 2021年第11期76-80,共5页
光学字符识别(optical character recognition,OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机... 光学字符识别(optical character recognition,OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字。该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析。文字信息提取模块包括图像预处理、文字信息区域的截取和修正、字符分割,对输入的图片进行处理,以降低随机噪声,确保文字信息区域包含完整的文字信息,提高识别的准确性。使用Tesseract的OCR引擎对处理后的文字信息区域部分进行识别,提取出图片中的文字信息。微软基础类库(Microsoft foundation classes,MFC),是微软公司实现的一个C++类库,主要封装了一部分的API函数,灵活性大。最后,在VS2015环境下使用微软基础类库实现了一个文字识别系统,并对样本图片库进行系统的测试。测试结果表明,该系统具有更高的识别率。 展开更多
关键词 光学字符识别 文字识别 tesseract框架 微软基础类库 C++
在线阅读 下载PDF
基于Tesseract文字识别的预处理研究 被引量:7
2
作者 章安 马明栋 《计算机技术与发展》 2021年第1期73-76,174,共5页
针对Tesseract文字识别框架对输入图像的像素要求,以及图像采集过程中可能出现的歪斜、黑边等情况,基于文字识别流程,对预处理阶段的二值化、缩放、边框处理与倾斜矫正进行研究与C++代码的实现。对文字识别OCR(optical character recogn... 针对Tesseract文字识别框架对输入图像的像素要求,以及图像采集过程中可能出现的歪斜、黑边等情况,基于文字识别流程,对预处理阶段的二值化、缩放、边框处理与倾斜矫正进行研究与C++代码的实现。对文字识别OCR(optical character recognition,光学字符识别)的流程进行了概述,重点研究图像缩放与二值化过程,利用双线性插值算法逐像素、逐行分别对横纵坐标进行线性插值,完成图像缩放;利用最大类间方差法、聚类的思想,遍历灰度值,获取最佳二值化阈值,实现图像的二值化。参考OpenCV库函数,提出图像边框与偏移的处理思路。在VS2015环境下基于Tesseract框架,对整个流程进行实现,介绍了Tesseract框架的接口与功能、输入与输出参数。图像的预处理对文字识别必不可少,有利于Tesseract之后的识别工作。 展开更多
关键词 OCR 文字识别 预处理 tesseract框架 C++
在线阅读 下载PDF
基于Android平台的移动智能翻译系统设计与实现 被引量:6
3
作者 贠旭 《微型电脑应用》 2022年第2期53-55,59,共4页
设计了一种基于Tesseract的手机智能翻译系统。这个系统以Linux操作系统内核为基础,在Tesseract框架下搭建OCR引擎,在Android平台中进行二次开发,采用SQLite作为系统数据库。系统包含即时翻译、拍照翻译、字典翻译三个基本功能模块,充... 设计了一种基于Tesseract的手机智能翻译系统。这个系统以Linux操作系统内核为基础,在Tesseract框架下搭建OCR引擎,在Android平台中进行二次开发,采用SQLite作为系统数据库。系统包含即时翻译、拍照翻译、字典翻译三个基本功能模块,充分满足了用户字符图片、照片字段的实时翻译以及字典查询的需求。实际应用结果表明,通过JNI技术和多线程断点续传技术的实现系统进一步增强了手机翻译软件的功能性和高效性。 展开更多
关键词 ANDROID平台 智能翻译系统 移动终端 OCR识别 tesseract框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部