期刊文献+
共找到1,038篇文章
< 1 2 52 >
每页显示 20 50 100
AWeb Application Fingerprint Recognition Method Based on Machine Learning
1
作者 Yanmei Shi Wei Yu +1 位作者 Yanxia Zhao Yungang Jia 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第7期887-906,共20页
Web application fingerprint recognition is an effective security technology designed to identify and classify web applications,thereby enhancing the detection of potential threats and attacks.Traditional fingerprint r... Web application fingerprint recognition is an effective security technology designed to identify and classify web applications,thereby enhancing the detection of potential threats and attacks.Traditional fingerprint recognition methods,which rely on preannotated feature matching,face inherent limitations due to the ever-evolving nature and diverse landscape of web applications.In response to these challenges,this work proposes an innovative web application fingerprint recognition method founded on clustering techniques.The method involves extensive data collection from the Tranco List,employing adjusted feature selection built upon Wappalyzer and noise reduction through truncated SVD dimensionality reduction.The core of the methodology lies in the application of the unsupervised OPTICS clustering algorithm,eliminating the need for preannotated labels.By transforming web applications into feature vectors and leveraging clustering algorithms,our approach accurately categorizes diverse web applications,providing comprehensive and precise fingerprint recognition.The experimental results,which are obtained on a dataset featuring various web application types,affirm the efficacy of the method,demonstrating its ability to achieve high accuracy and broad coverage.This novel approach not only distinguishes between different web application types effectively but also demonstrates superiority in terms of classification accuracy and coverage,offering a robust solution to the challenges of web application fingerprint recognition. 展开更多
关键词 Web application fingerprint recognition unsupervised learning clustering algorithm feature extraction automated testing network security
在线阅读 下载PDF
面向档案数字化的OCR识别技术优化与应用 被引量:1
2
作者 陈泽玺 《机电兵船档案》 2025年第3期17-20,共4页
针对档案OCR识别中的质量差异和准确率不稳定问题,提出一套深度学习优化方案。通过改进图像预处理、特征提取和深度学习训练,构建了自适应参数配置系统和端到端识别模型。实验表明,该方案提升识别准确率至98%,处理效率提高40%,成功解决... 针对档案OCR识别中的质量差异和准确率不稳定问题,提出一套深度学习优化方案。通过改进图像预处理、特征提取和深度学习训练,构建了自适应参数配置系统和端到端识别模型。实验表明,该方案提升识别准确率至98%,处理效率提高40%,成功解决了历史档案老化、字体复杂等技术难题,为档案智能化管理提供新思路。 展开更多
关键词 档案数字化 ocr识别 深度学习 图像预处理 智能管理
在线阅读 下载PDF
A Communication Scene Recognition Framework Based on Deep Learning with Multi-Sensor Fusion
3
作者 Feng Yufei Zhong Xiaofeng +1 位作者 Chen Xinwei Zhou Shidong 《China Communications》 2025年第4期174-201,共28页
This paper presents a comprehensive framework that enables communication scene recognition through deep learning and multi-sensor fusion.This study aims to address the challenge of current communication scene recognit... This paper presents a comprehensive framework that enables communication scene recognition through deep learning and multi-sensor fusion.This study aims to address the challenge of current communication scene recognition methods that struggle to adapt in dynamic environments,as they typically rely on post-response mechanisms that fail to detect scene changes before users experience latency.The proposed framework leverages data from multiple smartphone sensors,including acceleration sensors,gyroscopes,magnetic field sensors,and orientation sensors,to identify different communication scenes,such as walking,running,cycling,and various modes of transportation.Extensive experimental comparative analysis with existing methods on the open-source SHL-2018 dataset confirmed the superior performance of our approach in terms of F1 score and processing speed.Additionally,tests using a Microsoft Surface Pro tablet and a self-collected Beijing-2023 dataset have validated the framework's efficiency and generalization capability.The results show that our framework achieved an F1 score of 95.15%on SHL-2018and 94.6%on Beijing-2023,highlighting its robustness across different datasets and conditions.Furthermore,the levels of computational complexity and power consumption associated with the algorithm are moderate,making it suitable for deployment on mobile devices. 展开更多
关键词 communication scene recognition deep learning sensor fusion SHL smartphone-based applications
在线阅读 下载PDF
A YOLOv11-Based Deep Learning Framework for Multi-Class Human Action Recognition
4
作者 Nayeemul Islam Nayeem Shirin Mahbuba +4 位作者 Sanjida Islam Disha Md Rifat Hossain Buiyan Shakila Rahman M.Abdullah-Al-Wadud Jia Uddin 《Computers, Materials & Continua》 2025年第10期1541-1557,共17页
Human activity recognition is a significant area of research in artificial intelligence for surveillance,healthcare,sports,and human-computer interaction applications.The article benchmarks the performance of You Only... Human activity recognition is a significant area of research in artificial intelligence for surveillance,healthcare,sports,and human-computer interaction applications.The article benchmarks the performance of You Only Look Once version 11-based(YOLOv11-based)architecture for multi-class human activity recognition.The article benchmarks the performance of You Only Look Once version 11-based(YOLOv11-based)architecture for multi-class human activity recognition.The dataset consists of 14,186 images across 19 activity classes,from dynamic activities such as running and swimming to static activities such as sitting and sleeping.Preprocessing included resizing all images to 512512 pixels,annotating them in YOLO’s bounding box format,and applying data augmentation methods such as flipping,rotation,and cropping to enhance model generalization.The proposed model was trained for 100 epochs with adaptive learning rate methods and hyperparameter optimization for performance improvement,with a mAP@0.5 of 74.93%and a mAP@0.5-0.95 of 64.11%,outperforming previous versions of YOLO(v10,v9,and v8)and general-purpose architectures like ResNet50 and EfficientNet.It exhibited improved precision and recall for all activity classes with high precision values of 0.76 for running,0.79 for swimming,0.80 for sitting,and 0.81 for sleeping,and was tested for real-time deployment with an inference time of 8.9 ms per image,being computationally light.Proposed YOLOv11’s improvements are attributed to architectural advancements like a more complex feature extraction process,better attention modules,and an anchor-free detection mechanism.While YOLOv10 was extremely stable in static activity recognition,YOLOv9 performed well in dynamic environments but suffered from overfitting,and YOLOv8,while being a decent baseline,failed to differentiate between overlapping static activities.The experimental results determine proposed YOLOv11 to be the most appropriate model,providing an ideal balance between accuracy,computational efficiency,and robustness for real-world deployment.Nevertheless,there exist certain issues to be addressed,particularly in discriminating against visually similar activities and the use of publicly available datasets.Future research will entail the inclusion of 3D data and multimodal sensor inputs,such as depth and motion information,for enhancing recognition accuracy and generalizability to challenging real-world environments. 展开更多
关键词 Human activity recognition YOLOv11 deep learning real-time detection anchor-free detection attention mechanisms object detection image classification multi-class recognition surveillance applications
在线阅读 下载PDF
OCR识别技术在档案工作中的应用
5
作者 侯思宏 《兰台世界》 2025年第10期48-51,共4页
OCR识别技术的不断发展,为档案信息化工作提供了新的思路,档案全文检索成为可能。在实际工作中,开展档案OCR识别工作还面临一些问题和挑战,本文通过阐述OCR识别技术的发展及工作原理,分析其给档案工作带来的影响,同时探讨需要解决的问题... OCR识别技术的不断发展,为档案信息化工作提供了新的思路,档案全文检索成为可能。在实际工作中,开展档案OCR识别工作还面临一些问题和挑战,本文通过阐述OCR识别技术的发展及工作原理,分析其给档案工作带来的影响,同时探讨需要解决的问题,提出针对性的解决措施。 展开更多
关键词 ocr识别技术 档案 数字化 信息化
原文传递
基于识别框局部重建改进的PaddleOCR数码管识别的方法
6
作者 马婷婷 钟超淳 《机电工程技术》 2025年第15期93-97,共5页
在工业监控和智能设备领域,数码管识别是一项关键技术,但现有的光学字符识别(OCR)方法在处理连续数字时面临诸多挑战。针对PaddleOCR在识别数码管显示时的局限性,提出了一种基于局部重建的改进算法。该算法通过图像预处理、局部重建和... 在工业监控和智能设备领域,数码管识别是一项关键技术,但现有的光学字符识别(OCR)方法在处理连续数字时面临诸多挑战。针对PaddleOCR在识别数码管显示时的局限性,提出了一种基于局部重建的改进算法。该算法通过图像预处理、局部重建和符号识别3个阶段,有效提升了连续数字识别的准确性。算法首先对输入图像进行灰度化、自适应二值化和中值滤波等预处理,增强图像对比度并去除噪声。在局部重建阶段,通过几何约束和邻近性检测,将数码管的离散发光段精准融合,生成完整的数字区域轮廓矩形框。符号识别环节则利用轮廓的几何位置关系,准确分离和识别负号与小数点,有效解决了传统OCR模型在符号识别上的难点。实验结果验证了该方法的优越性:在不依赖神经网络重新训练的前提下,数码管数字的识别准确率从40.1%显著提升至90.7%,符号识别准确率达到72.3%。这一创新方法不仅降低了算法的计算复杂度,还为工业场景中的数码管识别提供了高效可靠的解决方案。 展开更多
关键词 数码管识别 局部重建 ocr识别
在线阅读 下载PDF
面向复杂物流面单的OCR信息提取系统
7
作者 凌毅 苏春霖 +2 位作者 蓝江伟 李阳军 林维彬 《福建电脑》 2025年第6期70-75,共6页
传统的烟草监管部门在面单信息识别上面临人工成本高、处理效率低的问题。为了解决这一问题,本文设计并实现了一个基于深度学习的物流面单识别系统。该系统通过YOLO模型对快递公司进行分类,利用OCR技术提取面单中的关键信息,并结合正则... 传统的烟草监管部门在面单信息识别上面临人工成本高、处理效率低的问题。为了解决这一问题,本文设计并实现了一个基于深度学习的物流面单识别系统。该系统通过YOLO模型对快递公司进行分类,利用OCR技术提取面单中的关键信息,并结合正则表达式对地址、电话等信息进行有效匹配和提取。实验结果表明,快递公司分类的准确率均在95%以上,有50%的快递公司的面单OCR识别准确率超过了80%,说明系统在复杂面单上的识别精度较高。 展开更多
关键词 物流面单识别 烟草监管 深度学习 光学字符识别
在线阅读 下载PDF
基于OCR识别技术的多方交易数据完整性验证方法研究
8
作者 李玉 刘俊 +3 位作者 高也 胡怡 徐升辉 张斓曦 《信息技术》 2025年第9期120-125,共6页
常规的多方交易数据完整性验证主要采用数据边界值验证法,忽略了数据堆叠对验证过程造成的影响,导致数据完整性验证结果生成代价较高。因此,提出基于光学字符识别(OCR)技术的多方交易数据完整性验证方法。采用OCR识别技术分别切分数据... 常规的多方交易数据完整性验证主要采用数据边界值验证法,忽略了数据堆叠对验证过程造成的影响,导致数据完整性验证结果生成代价较高。因此,提出基于光学字符识别(OCR)技术的多方交易数据完整性验证方法。采用OCR识别技术分别切分数据行及字符,根据切分的数据抽取交易的全局特征。构建交易数据特征的柯西矩阵,分析验证数据的完整性。实验结果表明:所提方法应用后得出的多方交易数据完整性验证结果表现出的生成代价较低,验证性能较优,满足了多方交易环节中对交易数据可信度的需求。 展开更多
关键词 多方交易 交易数据 数据完整性 ocr识别技术 完整性验证
在线阅读 下载PDF
基于OCR技术在室内环境报告制作中的应用
9
作者 刘淑波 朱一驰 +2 位作者 潘萍玲 刘辉廷 胡贺松 《广州建筑》 2025年第5期68-73,共6页
随着智能建筑的快速发展,室内环境质量监测对保障居住者健康与舒适性至关重要。然而,传统的室内环境报告制作依赖人工数据采集与编辑,存在效率低、耗时长、易引入人为误差等弊端,难以满足智能建筑对实时监测与高精度报告的迫切需求。针... 随着智能建筑的快速发展,室内环境质量监测对保障居住者健康与舒适性至关重要。然而,传统的室内环境报告制作依赖人工数据采集与编辑,存在效率低、耗时长、易引入人为误差等弊端,难以满足智能建筑对实时监测与高精度报告的迫切需求。针对这一问题,本文提出一种基于OCR技术的室内环境报告自动化制作方法,旨在实现从数据采集到报告生成的高效转化。研究以OCR技术为核心,集成图像分割算法、自然语言处理、Python自动化脚本及深度学习驱动的文本识别模块,构建了一套完整的自动化处理系统。通过简化众多繁琐且重复的任务,该项目显著提升了工作效率,同时,报告的精确度和标准化水平也得到了相应的增强。该技术的应用为室内环境报告制作提供了一种创新的解决路径,其前景值得进一步研究和开发。 展开更多
关键词 智能建筑应用 数据处理 室内环境监测 ocr技术
在线阅读 下载PDF
基于OCR的药品信息识别系统设计
10
作者 张定华 马小强 +2 位作者 赖佳华 官敬超 巢建树 《中国医疗设备》 2025年第8期13-19,63,共8页
目的 为解决传统药品生产过程中人工检测药品包装三期信息(批号、生产日期和有效期)效率低、错误率高的问题,设计一种融合光学成像优化与深度学习算法改进的光学字符识别系统。方法 通过构建多角度LED光源与工业相机协同的硬件检测平台... 目的 为解决传统药品生产过程中人工检测药品包装三期信息(批号、生产日期和有效期)效率低、错误率高的问题,设计一种融合光学成像优化与深度学习算法改进的光学字符识别系统。方法 通过构建多角度LED光源与工业相机协同的硬件检测平台,结合光度立体技术增强压印字符成像质量;软件算法采用改进的DBNet检测模型集成可变形卷积模块和特征金字塔增强模块-特征融合模块架构与集成可变形注意力机制的ABINet识别模型,用于提升复杂场景下的文本检测与低质量字符识别能力。结果 系统在1200张低质量药品图像测试中,识别准确度为89.0%,较传统ABINet模型提高了3.7%;同时,在生产线实测中,对5类药品包装检测准确度达98.5%以上,系统检测平均耗时约为人工检测平均耗时的1/4。结论 该研究通过硬件成像优化与算法架构创新,有效地解决了当前药企中对于药品信息识别的易错难控问题。 展开更多
关键词 药品信息识别 光度立体技术 光学字符识别 工业相机 特征增强 可变形注意力机制
在线阅读 下载PDF
我国民族语言文献文本数字化识别问题——基于OCR及其工具 被引量:5
11
作者 范俊军 刘贤娴 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2024年第6期31-45,共15页
我国少数民族语言文献数量庞大,文字种类繁多,内容涵盖政治、经济、法律、历史、文学、艺术、宗教、天文、地理、医药等领域,是中华民族文化知识的重要组成部分。构建各民族文献文本数据,使之应用于自然语言处理和人工智能,能有效促进... 我国少数民族语言文献数量庞大,文字种类繁多,内容涵盖政治、经济、法律、历史、文学、艺术、宗教、天文、地理、医药等领域,是中华民族文化知识的重要组成部分。构建各民族文献文本数据,使之应用于自然语言处理和人工智能,能有效促进中华优秀传统知识创新性传承,促进知识社会化,是对各民族语言古文献和现代书报刊进行文字识别和文本转换数据构建的基础。国内早期OCR技术虽然解决了几种主要少数民族文字识别的问题,但因字符为非Unicode基本集编码而弃用。当前OCR技术已能较好识别蒙、藏、维、哈、朝等文种文献,但在处理我国汉文与少数民族文字混排图像文本时仍然效果不佳。因此应推进少数民族语言文献OCR识别技术创新。我国少数民族语言文献现行活态文字有十多种,其中非拉丁字系的文字有11种,OCR技术应重点解决这类少数民族语言字系的抄本、刻版和铅字印刷文本,以及汉文与民族文字混排文本的识别问题,研发开放的多功能工具和平台。在此基础上,进一步开展少数民族语言文献文本大规模数据构建,以促进我国语言科学研究和自然语言处理的创新发展。 展开更多
关键词 少数民族语言 民族文献 文本识别 ocr 数据构建 数字人文
在线阅读 下载PDF
A sustainable development OCR system in CADAL application 被引量:1
12
作者 黄晨 赵继海 胡晓 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1312-1317,共6页
This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on ... This paper briefly introduces the main ideas of a sustainable development OCR system based on open architecture techniques and then describes the construction of an optical character recognition (OCR) center built on computer clusters, for the purpose of dynamically improving the recognition precision of the digitized texts of a million volumes of books produced by the China-US Million Books Digital Library (CADAL) Project. The practice of this center will provide helpful reference for other digital library projects. 展开更多
关键词 Sustainable Development Digital Library optical character recognition ocr China-US Million Books Digital Library (CADAL)
在线阅读 下载PDF
基于OCR和Pydicom的PACS数据库数据丢失后的应急与恢复研究 被引量:1
13
作者 朱贵鲜 李桃 +1 位作者 俞磊 丁如一 《中国医疗设备》 2024年第7期74-78,89,共6页
目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取... 目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取PDF和DCOM文件中的基本信息,重新建立起患者、影像、报告三者之间的联系,并将关联数据写入数据库。结果经抽样验证,该方法识别同类图像精度的准确度、精准度及召回率均为100%,综合指标F1值为1,在不同组别独立样本间的识别精度表现出一致性。平均每份报告识别时间约为0.14 s(t=-1.005,P=0.315),说明不同组别独立样本间的识别时间表现出一致性。结论该方法的使用能有效缩短数据库故障后患者等待时长,能够在短时间内恢复医疗秩序,可用于PACS数据库数据丢失后的应急处置,也为PACS的数据整合提供依据,为医学影像数据恢复和数据整合提供一种新思路。 展开更多
关键词 光学字符识别 PACS数据 应急处置 深度学习 DCOM信息提取 图像文字识别
在线阅读 下载PDF
Transmission Considerations with QoS Support to Deliver Real-Time Distributed Speech Recognition Applications
14
作者 Zhu Xiao-gang Zhu Hong-wen Rong Meng-tian 《Wuhan University Journal of Natural Sciences》 EI CAS 2002年第1期65-70,共6页
Distributed speech recognition (DSR) applications have certain QoS (Quality of service) requirements in terms of latency, packet loss rate, etc. To deliver quality guaranteed DSR application over wirelined or wireless... Distributed speech recognition (DSR) applications have certain QoS (Quality of service) requirements in terms of latency, packet loss rate, etc. To deliver quality guaranteed DSR application over wirelined or wireless links, some QoS mechanisms should be provided. We put forward a RTP/RSVP transmission scheme with DSR-specific payload and QoS parameters by modifying the present WAP protocol stack. The simulation result shows that this scheme will provide adequate network bandwidth to keep the real-time transport of DSR data over either wirelined or wireless channels. 展开更多
关键词 distributed speech recognition quality of service real-time transmission protocol resource reservation protocol wireless application protocol
在线阅读 下载PDF
The Application of Pattern Recognition to the Formability of Quasicrystal Formation in Al-alloys
15
作者 罗学才 程兆年 +1 位作者 陈念贻 潘毓刚 《Journal of Materials Science & Technology》 SCIE EI CAS CSCD 1989年第1期51-52,共2页
Four parameters of chemical bond havebeen used to span a feature space to classifyquasicrystal-forming Al-alloys from thatalloys without quasicrystal formationwith good result. Since the first quasicrystal-formingsyst... Four parameters of chemical bond havebeen used to span a feature space to classifyquasicrystal-forming Al-alloys from thatalloys without quasicrystal formationwith good result. Since the first quasicrystal-formingsystem, Al-Mn system, discovered by She-chtman in 1984[1], a series of quasicrystal-forming binary alloy systems have beenfound. Most of these systems are Al-contain-ing systems. Bancel has indicated thatthere are three factors affecting theformability of quasicrystals [2]: (1) ele-ctrochemical factor (this factor can be 展开更多
关键词 AI The application of Pattern recognition to the Formability of Quasicrystal Formation in Al-alloys Al
在线阅读 下载PDF
基于Paddle OCR识别水准标尺检定证书的方法研究 被引量:2
16
作者 齐文 刘晓云 +2 位作者 王建文 马润霞 刘和平 《测绘与空间地理信息》 2024年第9期188-191,196,共5页
传统水准测量数据处理作业中,采用人工方式读取标尺检定证书信息,一定程度制约了水准测量数据处理实现全流程自动化。本文基于Paddle OCR模型识别标尺检定证书图片中的文字信息,对块状识别结果进行分行整理,经过数据清洗、联系上下文、... 传统水准测量数据处理作业中,采用人工方式读取标尺检定证书信息,一定程度制约了水准测量数据处理实现全流程自动化。本文基于Paddle OCR模型识别标尺检定证书图片中的文字信息,对块状识别结果进行分行整理,经过数据清洗、联系上下文、信息互补校验等操作后获取关键信息,实现了水准标尺检定信息的自动化提取。经验证,该识别方法精度达到98.7%,可以承担工程应用中对算者的角色,为实现人工智能技术与测绘地理信息专业的交叉融合提供技术参考,也为未来开发智能化无人水准测量数据处理软件提供技术储备。 展开更多
关键词 水准标尺检定证书 Paddle ocr 图片文字识别 人工智能
在线阅读 下载PDF
Optical Character Recognition Functionality Introduction in Mobile Application for Car Diary
17
作者 Ioannis Patias 《Journal of Electrical Engineering》 2017年第6期335-339,共5页
The purpose of the paper is to develop a mobile Android application--"Car Log" that gives to users the ability to track all the costs for a vehicle and the ability to add fuel cost data by taking a photo of the cash... The purpose of the paper is to develop a mobile Android application--"Car Log" that gives to users the ability to track all the costs for a vehicle and the ability to add fuel cost data by taking a photo of the cash receipt from the respective gas station where the charging was performed. OCR (optical character recognition) is the conversion of images of typed, handwritten or printed text into machine-encoded text. Once we have the text machine-encoded we can further use it in machine processes, like translation, or extracted, meaning text-to-speech transformed, helping people in simple everyday tasks. Users of the application will be able to enter other completely different costs grouped into categories and other charges. Car Log application quickly and easily can visualize, edit and add different costs for a ear. It also supports the ability to add multiple profiles, by entering data for all ears in a single family, for example, or a small business. The test results are positive thus we intend to further develop a cloud ready application. 展开更多
关键词 Optical character recognition mobile application car diary.
在线阅读 下载PDF
OCR人脸识别技术在工号管理领域的应用探索
18
作者 程裕霞 柯舜萍 +1 位作者 鄂梅 朱奕佳 《软件》 2024年第8期63-65,共3页
本文以断卡行动为契机,提出了员工实人认证申请工号,实名登陆使用工号的方法,有效地保障了生产作业系统存储的业务数据安全。该方法依赖OCR人脸识别实现对员工工号的实名管理,通过建设平台化的支撑能力弥补登录方式单一、使用不便带来... 本文以断卡行动为契机,提出了员工实人认证申请工号,实名登陆使用工号的方法,有效地保障了生产作业系统存储的业务数据安全。该方法依赖OCR人脸识别实现对员工工号的实名管理,通过建设平台化的支撑能力弥补登录方式单一、使用不便带来的安全漏洞,解决采用工号挪用、复用、盗用等方式进行盗办业务、盗取系统信息而导致的业务数据安全问题。 展开更多
关键词 ocr 人脸识别 活体登录 工号管理
在线阅读 下载PDF
OCR识别技术在文档智能化领域运用分析 被引量:4
19
作者 蓝飘 《信息与电脑》 2024年第10期67-69,共3页
为提升办公效率,增加文档数据信息录入、数据整合准确性,引入光学字符识别(Optical Character Recognition,OCR)技术,可有效地实现文档智能化运用。文本针对OCR识别技术基本特征、在不同行业中应用现状、技术优势等方面进行分析,重点关... 为提升办公效率,增加文档数据信息录入、数据整合准确性,引入光学字符识别(Optical Character Recognition,OCR)技术,可有效地实现文档智能化运用。文本针对OCR识别技术基本特征、在不同行业中应用现状、技术优势等方面进行分析,重点关注OCR识别技术的功能升级,研究其在文档智能化领域的应用,以期能够增加OCR识别技术的扩展性。 展开更多
关键词 ocr技术 文档智能化 应用分析
在线阅读 下载PDF
基于深度学习与OCR识别技术的合同审核与标注方法 被引量:1
20
作者 胡长生 《福建技术师范学院学报》 2024年第5期30-37,共8页
针对当前合同审核方法无法高精度识别合同内容,标注时间长的问题,提出了基于深度学习和OCR识别技术的合同审核与标注方法.基于OCR识别技术构建合同文本识别模型,利用OCR识别引擎将纸质文档中的文字转换成为黑白图像;然后对黑白合同文本... 针对当前合同审核方法无法高精度识别合同内容,标注时间长的问题,提出了基于深度学习和OCR识别技术的合同审核与标注方法.基于OCR识别技术构建合同文本识别模型,利用OCR识别引擎将纸质文档中的文字转换成为黑白图像;然后对黑白合同文本图像进行二值化预处理,计算图像相似度;基于相似度梯度对图像进行标准差局部对比和赋值处理,以分割字符前景与页面背景,完成合同审核;构建基于深度学习的目标标注模型,确定各合同段落特征向量,将文字段落的特征向量分类转化为二次函数寻优问题,进行段落图像的特征分类优化;引入回归理论修正标注模型的损失函数,以缩小合同段落标注模型输出与预测结果之间的误差,完成合同标注.由实例分析结果可知,该方法能够通过对比定稿文件和用印文件获取详细的差异列表,且合同标注速度较快,合同文本的正确识别率较高. 展开更多
关键词 深度学习 ocr识别技术 合同审核 合同标注
在线阅读 下载PDF
上一页 1 2 52 下一页 到第
使用帮助 返回顶部