期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
改进YOLO11n和PaddleOCR的煤矿钻场视频自动剪辑方法
1
作者 李小军 李淼 赵明炀 《计算机工程与应用》 北大核心 2025年第17期209-221,共13页
为解决煤矿井下瓦斯抽采钻场监控视频数据规模大、传统人工剪辑效率低的问题,提出一种将YOLO11n和PaddleOCR相结合的视频自动剪辑方法。使用YOLO11n检测视频图像帧中的指示牌目标,并根据检测框坐标信息进行裁剪;将裁剪的目标区域输入Pad... 为解决煤矿井下瓦斯抽采钻场监控视频数据规模大、传统人工剪辑效率低的问题,提出一种将YOLO11n和PaddleOCR相结合的视频自动剪辑方法。使用YOLO11n检测视频图像帧中的指示牌目标,并根据检测框坐标信息进行裁剪;将裁剪的目标区域输入PaddleOCR中进行文字识别;依据设定的剪辑逻辑规则对视频进行自动剪辑。为提升YOLO11n在煤矿井下复杂环境的检测精度,提出一种新的模块Faster-EMA来替代C3k2中的Bottleneck,引入FasterBlock及EMA注意力机制,增强多尺度特征表达能力并降低冗余计算;在C2PSA层后引入Triplet Attention,通过三分支结构捕获跨维交互来计算注意力权重,进一步增强特征提取效果;采用PIoUv2替代默认损失函数CIoU以解决锚框扩展问题。同时使用改进后的YOLO11n替换PaddleOCR中的文本检测算法DBNet,解决实时性不足问题。在自建的指示牌数据集上进行实验验证,结果表明,改进的YOLO11n对比原模型,mAP50提升4.8个百分点,且使用改进YOLO11n替代DBNet后视频平均处理速度提升51.0%,FPS达到37帧/s,满足实时性需求。研究实现了基于指示牌文字内容的钻场监控视频自动剪辑,为煤矿智能化发展提供了技术参考。 展开更多
关键词 煤矿钻场 视频剪辑 文本识别 YOLO11n paddleocr
在线阅读 下载PDF
基于PaddleOCR的识别技术在单据表格中的应用
2
作者 杨曼 黄远民 严克剑 《科技视界》 2025年第28期47-50,共4页
PaddleOCR是一个基于飞桨PaddlePaddle深度学习框架开发的开源光学字符识别(OCR)工具库,旨在提供高效、准确的文字识别功能。在单据表格中,PaddleOCR图像识别技术可以应用于单据信息的提取和处理,主要涉及文本检测、文本识别和文本识别... PaddleOCR是一个基于飞桨PaddlePaddle深度学习框架开发的开源光学字符识别(OCR)工具库,旨在提供高效、准确的文字识别功能。在单据表格中,PaddleOCR图像识别技术可以应用于单据信息的提取和处理,主要涉及文本检测、文本识别和文本识别后的处理3个核心任务,实现自动化识别、分类和分析单据信息。 展开更多
关键词 paddleocr 单据表格 文本识别 置信度
在线阅读 下载PDF
PaddleOCR技术在钢管喷印设备检测中的应用研究 被引量:1
3
作者 韩庆生 黄明 +1 位作者 刘树春 王光朋 《设备管理与维修》 2025年第7期160-163,共4页
钢管喷印设备普遍采用开放性系统,存在重复喷印与漏喷印等问题。通过引入百度飞桨PaddleOCR实时对钢管喷印的关键内容比对和准确性评估,消除重复喷印与漏喷印质量隐患,提升钢管行业的智慧制造水平。
关键词 paddleocr 管体喷印 检测 漏喷
在线阅读 下载PDF
基于PaddleOCR识别线缆物资标签的研究
4
作者 金涌川 孙文仲 +3 位作者 王冠宇 曲国栋 陈文昊 纪忠军 《现代信息科技》 2025年第9期128-131,共4页
随着我国经济社会快速发展,越来越多的线缆物资被生产和保存以用于建设,但数量众多的线缆物资对管理人员的统计和管理带来了严峻的挑战。文章研究了一种高效的线缆物资标签识别模型,解决线缆管理过程中存在的效率低下和易出错等问题。... 随着我国经济社会快速发展,越来越多的线缆物资被生产和保存以用于建设,但数量众多的线缆物资对管理人员的统计和管理带来了严峻的挑战。文章研究了一种高效的线缆物资标签识别模型,解决线缆管理过程中存在的效率低下和易出错等问题。通过运用灰度图像处理、二值化图像、形态学处理、连通域标记、边缘检测等图像处理技术进行图像预处理,再使用光学字符识别技术提取文本信息以便保存有效信息。实验结果表明,提出的方法在标签识别方面表现出色,标签文本信息识别准确率达到95%。该研究为线缆物资的自动化管理提供实用的技术支持,也为相关领域进一步研究提供重要参考。 展开更多
关键词 图像处理 paddleocr 自动化管理
在线阅读 下载PDF
基于PaddleOCR与Style-Text的金融票据手写体文本识别 被引量:4
5
作者 张辉煌 王鸿硕 《科技创新与应用》 2024年第30期68-71,共4页
该文提出一种基于PaddleOCR框架的金融票据手写体文本识别方法,通过引入基于生成对抗网络(GAN)的数据合成工具Style-Text,增强模型对不同背景文本的识别能力。在真实的金融票据数据集上进行的实验表明,该方法在处理复杂文本和低质量图... 该文提出一种基于PaddleOCR框架的金融票据手写体文本识别方法,通过引入基于生成对抗网络(GAN)的数据合成工具Style-Text,增强模型对不同背景文本的识别能力。在真实的金融票据数据集上进行的实验表明,该方法在处理复杂文本和低质量图像方面表现出显著的优势,证明其在金融票据手写体文本识别中的有效性和实用性。 展开更多
关键词 金融票据识别 paddleocr 数据合成 手写体 文本识别
在线阅读 下载PDF
开源PaddleOCR技术在企业营业执照识别上的改进与实践 被引量:11
6
作者 仇建民 《现代信息科技》 2021年第9期65-69,74,共6页
文章设计一种用于识别企业营业执照图像的算法,其可自动提取统一社会信用代码、公司名称等关键字段信息。以开源PaddleOCR框架为基础,通过图像方向自动调整、文本输出结构化、局部二次识别等一系列改进措施,解决了多种图片质量不佳情况... 文章设计一种用于识别企业营业执照图像的算法,其可自动提取统一社会信用代码、公司名称等关键字段信息。以开源PaddleOCR框架为基础,通过图像方向自动调整、文本输出结构化、局部二次识别等一系列改进措施,解决了多种图片质量不佳情况下仅通过PaddleOCR无法准确识别信息的问题,整体识别准确率提升至90%以上,且实现秒级检测。该成果已投入实际使用,辅助前台操作人员快速识别所填写的营业执照信息是否准确,提高人工录入效率。 展开更多
关键词 paddleocr 图像识别 企业营业执照 AI
在线阅读 下载PDF
基于PaddleOCR和Spark分布式处理技术的图片身份证号码检测系统
7
作者 张艺轩 张勇 《网络安全技术与应用》 2025年第12期42-44,共3页
为了避免师生敏感信息泄露,需要对学校网站、公众号等平台发布的海量图片进行身份证号码识别。为了准确、高效地执行这一任务,本文开发了基于PaddleOCR和Spark分布式处理技术识别身份证号码的系统。先从理论上阐述了使用PaddleOCR现有... 为了避免师生敏感信息泄露,需要对学校网站、公众号等平台发布的海量图片进行身份证号码识别。为了准确、高效地执行这一任务,本文开发了基于PaddleOCR和Spark分布式处理技术识别身份证号码的系统。先从理论上阐述了使用PaddleOCR现有模型和算法进行身份证识别的可行性,然后通过实验验证了其识别的准确率,最后运用Spark集群的分布式处理模式大幅度提升PaddleOCR的执行效率,从而达到了准确、高效、易用的任务要求。 展开更多
关键词 身份证信息识别 深度学习 paddleocr Pyspark 分布式处理
原文传递
基于深度学习的钻孔冲煤量智能识别方法 被引量:1
8
作者 李小军 赵明炀 李淼 《煤田地质与勘探》 北大核心 2025年第1期257-270,共14页
【目的】为解决人工统计钻孔冲煤量不准确以及效率低等问题,提出一种YOLOv8n、Res-Net34和PP-OCRv4算法相结合的智能识别方法。【方法】该方法首先使用YOLOv8n算法完成一级检测,同时并行级联ResNet34算法与PP-OCRv4算法进行二级处理,并... 【目的】为解决人工统计钻孔冲煤量不准确以及效率低等问题,提出一种YOLOv8n、Res-Net34和PP-OCRv4算法相结合的智能识别方法。【方法】该方法首先使用YOLOv8n算法完成一级检测,同时并行级联ResNet34算法与PP-OCRv4算法进行二级处理,并结合基于追踪帧数的分类状态判别方法,建立了冲煤量自动计算的算法框架。其次,在YOLOv8n的C2f模块中引入可变形卷积DCNv2模块,以削弱点状强光照对特征采集的影响,并将其默认的检测头替换为Dynamic Head检测头模块,以强化算法在尺度,空间和通道维度的特征提取能力,以及将CIoU损失函数替换为SIoU损失函数,以加速预测框与真实框的匹配,并利用自建的数据集对改进后的YOLOv8n算法进行验证。【结果和结论】结果表明:(1)与原算法相比,平均类别检测精度提高了7.6%,召回率提高了3.5%,精确率提高了6.4%,验证了改进策略对提升模型性能的有效性和稳定性。(2)对4个不同的瓦斯抽采水力冲孔钻场的实时视频进行测试,识别准确率分别为100.0%、93.3%、95.7%和93.1%,平均达到95.5%,满足了水力冲孔钻孔冲煤量自动识别的精度要求。(3)采用追踪帧数确定ResNet34分类状态的方法,解决了分类状态单次识别结果不可靠的问题。研究成果为YOLO系列算法与其他深度学习技术的融合和广泛应用提供了技术与实践基础,对促进瓦斯抽采钻场等煤矿井下复杂场景的智能化进步具有参考价值。 展开更多
关键词 瓦斯抽采 冲煤量 YOLOv8n ResNet34 paddleocr 可变形卷积 动态检测头 智能识别 煤矿
在线阅读 下载PDF
基于YOLOv8和OCR的快递盒识别算法研究与应用
9
作者 范晓菁 《信息技术与信息化》 2025年第6期42-45,共4页
随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各... 随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各种快递盒图片并标定建立数据集,为使最终识别模型适应不同光照条件,通过对色温和亮度对基础数据图片集进行扩充,然后用YOLOv8进行训练得到最优模型,并验证不同色温和亮度条件下检测精度都大于95%。此基础上采用PaddleOCR完成文字提取和分类,提取所需要的目标快递盒信息,并在中国计算机设计大赛人工智能挑战赛智慧物流专项赛比赛平台LEO智能移动抓取机器人上部署了以上算法,通过实际竞赛验证了本文算法的有效性。 展开更多
关键词 YOLOv8 OCR paddleocr PaddlePaddle 快递盒识别
在线阅读 下载PDF
基于未来社区的智能社区服务机器人设计
10
作者 冯雨松 王海稳 《今日自动化》 2025年第3期62-64,共3页
文章设计了一种基于ROS环境的四麦克纳姆轮工控机机器人系统,该系统能够实现自主导航、路径规划、视觉检测与语音播报等功能,广泛应用于智慧社区的自动化任务执行。试验结果表明,该系统能够高效、准确地完成多项任务,为智慧城市的建设... 文章设计了一种基于ROS环境的四麦克纳姆轮工控机机器人系统,该系统能够实现自主导航、路径规划、视觉检测与语音播报等功能,广泛应用于智慧社区的自动化任务执行。试验结果表明,该系统能够高效、准确地完成多项任务,为智慧城市的建设提供了技术支撑。 展开更多
关键词 机器人导航 路径规划 视觉识别 语音播报 YOLOv5 paddleocr 智慧社区
在线阅读 下载PDF
基于神经网络的档案扫描智能化归类系统设计与实现
11
作者 周业 卞玉霞 《工业控制计算机》 2025年第12期159-161,共3页
针对传统大批量纸质档案数字化分类规整工作所面临的效率低下、质量难以保证的难题,通过对农房一体纸质档案数字化管理需求的分析,在实现纸质档案数字化数据采集的基础上,引入PaddleOCR技术,对纸质档案扫描文件进行高效、准确的自动识... 针对传统大批量纸质档案数字化分类规整工作所面临的效率低下、质量难以保证的难题,通过对农房一体纸质档案数字化管理需求的分析,在实现纸质档案数字化数据采集的基础上,引入PaddleOCR技术,对纸质档案扫描文件进行高效、准确的自动识别、信息提取与校核匹配。通过这一技术流程,构建了电子档案扫描件的自动化归类与智能存储系统(平台)。系统的应用减少了档案管理部门的人力资源投入,提升了档案数字化的处理效率,并有效保障了成果质量。从技术手段层面解决了主管部门在档案数字化管理中所面临的困惑与挑战,为农房一体档案数字化管理的推广应用提供了强有力的技术支持和案例参考。 展开更多
关键词 paddleocr 智能化 神经网络 文字识别 农房一体档案
在线阅读 下载PDF
自动著录技术在户籍档案数字化中的应用研究与实践 被引量:7
12
作者 李新功 《北京档案》 北大核心 2022年第6期39-41,共3页
为适应社会的数字化转型,公安机构在全国范围内开展了户籍档案数字化工作。面对户籍档案数字化工作在组卷复杂、纸张状况较差且著录工作量大等方面的挑战,实现数字化工作的智能化与自动化成为探索焦点,所以采用自动著录技术势在必行。... 为适应社会的数字化转型,公安机构在全国范围内开展了户籍档案数字化工作。面对户籍档案数字化工作在组卷复杂、纸张状况较差且著录工作量大等方面的挑战,实现数字化工作的智能化与自动化成为探索焦点,所以采用自动著录技术势在必行。该文对采用自动著录技术的必要性、技术框架及系统实现逻辑等展开介绍与分析。 展开更多
关键词 户籍档案 数字化 paddleocr 人工智能
在线阅读 下载PDF
基于深度学习的电气二次图纸语义识别方法 被引量:10
13
作者 褚雪汝 陈中 +3 位作者 吴聪颖 李铁成 冯腾 刘清泉 《浙江电力》 2023年第8期1-11,共11页
图像文字识别及深度学习技术逐步应用在工程图纸识别领域。针对电气二次图纸语义识别中存在的小目标检测、文字背景复杂等问题,首先,提出面向电气有效信息的图纸小目标区域双层提取模型,上层模型为基于自适应阈值及轮廓检测的端子排单... 图像文字识别及深度学习技术逐步应用在工程图纸识别领域。针对电气二次图纸语义识别中存在的小目标检测、文字背景复杂等问题,首先,提出面向电气有效信息的图纸小目标区域双层提取模型,上层模型为基于自适应阈值及轮廓检测的端子排单连通小目标区域提取,下层模型为基于双层目标检测网络的端子排表格及连接线文字小目标子区域提取。接着,提出基于单元格提取及Sobel算子边缘检测的端子排表格区域文字位置检测算法与基于水平垂直投影分割算法及方向旋转的端子排连接线文字区域的文字位置检测算法。最后利用所提算法对30张有标注图纸进行语义提取测试,测试集平均漏检率与正确臃的加权平均值为91.25%,测试集平均交并比平均值为82.61%,验证了所提算法的有效性及鲁棒性。 展开更多
关键词 区域分割 文字检测 小目标检测 YOLOv5 paddleocr
在线阅读 下载PDF
面向汉字点选验证码的轻量级高效识别方法 被引量:2
14
作者 金鑫豪 池凯凯 《计算机科学》 CSCD 北大核心 2024年第S02期289-297,共9页
数字化浪潮下,企业日益依赖机器人流程自动化(Robot Process Automation,RPA)技术来降低成本、提高效率,以保持竞争力。但流程中部分环节面临汉字点选验证码识别的难题,限制了自动化水平的进一步提高。现有研究方案存在数据集制作难度... 数字化浪潮下,企业日益依赖机器人流程自动化(Robot Process Automation,RPA)技术来降低成本、提高效率,以保持竞争力。但流程中部分环节面临汉字点选验证码识别的难题,限制了自动化水平的进一步提高。现有研究方案存在数据集制作难度大、模型泛化性能差、模型复杂度与性能之间不平衡等问题。为此,提出一种数据集制作成本低、模型泛化性能好且轻量化的汉字点选验证码识别方法。具体而言:首先采用经过针对性改进的YOLOv8-n显著轻量化汉字检测模型,然后对汉字图片进行分割、矫正等预处理操作,接着采用泛化性强的PaddleOCR模型进行汉字识别,降低了场景迁移的成本,并通过识别概率矩阵得到最佳匹配结果,进一步提高了准确率。此外,设计了一种半自动的汉字检测数据集构建流程并公开了数据集。该研究旨在推动汉字点选验证码的自动识别技术的发展,促进企业流程自动化水平的提升。 展开更多
关键词 流程自动化 验证码识别 YOLOv8 paddleocr 轻量化
在线阅读 下载PDF
车辆索赔图片智能识别系统 被引量:1
15
作者 杜阿卫 朱洪霖 《软件》 2023年第1期107-109,共3页
随着私家车销量日渐增多,前来索赔车辆的数目也越来越多,为确保索赔车辆里程信息、车牌信息和铭牌信息的正确性,工作人员通过肉眼逐一对索赔里程图像、车辆车牌图像和车辆铭牌图像与数据库中记录的车辆信息进行核对,这样的工作不仅耗费... 随着私家车销量日渐增多,前来索赔车辆的数目也越来越多,为确保索赔车辆里程信息、车牌信息和铭牌信息的正确性,工作人员通过肉眼逐一对索赔里程图像、车辆车牌图像和车辆铭牌图像与数据库中记录的车辆信息进行核对,这样的工作不仅耗费大量的人力,而且十分机械、重复、效率低。为解决这一问题,本文使用YOLO目标检测和PaddleOCR文字识别相结合的方式,实现了智能识别索赔里程图像、车辆车牌图像和车辆铭牌图像中的信息,训练得到的模型准确率高,达到了95%以上。实践证明,该系统不仅具有运行稳定、效率高、易操作等特点,而且很大程度上减轻了人工工作量,降低了欺诈风险,保障了车辆的高质量索赔。 展开更多
关键词 图片识别 目标检测 YOLO paddleocr 深度学习
在线阅读 下载PDF
基于图像的航天业务软件Web UI自动化测试方法
16
作者 彭飞 王建 +1 位作者 寇超 田芳 《测控技术》 2024年第9期21-27,共7页
当前航天业务繁重,如何高效准确地完成相关软件的测试尤为重要。设计了一种基于图像的航天业务软件Web UI自动化测试方法。该方法以用户视角进行自动化测试,使用YOLOv8模型检测被测Web软件截图,识别出表格、折线图和导航按键(包括导航... 当前航天业务繁重,如何高效准确地完成相关软件的测试尤为重要。设计了一种基于图像的航天业务软件Web UI自动化测试方法。该方法以用户视角进行自动化测试,使用YOLOv8模型检测被测Web软件截图,识别出表格、折线图和导航按键(包括导航菜单、面包屑、按钮等按键)3类网页元素。之后利用Selenium工具自动测试导航按键元素的可访问性,使用文字识别技术PaddleOCR、结构相似性(Structural Similarity, SSIM)指数算法分别测试表格元素和折线图元素信息的正确性,并生成测试报告。该方法可移植性好,能够自动为Selenium提供元素定位,改善Selenium脚本易失效的问题,并且可以自动检查图表数据的正确性。实验结果表明,该方法能够覆盖90%的测试用例,可检测具体错误位置和相关信息,显著减少了手动测试工作量,提高了测试效率。 展开更多
关键词 Web UI自动化测试 YOLOv8算法 结构相似性算法 paddleocr SELENIUM
在线阅读 下载PDF
基于OCR的智能数据采集系统设计与实现
17
作者 宋清波 张春光 《智慧轨道交通》 2026年第1期23-27,共5页
针对目前主机厂新造、高级修的高速动车组与城轨车辆的电气调试工序中供应商设备与诊断维护软件缺少标准对外通信接口,数字化调试平台无法获取调试数据,从而形成“数据孤岛”的问题。文章提出了一种基于PaddleOCR框架与python语言的数... 针对目前主机厂新造、高级修的高速动车组与城轨车辆的电气调试工序中供应商设备与诊断维护软件缺少标准对外通信接口,数字化调试平台无法获取调试数据,从而形成“数据孤岛”的问题。文章提出了一种基于PaddleOCR框架与python语言的数据采集系统,该系统可以实现对用户选定的目标区域进行图像捕捉与处理、版面分析与恢复、字符切割与识别,然后将截图中的文本信息输出为可编辑的文本格式,最终通过http通信协议上传到调试专用的数字化平台。本系统首次将基于深度学习框架的新一代OCR技术应用于我国轨道车辆的制造生产中,并辅以良好的人机交互界面降低车间工人操作难度。同时通过模型训练与算法应用识别结果准确度得到大幅提升,试验结果表明对现场使用的界面进行识别后字符识别准确率在97%以上,可以满足调试工序的生产需要。 展开更多
关键词 主机厂 轨道交通车辆 电气调试 paddleocr 图像处理 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部