期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于DBNet与SVTR的轮胎压印字符识别方法
1
作者 康朝海 蔡成颖 +1 位作者 孙行衍 任伟建 《自动化与仪表》 2025年第9期89-93,98,共6页
为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI... 为解决汽车智能制造行业高效读取轮胎胎面信息的问题,针对轮胎压印字符识别研究存在的难点,构建了一种基于DBNet与SVTR的压印字符识别模型。首先改进梯度Hough变换和极坐标转换将胎面弯曲文本展平;然后利用模板匹配依据相对位移定位ROI区域;最后基于DBNet检测字符、SVTR识别字符。实验表明,所提方法的检测Hmean达97.24%,识别准确率达99.22%,能有效解决轮胎压印字符识别的实际应用问题。 展开更多
关键词 轮胎压印字符 dbnet SVTR 字符识别
在线阅读 下载PDF
基于DBNet+SVTR的微电子组装电路字符识别系统
2
作者 李颖 万永 +2 位作者 罗驰 袁家军 简燕 《电子与封装》 2025年第4期24-30,共7页
微电子组装技术的发展推动组装电路的类型和产量不断增长,因此作业智能化水平亟需提升,且需对每只电路的生产状态进行实时追踪记录。基于DBNet和SVTR网络模型的电路管壳批号识别系统采用端到端的光学字符识别(OCR)模型,结合分布式技术... 微电子组装技术的发展推动组装电路的类型和产量不断增长,因此作业智能化水平亟需提升,且需对每只电路的生产状态进行实时追踪记录。基于DBNet和SVTR网络模型的电路管壳批号识别系统采用端到端的光学字符识别(OCR)模型,结合分布式技术进行相关硬件部署,可实现作业任务单智能生成、作业自动记录、作业过程智能化闭环管理等功能,提升了微电子电路生产过程的智能化水平。 展开更多
关键词 图像处理 文本识别 文本检测 OCR dbnet SVTR
在线阅读 下载PDF
基于DBNet与CRNN融合模型的卷烟激光码识别方法
3
作者 马琦 文钰栋 +1 位作者 梁尚荣 王可 《计算机与现代化》 2025年第4期96-102,共7页
卷烟激光码识别是烟草稽查工作的重要手段。针对烟码背景复杂导致检测识别率低的问题,本文提出一种基于DBNet与CRNN融合模型的烟码识别方法。首先采用DBNet模型对烟码区域进行检测,通过引入可微分二值化实现烟码的准确定位与提取;然后采... 卷烟激光码识别是烟草稽查工作的重要手段。针对烟码背景复杂导致检测识别率低的问题,本文提出一种基于DBNet与CRNN融合模型的烟码识别方法。首先采用DBNet模型对烟码区域进行检测,通过引入可微分二值化实现烟码的准确定位与提取;然后采用CRNN模型对经过定位和裁剪处理的烟码区域图像进行特征识别,通过结合VGG网络与深层Bi-LSTM网络,获取空间特征和时序特征实现烟码的识别。经过实验验证,融合模型的检测准确率为91.9%,识别准确率为83.4%,在移动端APP部署后的测试准确率为83.0%,这表明本文方法能够提供精确的烟码识别效果。 展开更多
关键词 卷烟激光码 目标检测 文本识别 dbnet CRNN
在线阅读 下载PDF
基于改进DBNet和SVTR算法的连铸板坯号检测与识别 被引量:2
4
作者 刘乐 张晓松 +1 位作者 黄锋 方一鸣 《电子测量与仪器学报》 CSCD 北大核心 2024年第2期67-75,共9页
针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段... 针对钢铁连铸产线板坯号识别字符区域小、光照变化复杂、板坯号图像质量差等问题,提出了一种基于深度学习的连铸板坯号检测与识别两阶段算法。首先,基于采集的连铸产线板坯图像,制备用于板坯号检测与识别的数据集;其次,在板坯号检测阶段,基于DBNet算法设计一种AD-PAN特征融合结构,以增强检测算法的多尺度特征融合能力和扩大感受野,提高板坯号定位精度;再次,在板坯号识别阶段,引入SPIN矫正网络和SVTR板坯号识别网络进行端到端训练,使其能够主动转换输入亮度,并改善字符间以及字符与背景间色彩失真的问题。最后,在自制的板坯号检测与识别数据集上进行了对比实验。实验结果表明,本研究提出的算法能够有效定位辊道上不同位置的板坯,并且在复杂背景下对板坯号进行鲁棒识别。其中,板坯号检测Hmean数值为97.92%,板坯号识别的准确率为97.33%,验证了本文所提算法具有较高的板坯号检测与识别精度。 展开更多
关键词 板坯号识别 dbnet 特征金字塔融合 端到端网络 SPIN矫正 SVTR
原文传递
基于改进DBNet-RNN的声级计读数识别方法 被引量:3
5
作者 汪嘉 祝海江 +3 位作者 王寅初 何龙标 杨平 牛锋 《计量学报》 CSCD 北大核心 2024年第8期1191-1199,共9页
为提高声级计校准工作效率,提出了一种基于深度学习神经网络的声级计图像读数检测与识别方法。读数检测模型以DBNet为基础模型,将ShuffleNetV2作为主干网络,显著降低模型参数量;为提高读数区域检测精度,引入高效通道注意力ECA模块,提高... 为提高声级计校准工作效率,提出了一种基于深度学习神经网络的声级计图像读数检测与识别方法。读数检测模型以DBNet为基础模型,将ShuffleNetV2作为主干网络,显著降低模型参数量;为提高读数区域检测精度,引入高效通道注意力ECA模块,提高网络对于通道特征的提取能力,优化后的模型在保持精度的同时参数量缩减为原来的15.4%,计算量缩减为原来的67.4%。读数识别模型以CRNN为基础模型,先加入批量规范化层,提高网络训练时的稳定性;然后,引入残差块替换原有的卷积块,提高了网络对于复杂特征的提取能力;将Dropout应用于网络中,提高网络的泛化能力;此外,在合成读数数据集上对读数识别模型进行预训练,有效增加了模型准确率。改进后的方法准确率达到了99.7%,相较原方法提高了2.4%。实验结果表明,该方法对声级计图像中存在的字体多样、光照不均、模糊等影响因素具有较强的鲁棒能力,对声级计图像中的读数具有较高的识别精度。 展开更多
关键词 声学计量 图像识别 声级计 dbnet CRNN 注意力模块
在线阅读 下载PDF
基于Attention-DBNet算法的文本检测方法 被引量:1
6
作者 杨华 汪俊雄 +3 位作者 沈浩 张书祥 冯立 肖杰 《中南民族大学学报(自然科学版)》 CAS 2024年第5期674-682,共9页
针对复杂自然场景下文本检测信息缺失和漏检的问题,引入Attention机制,提出Attention-DBNet算法.在特征提取的FPNNet(Feature Pyramid Networks)结构中增加了Attention机制,用于增强主干网络的特征提取能力,使模型关注有用信息和抑制无... 针对复杂自然场景下文本检测信息缺失和漏检的问题,引入Attention机制,提出Attention-DBNet算法.在特征提取的FPNNet(Feature Pyramid Networks)结构中增加了Attention机制,用于增强主干网络的特征提取能力,使模型关注有用信息和抑制无用信息;在模型预测阶段提出一个新的二值化微分公式,使模型对每个像素分类更精准,模型训练的收敛速度加快.实验结果表明:在多个数据集上Attention-DBNet算法优于其它先进算法,召回率、准确率、调和平均、检测时间等指标均有10%以上的提升. 展开更多
关键词 文本检测 注意力机制 dbnet算法 微分公式
在线阅读 下载PDF
基于DBNet和改进的Trie树搜索的网络敏感词检测技术 被引量:1
7
作者 刘轩溢 《自动化与仪器仪表》 2024年第5期25-28,共4页
为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法... 为进一步避免未成年人接触到网络中的不良信息,提出一种基于DBNet和改进的Trie树搜索的网络敏感词检测方法。其中,以DBNet网络为基础的文本检测方法,以Trie树为基础的敏感词检测方法。实验结果表明,与其他文本检测方法以及文本识别方法相比,设计使用的文本检测和识别方法具有更高的精度,能够为后续的敏感词检测提供更加准确的文本信息;与传统的敏感词检测方法相比,基于DBNet和改进的Trie树搜索的敏感词检测方法具有更高的检测精度,检测准确率、漏检率以及误检率分别为89.12%、5.80%和6.12%。综上可知,设计的敏感词检测方法检测性能良好,精度较高,能够应用于实际的网络信息敏感词检测中,保护未成年人接触到网络中的不良信息,具有一定的可行性。 展开更多
关键词 未成年人保护 敏感词检测 dbnet TRIE树
原文传递
基于改进DBNet与改进CRNN的集装箱箱号识别系统 被引量:1
8
作者 沈嘉康 《工业控制计算机》 2024年第3期54-56,共3页
针对当前集装箱箱号识别算法定位不准确,对倾斜、扭曲文本识别能力弱的问题,提出了一种基于改进DBNet与改进CRNN的集装箱箱号识别算法。在DBNet的特征提取网络中引入了注意力机制,有效提升了其文本定位能力;在CRNN中引入了空间变换网络... 针对当前集装箱箱号识别算法定位不准确,对倾斜、扭曲文本识别能力弱的问题,提出了一种基于改进DBNet与改进CRNN的集装箱箱号识别算法。在DBNet的特征提取网络中引入了注意力机制,有效提升了其文本定位能力;在CRNN中引入了空间变换网络,增强了其对倾斜、扭曲文本的识别能力。将文本定位与识别模型联合串联推理,在测试场景下达到了98.3%的识别率,具有实用价值。 展开更多
关键词 dbnet STN CRNN 集装箱 文本识别
在线阅读 下载PDF
基于改进DBNet的招牌文本检测研究 被引量:1
9
作者 倪健 池祥 《电脑知识与技术》 2023年第25期1-3,共3页
店面招牌文本是街景图像中的重要信息,招牌信息与地理信息结合用途广泛,为了发掘招牌中的文本信息,实验采用计算机视觉技术,提出一种基于DBNet算法改进的招牌文本检测方法。首先,利用ResNet残差网络提取招牌文本特征;其次,提出一种残差... 店面招牌文本是街景图像中的重要信息,招牌信息与地理信息结合用途广泛,为了发掘招牌中的文本信息,实验采用计算机视觉技术,提出一种基于DBNet算法改进的招牌文本检测方法。首先,利用ResNet残差网络提取招牌文本特征;其次,提出一种残差注意力路径聚合网络替换原有金字塔网络,增强多尺度特征融合;最后,对融合增强的特征通过可微分二值化操作加速文本后处理来得到近似二值图,以完成招牌文本与背景的分割。实验结果表明,该方法能够有效地检测出招牌中的文本。 展开更多
关键词 招牌文本检测 计算机视觉 dbnet算法 残差注意力路径聚合网络 可微分二值化
在线阅读 下载PDF
基于DBNet和CRNN算法的端到端企业实体识别 被引量:1
10
作者 王戈 黄浩 +1 位作者 汪沛洁 郑昕 《湖北大学学报(自然科学版)》 CAS 2022年第4期481-488,共8页
随着深度学习技术的发展,文字识别与自然语言处理近年来受到广泛关注.结合文字识别与自然语言处理技术解决传统方法无法处理的问题,成为企业提高自身竞争力的重要利器.自然场景文字识别分为文字的检测和识别,两者缺一不可.本研究针对传... 随着深度学习技术的发展,文字识别与自然语言处理近年来受到广泛关注.结合文字识别与自然语言处理技术解决传统方法无法处理的问题,成为企业提高自身竞争力的重要利器.自然场景文字识别分为文字的检测和识别,两者缺一不可.本研究针对传统算法存在准确率低、识别速度慢及模型不轻量化等问题,提出一种基于DBNet的检测算法,结合CRNN的识别算法,辅以CTC loss来实现端到端的企业实体识别.此外,增加命名实体识别模块,提升了识别的准确度.在实验阶段,选择准确率(Precision,P)和识别速率(False Alarm,FA)作为评价指标,实验结果表明,本算法在数据集上,有较高的准确率和较快的识别速率,验证了所提出的改进方法并具有较好的效果. 展开更多
关键词 深度学习 dbnet CRNN 命名实体识别
在线阅读 下载PDF
基于DBNet网络的瓶盖文字目标检测 被引量:3
11
作者 吴鑫磊 陶青川 张畅 《现代计算机》 2021年第14期47-53,共7页
本文主要对于酒瓶包装瓶盖文字检测问题,针对于目标检测领域传统算法的鲁棒性和检测速度提出一种基于DBNet网络,通过改进其网络结构的文字目标检测方法。基于实际生产要求,采用嵌入式开发板作为算法使用平台。本文在原有的DBNet网络的... 本文主要对于酒瓶包装瓶盖文字检测问题,针对于目标检测领域传统算法的鲁棒性和检测速度提出一种基于DBNet网络,通过改进其网络结构的文字目标检测方法。基于实际生产要求,采用嵌入式开发板作为算法使用平台。本文在原有的DBNet网络的基础上对算法做出适应场景的改进,实验结果表明,本文所提算法相比于传统模型在识别速度上提高90%左右,在识别效果下降不明显的前提下识别速度更快,具有极大的工程应用价值。 展开更多
关键词 文字检测 dbnet 嵌入式系统
在线阅读 下载PDF
基于改进DBNet的电力设备铭牌文本检测方法研究 被引量:5
12
作者 卫薇 龙娜 +3 位作者 田钺 康博 王道累 赵文彬 《高电压技术》 EI CAS CSCD 北大核心 2023年第S01期63-67,共5页
电力设备铭牌可以帮助变电站、电厂快速了解设备信息。为了解决人工检查电力设备铭牌繁琐的核对工作,本文使用深度学习技术,针对电力设备铭牌文本检测改进了DBNet网络模型,该模型使用像素级别的插值和池化将文本轮廓更为精确检测出来,... 电力设备铭牌可以帮助变电站、电厂快速了解设备信息。为了解决人工检查电力设备铭牌繁琐的核对工作,本文使用深度学习技术,针对电力设备铭牌文本检测改进了DBNet网络模型,该模型使用像素级别的插值和池化将文本轮廓更为精确检测出来,能够为电力设备铭牌文字识别提供精确的文本框,确保后序识别可以正确的检测出铭牌上文字,为电力设备快速识别环节提供充分的监督。本文改进后的模型可以有效检测出文本框边缘的文本信息,其在电力设备铭牌标签的检测精确度达到了82.7%。并能够将电力设备铭牌上设备信息全部检测出来。 展开更多
关键词 电力设备铭牌 文本检测与识别 dbnet 特征金字塔结构 深度学习
原文传递
基于改进DBNet的复杂自然场景文本检测技术 被引量:1
13
作者 李佳慧 李秀云 +1 位作者 李超 李晓磊 《长江信息通信》 2023年第7期10-13,共4页
自然场景中的文本经常会存在着文本背景复杂,文字排列不规则等因素的影响,导致文本检测的难度大幅度提升。为了进一步提升文本检测精度,在基于分割的检测技术DBNet(Real-time Scene Text Detection with Differentiable Binarization)... 自然场景中的文本经常会存在着文本背景复杂,文字排列不规则等因素的影响,导致文本检测的难度大幅度提升。为了进一步提升文本检测精度,在基于分割的检测技术DBNet(Real-time Scene Text Detection with Differentiable Binarization)的基础上,提出了一种改进的用于复杂自然场景的文本检测方法。改进点主要是加强DBNet网络模型的特征提取能力,在特征图融合之前加入下文提取模块CEM模块,通过空洞卷积增大感受野,再加入注意力引导模块AM,增强对小目标文字区域的检测,通过这些改进提高检测网络的精度。改进后的算法在测试集上的准确率达到92.1%,比改进前提升了0.7%。改进后的算法在真实场景的文本检测任务下提升了检测的准确率,表现出该检测算法的优越性。 展开更多
关键词 文本检测 dbnet 特征融合
在线阅读 下载PDF
基于DO-Conv的DBNet文本检测方法研究 被引量:2
14
作者 曾祥福 钟维良 +1 位作者 郑阳超 陈海钦 《工业控制计算机》 2022年第11期100-101,103,共3页
目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处... 目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处理的步骤和预测的时间。DBNet方法提出可学习阈值并设计了一个二值化函数,简化了后处理的步骤,在文本检测任务中取得了很好的效果。随着越来越多的网络被提出并且在计算机视觉中都有不错的效果,针对基于分割方法的后处理复杂和预测速度慢问题,在DBNet方法上应用了较为新的ResNeSt网络,同时引入了DO-Conv卷积方式。实验结果表明,该方法在多个指标上都要优于DBNet方法,有较好的文本检测性能。 展开更多
关键词 文本检测 dbnet ResNeSt DO-Conv
在线阅读 下载PDF
基于DP-DBNet和MHA-CRNN的船牌号检测与识别 被引量:3
15
作者 丁东平 李海涛 《计算机系统应用》 2023年第3期209-216,共8页
船牌号的检测和识别对于港口的智能化管理和解决传统人工方式监管渔船中存在的耗时耗力的问题具有重要意义.针对船牌悬挂位置,背景颜色和字符个数不统一等特点,本文提出两阶段双模型的检测和识别方法.首先,提出将双路径网络(dual path n... 船牌号的检测和识别对于港口的智能化管理和解决传统人工方式监管渔船中存在的耗时耗力的问题具有重要意义.针对船牌悬挂位置,背景颜色和字符个数不统一等特点,本文提出两阶段双模型的检测和识别方法.首先,提出将双路径网络(dual path networks, DPN)与可微二值化网络(differentiable binarization network, DBNet)相结合的DP-DBNet船牌号位置检测模型.其次,提出将多头注意力机制(multi-head-attention mechanism, MHA)与改进的卷积循环神经网络(convolutional recurrent neural network, CRNN)相结合的MHA-CRNN船牌号文字识别模型.最后,以烟台芝罘区新型现代化智慧渔港项目为数据来源,并进行算法对比实验分析;实验结果表明,两种模型结合的两阶段识别方法可以使船牌号的识别准确率达到76.39%,充分证明了该模型的有效性和在海洋港口管理方面的应用价值. 展开更多
关键词 船牌号检测与识别 双路径网络 可微二值化网络 多头注意力 卷积循环神经网络 目标检测
在线阅读 下载PDF
基于深度神经网络的数字水表识别与应用
16
作者 包霞 褚燕华 +3 位作者 何月 王丽颖 王月明 张晓琳 《兵工自动化》 北大核心 2025年第5期52-56,75,共6页
为提高水务公司对居民用水量的管理,提出一种基于深度神经网络模型的数字式水表读数检测和识别方法。在原始DBNet网络模型的基础上对特征提取网络进行改进,将特征提取网络ResNet网络替换成DPN双路径特征提取网络;使用透视变换算法对倾... 为提高水务公司对居民用水量的管理,提出一种基于深度神经网络模型的数字式水表读数检测和识别方法。在原始DBNet网络模型的基础上对特征提取网络进行改进,将特征提取网络ResNet网络替换成DPN双路径特征提取网络;使用透视变换算法对倾斜的读数区域图像进行校正;采用YOLOv5s网络模型对读数区域中的若干个数字进行识别;通过水表识别应用系统将读数结果进行显示,完成水表图像实时检测与识别的功能。实验结果表明:YOLOv5s网络模型具有较好的鲁棒性,能够准确识别出遮挡、模糊以及双半字符数字,识别准确率高达99.1%。 展开更多
关键词 读数识别 深度神经网络 dbnet 透视变换 目标检测
在线阅读 下载PDF
电离辐射环境下基于图像识别的数据采集系统研究
17
作者 陶成 《计量与测试技术》 2025年第5期18-21,共4页
本文设计了一种在电离辐射环境下应用的图像识别与数据自动采集系统,通过采用抗辐射CMOS图像传感器,结合DBNet和SAR算法,提高图像识别的准确性,并在不同辐射剂量下进行试验,结果表明:该系统在(0~5)mSv/h范围内,识别准确率超过97%;在7mS... 本文设计了一种在电离辐射环境下应用的图像识别与数据自动采集系统,通过采用抗辐射CMOS图像传感器,结合DBNet和SAR算法,提高图像识别的准确性,并在不同辐射剂量下进行试验,结果表明:该系统在(0~5)mSv/h范围内,识别准确率超过97%;在7mSv/h时,可保持一定的识别能力,不仅能实现全自动化的数据采集与处理,而且能提升工作效率。 展开更多
关键词 电离辐射环境 图像识别 数据自动采集 dbnet SAR算法
在线阅读 下载PDF
基于OCR的车厢局部区域文本识别方法及应用
18
作者 许袁 张云哲 +1 位作者 高文祥 连进京 《智能矿山》 2025年第9期79-83,共5页
为解决煤炭运输车辆因印刷文本严重破损和抓拍图像畸变导致的车厢号、车载重信息识别率低的问题,提出一种基于OCR的车厢局部区域文本识别方法,通过DBNet检测文本区域并排序,经FPGM算法裁剪矫正后,采用膨胀算法和对比度调整进行图像增强... 为解决煤炭运输车辆因印刷文本严重破损和抓拍图像畸变导致的车厢号、车载重信息识别率低的问题,提出一种基于OCR的车厢局部区域文本识别方法,通过DBNet检测文本区域并排序,经FPGM算法裁剪矫正后,采用膨胀算法和对比度调整进行图像增强,最后利用CRNN实现文本识别。基于806张图像数据集进行试验,对比Yolov8+OCR算法,结果显示该方法识别率达98%,平均识别时长3 s,召回率0.996,精确率0.985,显著提升识别准确性与效率。 展开更多
关键词 FPGM算法 图像增强 dbnet OCR 文本识别 CRNN
在线阅读 下载PDF
基于表格识别的餐饮业进出货台账图片识别方法
19
作者 汪浩 《工业控制计算机》 2024年第10期90-92,共3页
针对当前表格识别算法对于餐饮业进出货台账图片在自然场景情况下文本和表格识别能力弱的问题,在参考以往表格识别算法架构基础上,提出了一种基于改进的DBNet文本检测算法、SPIN场景文本识别算法与TableMaster表格识别算法的台账图片表... 针对当前表格识别算法对于餐饮业进出货台账图片在自然场景情况下文本和表格识别能力弱的问题,在参考以往表格识别算法架构基础上,提出了一种基于改进的DBNet文本检测算法、SPIN场景文本识别算法与TableMaster表格识别算法的台账图片表格识别算法。改进的DBNet文本检测算法在DBNet算法的特征提取网络中引入了自适应尺度融合模块ASF,有效提升了文本定位能力;采用SPIN场景文本识别算法代替CRNN识别算法,增强了其对自然场景中倾斜、模糊、扭曲文本的识别能力;采用TableMaster识别算法代替PLANet表格识别算法,增强了在轻量化条件下的识别能力和准确度。将文本检测与表格识别模型联合串联推理,在测试场景下达到了94.7%的识别率,具有较高的实用价值。 展开更多
关键词 表格识别 dbnet SPIN TableMaster 台账 餐饮业
在线阅读 下载PDF
低质量海关报表字符识别模型研究 被引量:1
20
作者 万燕 范艺环 +1 位作者 姚砺 朱彦锦 《智能计算机与应用》 2023年第12期32-37,共6页
海关报表单据图像质量差,其中字符往往有模糊、笔画缺失、笔画粘连和噪声污染等特点。本文针对海关报表单据中低质量字符识别准确率低的问题,提出了Enhanced-DBNet文本检测模型并改进ABINet文本识别模型。基于DBNet模型重新设计其主干网... 海关报表单据图像质量差,其中字符往往有模糊、笔画缺失、笔画粘连和噪声污染等特点。本文针对海关报表单据中低质量字符识别准确率低的问题,提出了Enhanced-DBNet文本检测模型并改进ABINet文本识别模型。基于DBNet模型重新设计其主干网络,引入可变形卷积模块(DCN)扩大感受野,提高长文本识别能力;采用双向特征金字塔增强模块(FPEM),使网络具有更强的表征能力;引入特征融合模块(FFM)将图像高层次语义特征和低层次位置特征充分融合。针对形近字符难区分的问题,在ABINet模型中引入可变形注意力模块,使注意力集中在字符相关区域,捕获到更多的字符特征。对比实验结果表明,本文的模型在海关报表低质量字符上的检测和识别准确率优于当前其他模型。 展开更多
关键词 海关报表 字符识别 dbnet ABINet
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部