针对高速生产环境中易拉罐罐底喷码实时检测效率低、识别精度差等问题,文章提出了一种基于Halcon深度学习的深度光学字符识别(Deep Optical Character Recognition,Deep OCR)算法。该算法结合图像处理技术,通过大角度几何变换增强特征...针对高速生产环境中易拉罐罐底喷码实时检测效率低、识别精度差等问题,文章提出了一种基于Halcon深度学习的深度光学字符识别(Deep Optical Character Recognition,Deep OCR)算法。该算法结合图像处理技术,通过大角度几何变换增强特征空间的视角不变性,结合动态光度调整提升光照适应能力,利用基于训练损失的参数自适应机制实现增强强度的智能调控,并在此基础上训练神经网络模型,设计了对比实验。结果表明,所提网络模型对喷码字符的检测精确率达91.43%,识别准确率达99.95%,算法耗时109 ms,验证了其在高速生产环境中的高效性与准确性。展开更多
目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取...目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取PDF和DCOM文件中的基本信息,重新建立起患者、影像、报告三者之间的联系,并将关联数据写入数据库。结果经抽样验证,该方法识别同类图像精度的准确度、精准度及召回率均为100%,综合指标F1值为1,在不同组别独立样本间的识别精度表现出一致性。平均每份报告识别时间约为0.14 s(t=-1.005,P=0.315),说明不同组别独立样本间的识别时间表现出一致性。结论该方法的使用能有效缩短数据库故障后患者等待时长,能够在短时间内恢复医疗秩序,可用于PACS数据库数据丢失后的应急处置,也为PACS的数据整合提供依据,为医学影像数据恢复和数据整合提供一种新思路。展开更多
电力工程设计中铁塔设计图纸的自动识别与信息提取是一项急需解决的问题。该文提出一种基于深度学习和光学字符识别(Optical Character Recognition,OCR)技术的铁塔设计图纸智能识别系统。该系统由分段结构识别、文本识别和关键信息提取...电力工程设计中铁塔设计图纸的自动识别与信息提取是一项急需解决的问题。该文提出一种基于深度学习和光学字符识别(Optical Character Recognition,OCR)技术的铁塔设计图纸智能识别系统。该系统由分段结构识别、文本识别和关键信息提取3个主要模块组成。分段结构识别模块采用改进的U-Net卷积神经网络模型;文本识别模块基于Tesseract 4.0进行优化,提高字符识别准确率;关键信息提取模块则使用基于规则的解析引擎,从识别出的分段结构和文本中抽取关键信息。实验结果表明,该系统在铁塔图纸识别的准确性、泛化性和效率方面均达到较高水平塔形结构识别F1值为96.35%,字符识别准确率为99.10%。该系统可有效支持电力工程设计和管理的数字化、智能化转型,具有广阔的应用前景。展开更多
文摘目的在影像归档和通信系统(Picture Archiving and Communication System,PACS)数据库文件丢失或损坏后,实现影像资料和PDF报告关键信息的快速识别和重组,供患者回诊使用。方法利用基于深度学习的光学字符识别技术和Pydicom技术分别读取PDF和DCOM文件中的基本信息,重新建立起患者、影像、报告三者之间的联系,并将关联数据写入数据库。结果经抽样验证,该方法识别同类图像精度的准确度、精准度及召回率均为100%,综合指标F1值为1,在不同组别独立样本间的识别精度表现出一致性。平均每份报告识别时间约为0.14 s(t=-1.005,P=0.315),说明不同组别独立样本间的识别时间表现出一致性。结论该方法的使用能有效缩短数据库故障后患者等待时长,能够在短时间内恢复医疗秩序,可用于PACS数据库数据丢失后的应急处置,也为PACS的数据整合提供依据,为医学影像数据恢复和数据整合提供一种新思路。
文摘电力工程设计中铁塔设计图纸的自动识别与信息提取是一项急需解决的问题。该文提出一种基于深度学习和光学字符识别(Optical Character Recognition,OCR)技术的铁塔设计图纸智能识别系统。该系统由分段结构识别、文本识别和关键信息提取3个主要模块组成。分段结构识别模块采用改进的U-Net卷积神经网络模型;文本识别模块基于Tesseract 4.0进行优化,提高字符识别准确率;关键信息提取模块则使用基于规则的解析引擎,从识别出的分段结构和文本中抽取关键信息。实验结果表明,该系统在铁塔图纸识别的准确性、泛化性和效率方面均达到较高水平塔形结构识别F1值为96.35%,字符识别准确率为99.10%。该系统可有效支持电力工程设计和管理的数字化、智能化转型,具有广阔的应用前景。