传统光学字符识别(Optical Character Recognition,OCR)技术在识别家电标识信息时,易受复杂背景与光照干扰,识别精度偏低。文章提出一种融合目标检测技术与多模态语义理解的结构化信息提取方法。使用LabelImg对标识数据集进行标注,采用Y...传统光学字符识别(Optical Character Recognition,OCR)技术在识别家电标识信息时,易受复杂背景与光照干扰,识别精度偏低。文章提出一种融合目标检测技术与多模态语义理解的结构化信息提取方法。使用LabelImg对标识数据集进行标注,采用YOLOv8s训练目标检测模型,搭建超文本传输协议(Hypertext Transfer Protocol,HTTP)服务部署检测流程,并结合目标区域坐标信息实现精准裁剪。文本信息提取采用UVDoc预处理与QwenVL识别相结合的OCR解决方案,同时引入大语言模型,开展语义纠错与结构化数据解析。结果显示,该方法针对家电标识的平均识别准确率达到90%以上,展现出良好的鲁棒性。展开更多
随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各...随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各种快递盒图片并标定建立数据集,为使最终识别模型适应不同光照条件,通过对色温和亮度对基础数据图片集进行扩充,然后用YOLOv8进行训练得到最优模型,并验证不同色温和亮度条件下检测精度都大于95%。此基础上采用PaddleOCR完成文字提取和分类,提取所需要的目标快递盒信息,并在中国计算机设计大赛人工智能挑战赛智慧物流专项赛比赛平台LEO智能移动抓取机器人上部署了以上算法,通过实际竞赛验证了本文算法的有效性。展开更多
文摘传统光学字符识别(Optical Character Recognition,OCR)技术在识别家电标识信息时,易受复杂背景与光照干扰,识别精度偏低。文章提出一种融合目标检测技术与多模态语义理解的结构化信息提取方法。使用LabelImg对标识数据集进行标注,采用YOLOv8s训练目标检测模型,搭建超文本传输协议(Hypertext Transfer Protocol,HTTP)服务部署检测流程,并结合目标区域坐标信息实现精准裁剪。文本信息提取采用UVDoc预处理与QwenVL识别相结合的OCR解决方案,同时引入大语言模型,开展语义纠错与结构化数据解析。结果显示,该方法针对家电标识的平均识别准确率达到90%以上,展现出良好的鲁棒性。
文摘随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各种快递盒图片并标定建立数据集,为使最终识别模型适应不同光照条件,通过对色温和亮度对基础数据图片集进行扩充,然后用YOLOv8进行训练得到最优模型,并验证不同色温和亮度条件下检测精度都大于95%。此基础上采用PaddleOCR完成文字提取和分类,提取所需要的目标快递盒信息,并在中国计算机设计大赛人工智能挑战赛智慧物流专项赛比赛平台LEO智能移动抓取机器人上部署了以上算法,通过实际竞赛验证了本文算法的有效性。