传统光学字符识别(Optical Character Recognition,OCR)技术在识别家电标识信息时,易受复杂背景与光照干扰,识别精度偏低。文章提出一种融合目标检测技术与多模态语义理解的结构化信息提取方法。使用LabelImg对标识数据集进行标注,采用Y...传统光学字符识别(Optical Character Recognition,OCR)技术在识别家电标识信息时,易受复杂背景与光照干扰,识别精度偏低。文章提出一种融合目标检测技术与多模态语义理解的结构化信息提取方法。使用LabelImg对标识数据集进行标注,采用YOLOv8s训练目标检测模型,搭建超文本传输协议(Hypertext Transfer Protocol,HTTP)服务部署检测流程,并结合目标区域坐标信息实现精准裁剪。文本信息提取采用UVDoc预处理与QwenVL识别相结合的OCR解决方案,同时引入大语言模型,开展语义纠错与结构化数据解析。结果显示,该方法针对家电标识的平均识别准确率达到90%以上,展现出良好的鲁棒性。展开更多
文摘传统光学字符识别(Optical Character Recognition,OCR)技术在识别家电标识信息时,易受复杂背景与光照干扰,识别精度偏低。文章提出一种融合目标检测技术与多模态语义理解的结构化信息提取方法。使用LabelImg对标识数据集进行标注,采用YOLOv8s训练目标检测模型,搭建超文本传输协议(Hypertext Transfer Protocol,HTTP)服务部署检测流程,并结合目标区域坐标信息实现精准裁剪。文本信息提取采用UVDoc预处理与QwenVL识别相结合的OCR解决方案,同时引入大语言模型,开展语义纠错与结构化数据解析。结果显示,该方法针对家电标识的平均识别准确率达到90%以上,展现出良好的鲁棒性。