随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各...随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各种快递盒图片并标定建立数据集,为使最终识别模型适应不同光照条件,通过对色温和亮度对基础数据图片集进行扩充,然后用YOLOv8进行训练得到最优模型,并验证不同色温和亮度条件下检测精度都大于95%。此基础上采用PaddleOCR完成文字提取和分类,提取所需要的目标快递盒信息,并在中国计算机设计大赛人工智能挑战赛智慧物流专项赛比赛平台LEO智能移动抓取机器人上部署了以上算法,通过实际竞赛验证了本文算法的有效性。展开更多
图像矫正作为OCR(Optical Character Recognition,光学字符识别)系统中的一项关键预处理技术,其重要性不容忽视。在对高考招生计划书等表格类型的图片进行OCR的流程中,输入的表格类型图片常常因为拍摄角度、光线变化或者纸张的不平整而...图像矫正作为OCR(Optical Character Recognition,光学字符识别)系统中的一项关键预处理技术,其重要性不容忽视。在对高考招生计划书等表格类型的图片进行OCR的流程中,输入的表格类型图片常常因为拍摄角度、光线变化或者纸张的不平整而产生扭曲或偏斜,严重影响识别的准确率。为提升表格类型图片内容识别的准确性,提出一种基于投影图的OCR表格图像矫正算法,基于投影图对表格图片的4个顶点进行定位,为后续的图像倾斜矫正提供参考,结合图像处理技术,矫正这些扭曲和偏斜,为字符识别提供更加准确的图像基础,从而提高整个OCR系统的识别准确性和效率。展开更多
随着银行业数字化转型进程的加速,光学字符识别(Optical Character Recognition, OCR)技术在提升银行业务处理效率、优化传统业务流程方面发挥着重要作用。通过引入OCR技术对业务系统进行智能化改造,银行不仅能够显著降低运营成本,还能...随着银行业数字化转型进程的加速,光学字符识别(Optical Character Recognition, OCR)技术在提升银行业务处理效率、优化传统业务流程方面发挥着重要作用。通过引入OCR技术对业务系统进行智能化改造,银行不仅能够显著降低运营成本,还能有效提升客户体验。尤其是在运营领域,由于需要处理大量录入与审核工作,OCR技术的应用可显著节约人力成本,推动传统作业模式转型,从而提升整体运营效能。民生银行基于AI平台构建了OCR技术应用体系,实现了全行范围的OCR应用覆盖,有力推动了全行业务智能化转型。展开更多
WPS作为一款集文字、表格、演示功能于一体的优秀处理软件,深受党政机关及各类企事业单位办公人员的喜爱。然而,其强大的处理能力和多种实用功能在便利工作的同时,也存在泄密隐患。其中,实用的截图恢复功能可能给工作带来严重的泄密风...WPS作为一款集文字、表格、演示功能于一体的优秀处理软件,深受党政机关及各类企事业单位办公人员的喜爱。然而,其强大的处理能力和多种实用功能在便利工作的同时,也存在泄密隐患。其中,实用的截图恢复功能可能给工作带来严重的泄密风险。文章结合企业实际情况,分析了利用光学字符识别(Optical Character Recognition,OCR)技术对截图功能所致泄密风险的规避作用。展开更多
随着生活水平的提高,人们对健康饮食的关注度日益提升。合理的膳食搭配和营养摄入,有助于增强免疫系统功能,提高身体抵抗力,同时对心理健康也有积极影响。然而,在实际生活中,人们在饮食选择和营养分析方面面临诸多挑战。传统的饮食选择...随着生活水平的提高,人们对健康饮食的关注度日益提升。合理的膳食搭配和营养摄入,有助于增强免疫系统功能,提高身体抵抗力,同时对心理健康也有积极影响。然而,在实际生活中,人们在饮食选择和营养分析方面面临诸多挑战。传统的饮食选择方式往往依赖个人经验和有限的信息,难以满足个性化的营养需求。同时,对食物营养成分的分析也较为困难,需要专业知识和复杂的检测手段。在此背景下,文章致力于设计并实现一款融合OCR(optical character recognition)与百度AI技术的智能健康饮食系统,其主要功能包括菜品随机选、菜品识别以及食物成分分析,在菜品随机选功能中,系统通过高效的抽取方式,为用户生成饮食建议,解决日常饮食选择困难的问题。简而言之,菜品识别功能依托百度AI的图像识别能力,可快速、准确地识别出菜品名称;食物成分分析功能则采用表格识别算法,通过融合DB分割模型、OCR文本检测算法与SLANet表格定位模型,实现对食物成分表格的精准解析。实验结果表明,在海量数据场景下,采用“rand函数与子函数相结合”的查询方法,较传统方法查询速度提升30.981 s;百度AI菜品识别的置信度达0.6874,可较好完成菜品内容识别;同时,系统在食物成分表的表格识别上也达到了良好精度,整体满足稳定高效的算法设计要求。展开更多
引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的...引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的要求下,研究OCR识别在民生档案数字化管理中的应用,设计基于OCR识别的档案数字化管理方案,有助于解决纸质档案在扫描、识别、分类等环节容易出错且耗费大量人力的问题,提升民生服务效率,推动信息化建设再上新台阶。展开更多
文摘随着电商及快递行业发展,物流分拣逐渐向智能化、无人化方向发展,如何稳定高效地定位快递盒并识别快递单号文字显得尤为重要。基于此,文章提出了一种基于YOLOv8和OCR(optical character recognition)的快递盒识别算法,首先采集200张各种快递盒图片并标定建立数据集,为使最终识别模型适应不同光照条件,通过对色温和亮度对基础数据图片集进行扩充,然后用YOLOv8进行训练得到最优模型,并验证不同色温和亮度条件下检测精度都大于95%。此基础上采用PaddleOCR完成文字提取和分类,提取所需要的目标快递盒信息,并在中国计算机设计大赛人工智能挑战赛智慧物流专项赛比赛平台LEO智能移动抓取机器人上部署了以上算法,通过实际竞赛验证了本文算法的有效性。
文摘图像矫正作为OCR(Optical Character Recognition,光学字符识别)系统中的一项关键预处理技术,其重要性不容忽视。在对高考招生计划书等表格类型的图片进行OCR的流程中,输入的表格类型图片常常因为拍摄角度、光线变化或者纸张的不平整而产生扭曲或偏斜,严重影响识别的准确率。为提升表格类型图片内容识别的准确性,提出一种基于投影图的OCR表格图像矫正算法,基于投影图对表格图片的4个顶点进行定位,为后续的图像倾斜矫正提供参考,结合图像处理技术,矫正这些扭曲和偏斜,为字符识别提供更加准确的图像基础,从而提高整个OCR系统的识别准确性和效率。
文摘随着银行业数字化转型进程的加速,光学字符识别(Optical Character Recognition, OCR)技术在提升银行业务处理效率、优化传统业务流程方面发挥着重要作用。通过引入OCR技术对业务系统进行智能化改造,银行不仅能够显著降低运营成本,还能有效提升客户体验。尤其是在运营领域,由于需要处理大量录入与审核工作,OCR技术的应用可显著节约人力成本,推动传统作业模式转型,从而提升整体运营效能。民生银行基于AI平台构建了OCR技术应用体系,实现了全行范围的OCR应用覆盖,有力推动了全行业务智能化转型。
文摘WPS作为一款集文字、表格、演示功能于一体的优秀处理软件,深受党政机关及各类企事业单位办公人员的喜爱。然而,其强大的处理能力和多种实用功能在便利工作的同时,也存在泄密隐患。其中,实用的截图恢复功能可能给工作带来严重的泄密风险。文章结合企业实际情况,分析了利用光学字符识别(Optical Character Recognition,OCR)技术对截图功能所致泄密风险的规避作用。
文摘随着生活水平的提高,人们对健康饮食的关注度日益提升。合理的膳食搭配和营养摄入,有助于增强免疫系统功能,提高身体抵抗力,同时对心理健康也有积极影响。然而,在实际生活中,人们在饮食选择和营养分析方面面临诸多挑战。传统的饮食选择方式往往依赖个人经验和有限的信息,难以满足个性化的营养需求。同时,对食物营养成分的分析也较为困难,需要专业知识和复杂的检测手段。在此背景下,文章致力于设计并实现一款融合OCR(optical character recognition)与百度AI技术的智能健康饮食系统,其主要功能包括菜品随机选、菜品识别以及食物成分分析,在菜品随机选功能中,系统通过高效的抽取方式,为用户生成饮食建议,解决日常饮食选择困难的问题。简而言之,菜品识别功能依托百度AI的图像识别能力,可快速、准确地识别出菜品名称;食物成分分析功能则采用表格识别算法,通过融合DB分割模型、OCR文本检测算法与SLANet表格定位模型,实现对食物成分表格的精准解析。实验结果表明,在海量数据场景下,采用“rand函数与子函数相结合”的查询方法,较传统方法查询速度提升30.981 s;百度AI菜品识别的置信度达0.6874,可较好完成菜品内容识别;同时,系统在食物成分表的表格识别上也达到了良好精度,整体满足稳定高效的算法设计要求。
文摘引言 OCR(Optical Character Recognition,光学字符识别)属于一种高效的文字输入方式,亦可称之为文字识别。OCR技术的运用过程通常涉及将纸张上的文字、图像信息转化为计算机能识别的格式[1]。在档案工作“存量数字化、增量电子化”的要求下,研究OCR识别在民生档案数字化管理中的应用,设计基于OCR识别的档案数字化管理方案,有助于解决纸质档案在扫描、识别、分类等环节容易出错且耗费大量人力的问题,提升民生服务效率,推动信息化建设再上新台阶。