自然场景中的文本经常会存在着文本背景复杂,文字排列不规则等因素的影响,导致文本检测的难度大幅度提升。为了进一步提升文本检测精度,在基于分割的检测技术DBNet(Real-time Scene Text Detection with Differentiable Binarization)...自然场景中的文本经常会存在着文本背景复杂,文字排列不规则等因素的影响,导致文本检测的难度大幅度提升。为了进一步提升文本检测精度,在基于分割的检测技术DBNet(Real-time Scene Text Detection with Differentiable Binarization)的基础上,提出了一种改进的用于复杂自然场景的文本检测方法。改进点主要是加强DBNet网络模型的特征提取能力,在特征图融合之前加入下文提取模块CEM模块,通过空洞卷积增大感受野,再加入注意力引导模块AM,增强对小目标文字区域的检测,通过这些改进提高检测网络的精度。改进后的算法在测试集上的准确率达到92.1%,比改进前提升了0.7%。改进后的算法在真实场景的文本检测任务下提升了检测的准确率,表现出该检测算法的优越性。展开更多
文摘自然场景中的文本经常会存在着文本背景复杂,文字排列不规则等因素的影响,导致文本检测的难度大幅度提升。为了进一步提升文本检测精度,在基于分割的检测技术DBNet(Real-time Scene Text Detection with Differentiable Binarization)的基础上,提出了一种改进的用于复杂自然场景的文本检测方法。改进点主要是加强DBNet网络模型的特征提取能力,在特征图融合之前加入下文提取模块CEM模块,通过空洞卷积增大感受野,再加入注意力引导模块AM,增强对小目标文字区域的检测,通过这些改进提高检测网络的精度。改进后的算法在测试集上的准确率达到92.1%,比改进前提升了0.7%。改进后的算法在真实场景的文本检测任务下提升了检测的准确率,表现出该检测算法的优越性。