期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于混合视觉策略的异构表格抽取研究
1
作者 栾真 尤宝鑫 +5 位作者 胡峻杰 王又辰 田宗凯 胡馨月 王佳 吴金凤 《网络安全与数据治理》 2025年第S1期238-246,共9页
本研究旨在解决军事领域中异构表格数据的识别与抽取问题,提出了一种基于混合视觉策略的表格抽取与体系化存储框架。首先采用融合Mask R-CNN和Unet的表格检测算法与基于PP-OCRv4表格文本识别方法,实现了对于原始数据的检测及电子化,并引... 本研究旨在解决军事领域中异构表格数据的识别与抽取问题,提出了一种基于混合视觉策略的表格抽取与体系化存储框架。首先采用融合Mask R-CNN和Unet的表格检测算法与基于PP-OCRv4表格文本识别方法,实现了对于原始数据的检测及电子化,并引入IoT指标解决现实表格数据的文本换行、溢出等问题;然后,提出了一种自适应的表格标准化重构方法,使得多来源的异构表格数据可实现结构化、体系化的统一存储;最后探讨了如何将提取的结构化数据应用于军事知识库构建,为海量知识数据的自动化提取与标准化存储提供了数据支撑。 展开更多
关键词 表格检测 表格文本识别 pp-ocrv4 标准化重构
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部