期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于标签特征强化的视觉富文档实体关系抽取
1
作者 曹劲然 卫俊俊 +2 位作者 童哲 周晓阳 包岩 《江苏通信》 2025年第5期62-68,共7页
本文提出了一种基于标签特征强化的视觉富文档实体关系抽取方法。首先构造实体标注模型,融合语义特征和位置特征,结合ADKNN(Adaptive Density-based K-Nearest Neighbors,自适应密度分布K最近邻算法)对GAT(Graph Attention Networks,图... 本文提出了一种基于标签特征强化的视觉富文档实体关系抽取方法。首先构造实体标注模型,融合语义特征和位置特征,结合ADKNN(Adaptive Density-based K-Nearest Neighbors,自适应密度分布K最近邻算法)对GAT(Graph Attention Networks,图注意力神经网络)结构优化,以达到更精确的识别。其次对实体特征进行强化,将识别的实体标签与其语义、位置特征融合,形成后续任务的实体输入特征。然后构建实体关系抽取模型,基于核心实体关系重构GAT中的图结构,提出基于类别特征差异化的2层MLP(Multilayer Perceptron,多层感知器)框架,进一步提升实体关系抽取模型性能。最后在FUNSD(Form Understanding in Noisy Scanned Documents,含噪声扫描文档表单理解)数据集上进行了实体标注和关系抽取任务对比验证。本文模型预测效果优于基线方法及其他改进模型,为VRD(Visually Rich Document,视觉富文档)的关键信息提取任务提供了有效支持。 展开更多
关键词 视觉富文档 实体标注 关系抽取 GAT FUNSD
在线阅读 下载PDF
SCID:用于富含视觉信息文档图像中信息提取任务的扫描中文票据数据集 被引量:6
2
作者 乔梁 李再升 +1 位作者 程战战 李玺 《中国图象图形学报》 CSCD 北大核心 2023年第8期2298-2313,共16页
目的视觉富文档信息抽取致力于将输入文档图像中的关键文字信息进行结构化提取,以解决实际业务问题,财务票据是其中一种常见的数据类型。解决该类问题通常需要应用光学字符识别(optical character recognition,OCR)和信息抽取等多个领... 目的视觉富文档信息抽取致力于将输入文档图像中的关键文字信息进行结构化提取,以解决实际业务问题,财务票据是其中一种常见的数据类型。解决该类问题通常需要应用光学字符识别(optical character recognition,OCR)和信息抽取等多个领域的技术。然而,目前公开的相关数据集的数量较少,且每个数据集中包含的图像数量也较少,这都成为了制约该领域技术发展的一个重要因素。为此,本文收集、标注并公开发布了一个真实中文扫描票据数据集SCID(scanned Chinese invoice dataset),包含6类常见财务票据,共40716幅图像。方法该数据集提供了用于OCR任务和信息抽取的两种标签。针对该数据集,本文提出一个基于LayoutLM v2(layout language model v2)的基线方案,实现了从输入图像到最终结果的端到端推理。基于该数据集承办的CSIG(China Society of Image and Graphics)2022票据识别与分析挑战赛,吸引了大量科研人员参与,并提出了优秀的解决方案。结果在基线方案实验中,分别验证了使用OCR引擎推理、OCR模型精调和OCR真值3种设定的实验结果,F1值分别为0.7687、0.8570和0.9857,一方面证明了LayoutLM v2模型的有效性;另一方面证明了该场景下OCR的挑战性。结论本文提出的扫描票据数据集SCID展示了真实OCR技术应用场景的多项挑战,可以为文档富视觉信息抽取相关技术领域研发和技术落地提供重要数据支持。该数据集下载网址:https://davar-lab.github.io/dataset/scid.html。 展开更多
关键词 数据集 财务票据 视觉富文档 信息抽取 光学字符识别(OCR) 多模态信息
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部