期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
Semantic Document Layout Analysis of Handwritten Manuscripts
1
作者 Emad Sami Jaha 《Computers, Materials & Continua》 SCIE EI 2023年第5期2805-2831,共27页
A document layout can be more informative than merely a document’s visual and structural appearance.Thus,document layout analysis(DLA)is considered a necessary prerequisite for advanced processing and detailed docume... A document layout can be more informative than merely a document’s visual and structural appearance.Thus,document layout analysis(DLA)is considered a necessary prerequisite for advanced processing and detailed document image analysis to be further used in several applications and different objectives.This research extends the traditional approaches of DLA and introduces the concept of semantic document layout analysis(SDLA)by proposing a novel framework for semantic layout analysis and characterization of handwritten manuscripts.The proposed SDLA approach enables the derivation of implicit information and semantic characteristics,which can be effectively utilized in dozens of practical applications for various purposes,in a way bridging the semantic gap and providingmore understandable high-level document image analysis and more invariant characterization via absolute and relative labeling.This approach is validated and evaluated on a large dataset ofArabic handwrittenmanuscripts comprising complex layouts.The experimental work shows promising results in terms of accurate and effective semantic characteristic-based clustering and retrieval of handwritten manuscripts.It also indicates the expected efficacy of using the capabilities of the proposed approach in automating and facilitating many functional,reallife tasks such as effort estimation and pricing of transcription or typing of such complex manuscripts. 展开更多
关键词 Semantic characteristics semantic labeling document layout analysis semantic document layout analysis handwritten manuscripts clustering RETRIEVAL image processing computer vision machine learning
在线阅读 下载PDF
Visual Similarity Based Document Layout Analysis
2
作者 文迪 丁晓青 《Journal of Computer Science & Technology》 SCIE EI CSCD 2006年第3期459-464,F0003,共7页
In this paper, a visual similarity based document layout analysis (DLA) scheme is proposed, which by using clustering strategy can adaptively deal with documents in different languages, with different layout structu... In this paper, a visual similarity based document layout analysis (DLA) scheme is proposed, which by using clustering strategy can adaptively deal with documents in different languages, with different layout structures and skew angles. Aiming at a robust and adaptive DLA approach, the authors first manage to find a set of representative filters and statistics to characterize typical texture patterns in document images, which is through a visual similarity testing process. Texture features are then extracted from these filters and passed into a dynamic clustering procedure, which is called visual similarity clustering. Finally, text contents are located from the clustered results. Benefit from this scheme, the algorithm demonstrates strong robustness and adaptability in a wide variety of documents, which previous traditional DLA approaches do not possess. 展开更多
关键词 document layout analysis texture analysis dynamic clustering
原文传递
基于IARPA项目指南的智能情报技术解析与布局启示 被引量:1
3
作者 付芸 刘细文 《情报学报》 北大核心 2025年第3期257-270,共14页
明确智能情报技术的内涵和外延对情报机构规划和科研人员选题至关重要。本文探索使用美国情报高级研究计划局发布的87个项目指南全文本开展细粒度技术内容分析,从主题-子主题-技术问题-评估指标四个层级维度立体化揭示其围绕智能情报技... 明确智能情报技术的内涵和外延对情报机构规划和科研人员选题至关重要。本文探索使用美国情报高级研究计划局发布的87个项目指南全文本开展细粒度技术内容分析,从主题-子主题-技术问题-评估指标四个层级维度立体化揭示其围绕智能情报技术的布局内容和特征,在此基础上总结得出智能情报技术是什么、包含哪些内容。为此,本文提出基于项目指南的技术布局分析框架,设计项目指南描述模型(project description model,PDM),包含研究目标、技术问题和评估指标三类知识元素;研发适用于PDM的项目指南文本解析提示词,在GPT-4o(generative pretrained transformer 4 omni)中应用后三类知识元素平均识别准确率达92.94%;使用TopicGPT依次处理项目指南的概要文本和研究目标文本并构建分层主题(主题-子主题);使用分层主题、技术问题与评估指标揭示技术布局内容和特征。经分析得出智能情报技术是指应用于情报工作的智能技术与升级情报工作流程智能化的信息技术,涵盖智能数据、智能计算、智能认知和智能系统四个方面,具有四大关键特征和四类评估原则,相关案例佐证了本文结论的可靠性。最后,在大情报观指导下,本文提出面向未来智能情报技术布局的六大任务方向,包括三类关键技术研发问题:情报应用情景的智能解析与认知建模技术、目标驱动的跨时空模态情报数据生产与组织技术、适用于复杂情报情景计算与分析的智能信息技术;三类核心实践应用问题:情报工作流程的标准化与自动化、情报工具的易用性与分析结果的可传播性、情报工作评估体系的确定性与可测量性。 展开更多
关键词 智能情报技术 技术布局 项目指南 项目指南描述模型
在线阅读 下载PDF
基于改进YOLOv5s的文档图像版面分析算法
4
作者 尹玲 李家乐 黄勃 《软件导刊》 2025年第2期146-154,共9页
针对当前基于深度学习的版面分析方法存在效率低和训练成本高的问题,提出一种基于YOLOv5s改进的单阶段目标检测网络RCW-YOLO,并将其应用于文档图像版面分析任务。首先,通过Res2Net模块改进YOLOv5s中的C3模块,有效增强网络对文档图像多... 针对当前基于深度学习的版面分析方法存在效率低和训练成本高的问题,提出一种基于YOLOv5s改进的单阶段目标检测网络RCW-YOLO,并将其应用于文档图像版面分析任务。首先,通过Res2Net模块改进YOLOv5s中的C3模块,有效增强网络对文档图像多尺度特征的提取能力;其次,引入轻量级上采样算子CARAFE以优化特征融合网络,减少上采样过程中的信息丢失;最后,引入WIoUv3作为边界框回归损失函数,制定合适的梯度权益分配策略,以提升模型泛化能力和整体性能。实验结果表明,在CDLA、IIIT-AR-13K和PubLayNet数据集上,RCW-YOLO在mAP@0.50:0.95指标上分别达到了87.2%、76.4%和94.5%,优于现有的两阶段算法和其他单阶段算法,同时具有更低的计算量、参数量和更快的推断效率。 展开更多
关键词 文档图像版面分析 目标检测 YOLOv5s 多尺度特征提取
在线阅读 下载PDF
人工智能技术在文档解析中的应用综述
5
作者 赵钰豪 张仰森 《北京信息科技大学学报(自然科学版)》 2025年第4期90-98,共9页
随着深度学习技术的发展,尤其是基于Transformer的预训练模型的广泛应用,文档解析逐步从传统规则方法演进为融合文本、视觉与布局信息的多模态系统。为了对后续研究提供理论参考与技术借鉴,系统回顾了文档解析技术的演进脉络:从早期基... 随着深度学习技术的发展,尤其是基于Transformer的预训练模型的广泛应用,文档解析逐步从传统规则方法演进为融合文本、视觉与布局信息的多模态系统。为了对后续研究提供理论参考与技术借鉴,系统回顾了文档解析技术的演进脉络:从早期基于规则的方法,到基于深度学习的图像预处理、版面分析及信息抽取任务,重点剖析了场景文本检测、表格理解等特定任务模型,以及布局语言模型(layout language model,LayoutLM)系列通用预训练模型和基于大语言模型的最新探索。 展开更多
关键词 文档解析 深度学习 版面分析 大语言模型
在线阅读 下载PDF
基于复合注意力机制的文档版面分析算法
6
作者 谢海龙 罗玮 +3 位作者 徐涛涛 杨文青 陈丹丹 董前前 《西安邮电大学学报》 2025年第3期103-110,共8页
为应对海量非结构化文档中关键信息快速提取的挑战,提出一种基于复合注意力机制的文档版面分析算法。该算法先在特征金字塔网络中添加空间注意力机制聚焦文档图像中信息密集的区域,引入可变性卷积解决偏移域的问题。然后通过连接通道注... 为应对海量非结构化文档中关键信息快速提取的挑战,提出一种基于复合注意力机制的文档版面分析算法。该算法先在特征金字塔网络中添加空间注意力机制聚焦文档图像中信息密集的区域,引入可变性卷积解决偏移域的问题。然后通过连接通道注意力机制自适应调整特征通道的权重,以提升文档图像特征表征质量。最后,采用残差连接方式改善深层网络中的梯度消失问题,从而实现图像特征高效融合。实验结果表明,所提算法在PubLayNet英文数据集和CDLA中文数据集上的mAP分别为88.2%和94.3%,相比对比算法分别提升了0.6%和3.3%,对复杂文档中存在的多元化表格具有更好的检测效果。 展开更多
关键词 文档版面分析 大语言模型 特征金字塔网络 空间注意力机制 通道注意力机制
在线阅读 下载PDF
基于融合查询去噪的细粒度文档布局分析方法
7
作者 杨波 李成华 陈亚当 《中国电子科学研究院学报》 2025年第4期410-419,共10页
大模型预训练需要高质量的文本和对话语料,其中,书籍、刊物等文档资料一般都是经过锤炼和校订的,是高质量语料的典范。但是,对话语料的生成需要文档处理及分析的粒度较细,才能充分挖掘其中蕴含的海量知识,因此,本文专注于细粒度的文档... 大模型预训练需要高质量的文本和对话语料,其中,书籍、刊物等文档资料一般都是经过锤炼和校订的,是高质量语料的典范。但是,对话语料的生成需要文档处理及分析的粒度较细,才能充分挖掘其中蕴含的海量知识,因此,本文专注于细粒度的文档布局分析方法。文档布局分析方法的核心是文档目标(比如,文本、图、表等)检测。目前基于Transformer架构的通用目标检测模型性能最高。但是,这类模型直接迁移到文档数据集上存在一个问题:他们独立地关注待局部检测目标且粗糙地计算目标之间的关联性,没有显示建模文档目标之间的强规律性和关联性,这会导致输出的检测结果中出现明显的误判和多个重叠框。为了解决这个挑战,文中将文档目标的空间位置和标签语义融合到DETR模型的查询去噪训练过程,以此来建模文档目标之间复杂的依赖关系,并提出一种细粒度的文档目标检测模型FQD-DETR,此模型适用于所有基于Transformer架构的通用目标检测模型。此外,本文设计了适用于文档目标检测的后处理操作Doc-NMS以提高检测结果的可用性,并且首次提出了适用于中文细粒度文档布局分析的FGDoc数据集。实验方面,文中选择当前在COCO数据集上表现最优的Co-DETR作为基线模型。本文模型在公开数据集M6Doc和自建数据集FGDoc上都表现优异,在M6Doc数据集上目标检测mAP提升到67.6%(+0.9%),在自建数据集FGDoc上细粒度目标检测mAP达到85.0%(+2.2%)。 展开更多
关键词 大语言模型预训练 文档布局分析 融合查询去噪训练 细粒度目标检测
在线阅读 下载PDF
土瑶宗教文书形制研究
8
作者 罗宗志 杨雪琴 《文化创新比较研究》 2025年第17期46-52,共7页
土瑶宗教文书是研究土瑶历史文化的重要资料,其独特的形制特征与文本构造承载着该民族的文化密码与信仰体系。论文从物质形态与文本特征双重维度展开系统性研究,揭示出土瑶宗教文书在载体类型、装帧工艺、书写技术等方面的显著民族特色... 土瑶宗教文书是研究土瑶历史文化的重要资料,其独特的形制特征与文本构造承载着该民族的文化密码与信仰体系。论文从物质形态与文本特征双重维度展开系统性研究,揭示出土瑶宗教文书在载体类型、装帧工艺、书写技术等方面的显著民族特色。该文深入剖析了土瑶宗教文书的载体类型、文本装帧、书写载体、书写工具与书写形式等方面。载体类型主要分为写卷与书册两类,写卷多为牒式文书,书册则为经本、族谱等。文本装帧富含文化信息与民族特色,封面设计涵盖书名与书主姓名,装帧多采用线装形式。书写载体经历了由天然至人造的演变,宣纸成为主要书写材料。书写工具中的笔墨和颜料体现了土瑶人的智慧和历史文化信息。书写形式特征显著,包括特色标题、合抄本、传统行款文序及灵活多变的句式构造。 展开更多
关键词 土瑶 宗教文书 形制 载体类型 书写载体 书写形式
原文传递
一种面向大批量定制的产品建模方法 被引量:48
9
作者 祁国宁 Schttner J. +2 位作者 顾新建 余军合 祁连 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2002年第1期12-15,共4页
主文档是各种模板的总称 ,利用不同的模板可以派生出不同类型的文档。由主文档生成其他文档的基本原理是 ,将事物特性表对应行的数据与主文档相结合 ,自动生成各种有关的文档。采用这种技术可以达到快速和无错误设计的目的 ,以满足大批... 主文档是各种模板的总称 ,利用不同的模板可以派生出不同类型的文档。由主文档生成其他文档的基本原理是 ,将事物特性表对应行的数据与主文档相结合 ,自动生成各种有关的文档。采用这种技术可以达到快速和无错误设计的目的 ,以满足大批量定制的需要。论述了基于事物特性表的主文档技术的基本原理和建模方法 。 展开更多
关键词 大批量定制 联轴器 事物特性表 产品建模 工业标准 CAD
在线阅读 下载PDF
Hough变换在中文名片图像倾斜校正中的应用 被引量:18
10
作者 潘武模 焦扬 王庆人 《中文信息学报》 CSCD 北大核心 2001年第3期50-56,共7页
近来 ,文档图像的计算机自动理解已取得很多进展。但是 ,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片... 近来 ,文档图像的计算机自动理解已取得很多进展。但是 ,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片版面复杂 ,名片中文字行以及每行字符较少 ,使得现有的倾斜校正算法在处理名片图像时效果很不理想。Hough变换可用于一般文档图像的倾斜校正。但是 ,Hough变换在名片图像中的应用还有待研究。本文提出一种二级Hough变换算法 ,并应用于名片图像理解系统 ,利用名片图像自身的特点提高Hough变换的精确度和速度。这一方法的效果已被实验结果所证实。 展开更多
关键词 文档分析 版面理解 倾斜校正 HOUGH变换 中文名片
在线阅读 下载PDF
大型中文古籍《四库全书》自动版面分析系统 被引量:7
11
作者 姜哲 马少平 夏莹 《中文信息学报》 CSCD 北大核心 2000年第2期14-20,共7页
《四库全书》是中文古籍的经典和代表。对《四库全书》的整理 ,可以为其它古籍的整理积累和提供经验。本系统属于《四库全书》电子版专用OCR系统的预处理配套系统 ,主要功能是对《四库全书》的页面图象进行分析和理解 ,分离图象中的汉... 《四库全书》是中文古籍的经典和代表。对《四库全书》的整理 ,可以为其它古籍的整理积累和提供经验。本系统属于《四库全书》电子版专用OCR系统的预处理配套系统 ,主要功能是对《四库全书》的页面图象进行分析和理解 ,分离图象中的汉字用于识别和统计 ,获取版面结构以便于重编和出版。《四库全书》属于手写木版印刷 ,版面有一定规范 ,但形式多样、结构复杂、图象质量和字体大小有差异 ,版面分析的难度很大。本系统采用了自顶向下方法与自底向上方法相结合、自动处理与人工修正相结合的设计思想。从实用情况看 ,本系统已经能够自动采用相应算法 ,处理多种规范和准规范的版面 ,并提供方便的人工辅助纠错功能 ,保障了预处理工作的顺利进行 ,也为识别系统的学习建库和识别创造了良好的条件。 展开更多
关键词 四库全书 版面分析 汉字识别 OCR技术
在线阅读 下载PDF
文档智能分析与识别前沿:回顾与展望 被引量:19
12
作者 刘成林 金连文 +2 位作者 白翔 李晓辉 殷飞 《中国图象图形学报》 CSCD 北大核心 2023年第8期2223-2252,共30页
文档分析与识别(简称文档识别)技术将各种非结构化文档数据(图像、联机笔迹)转化为结构化数据,便于计算机处理和理解,应用场景十分广阔。20世纪60年代以来,文档识别方法研究与应用受到广泛关注并取得巨大进展。得益于深度学习技术的发... 文档分析与识别(简称文档识别)技术将各种非结构化文档数据(图像、联机笔迹)转化为结构化数据,便于计算机处理和理解,应用场景十分广阔。20世纪60年代以来,文档识别方法研究与应用受到广泛关注并取得巨大进展。得益于深度学习技术的发展和应用,文档识别的性能快速提升,相关技术在文档数字化、票据处理、笔迹录入、智能交通、文档检索与信息抽取等领域得到广泛应用。首先介绍文档识别的背景和技术范畴,回顾该领域发展历史,然后重点对深度学习方法兴起以来的研究进行综述,分析当前技术存在的不足,并建议未来值得重视的研究方向。研究现状综述部分,按文档分析与识别的几个主要技术环节(文档图像预处理、版面分析、场景文本检测、文本识别、结构化符号和图形识别、文档检索与信息抽取)分别进行介绍,简述传统方法研究的代表性工作,重点介绍深度学习方法研究的新进展。总体上,当前研究对象向深度、广度扩展,处理方法全面转向深度神经网络模型和深度学习方法,识别性能大幅提升且应用场景不断扩展。在现状分析基础上,指出当前技术在识别精度和可靠性、可解释性、学习能力和自适应性等方面还有明显不足。最后从提升性能、应用扩展、提升学习能力几个角度提出一些研究方向。从提升性能角度,研究问题包括文本识别可靠性、可解释性、全要素识别、长尾问题、多语言、复杂版面分割与理解、变形文档分析与识别等。应用扩展包括新应用(如机器人流程自动化(robotic process automation,RPA)、文字信息抄录、考古)和新技术问题(语义信息抽取、跨模态融合、面向应用的推理决策等)两方面。从提升学习能力角度,相关问题包括小样本学习、迁移学习、多任务学习、领域自适应、结构化预测、弱监督学习、自监督学习、开放集学习和跨模态学习等。 展开更多
关键词 文档分析与识别 文档智能 版面分析 文本检测 文本识别 图形符号识别 语义信息抽取
原文传递
基于膨胀算法的版面分析技术 被引量:2
13
作者 郭延辉 黄剑华 唐降龙 《计算机工程与应用》 CSCD 北大核心 2003年第34期223-225,共3页
论文提出了基于数学形态学的版面分析方法。该方法是以自底向上为主,同时结合了数学形态学的思想。论文提出的方法,利用数学形态学的膨胀运算和搜索算法,实现对复杂版面进行快速准确的分析。论文以名片版面图像作为测试样本,进行版面分... 论文提出了基于数学形态学的版面分析方法。该方法是以自底向上为主,同时结合了数学形态学的思想。论文提出的方法,利用数学形态学的膨胀运算和搜索算法,实现对复杂版面进行快速准确的分析。论文以名片版面图像作为测试样本,进行版面分析,取得了预期的效果。 展开更多
关键词 版面分析 数学形态学 搜索算法
在线阅读 下载PDF
信函自动分拣软件系统 被引量:2
14
作者 黄磊 刘昌平 《计算机工程与应用》 CSCD 北大核心 2003年第19期21-24,50,共5页
该文详细介绍了信函分拣系统软件部分以及在实现过程中所采用的具体方法,包括图像预处理、邮编定位与识别、版面分析和版面理解、单字分割及后处理等各个过程。系统采用了邮政编码与地址相互校正的分拣方法,有效地提高了分拣率。系统正... 该文详细介绍了信函分拣系统软件部分以及在实现过程中所采用的具体方法,包括图像预处理、邮编定位与识别、版面分析和版面理解、单字分割及后处理等各个过程。系统采用了邮政编码与地址相互校正的分拣方法,有效地提高了分拣率。系统正在某地进行试点,取得了较好的效果。 展开更多
关键词 信函自动分拣 OCR 版面分析与理解 手写识别
在线阅读 下载PDF
一种基于连通域的蒙古文文档图像版面分析方法 被引量:4
15
作者 魏宏喜 高光来 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第5期586-590,共5页
版面分析是一个将文本页面图像分割成不同区域,并标定区域类型(如文字、图片、表格等)的过程,与字符识别具有同等重要的地位.提出了一种基于连通域的蒙古文版面分析方法,它提取文档图像中所有连通域,根据连通域的大小进行聚类,从而可以... 版面分析是一个将文本页面图像分割成不同区域,并标定区域类型(如文字、图片、表格等)的过程,与字符识别具有同等重要的地位.提出了一种基于连通域的蒙古文版面分析方法,它提取文档图像中所有连通域,根据连通域的大小进行聚类,从而可以得到文字连通域和非文字连通域,达到分割版面的目的.实验证明,该算法能够对蒙古文书籍版面进行准确的分析. 展开更多
关键词 蒙古文文档图像 版面分析 自底向上法 自顶向下法 连通域
在线阅读 下载PDF
版式电子文档表格自动检测与性能评估 被引量:3
16
作者 房婧 高良才 +1 位作者 仇睿恒 汤帜 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期45-53,共9页
针对版式电子文档的特点,提出一种表格线分割符和表格文本的布局特征相结合的表格定位方法,并且对中英文档均有效。此外,针对缺少表格定位自动评估体系,构建了一个初具规模的公开数据集,由中英文版式页面等比例组成,对其标注基准结果,... 针对版式电子文档的特点,提出一种表格线分割符和表格文本的布局特征相结合的表格定位方法,并且对中英文档均有效。此外,针对缺少表格定位自动评估体系,构建了一个初具规模的公开数据集,由中英文版式页面等比例组成,对其标注基准结果,并针对移动阅读应用场景提出一套评估准则。通过与现有两个开源表格定位项目的比较,验证了新提出的表格定位方法的有效性和评估体系的实用性,特别是对中文数据集获得了较好的结果。 展开更多
关键词 版式文档 表格定位 表格检测 自动性能评估
在线阅读 下载PDF
流式文档到固定版式文档的可逆转换方法研究 被引量:1
17
作者 李宁 刘寅 +1 位作者 梁琦 冯雪 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期203-212,共10页
分析以往流式文档和固定版式文档一体化处理方法的局限,提出一种可逆转换方法,即将文档的转换信息记录于目标文档中,以便用于源文档的重构。论述了可逆转换的原理、关键技术、实验结果以及技术优势。选择标文通(UOF)作为流式文档格式,C... 分析以往流式文档和固定版式文档一体化处理方法的局限,提出一种可逆转换方法,即将文档的转换信息记录于目标文档中,以便用于源文档的重构。论述了可逆转换的原理、关键技术、实验结果以及技术优势。选择标文通(UOF)作为流式文档格式,CEBX作为固定版式文档格式,利用该方法成功地实现标文通文档到CEBX文档的可逆转换,实验结果表明,该方法取得较好的效果。 展开更多
关键词 版流一体化 文档格式 文档转换 UOF CEBX
在线阅读 下载PDF
基于内容的文档图像倾斜校正 被引量:10
18
作者 吕亚军 陈继荣 鹿晓亮 《计算机仿真》 CSCD 2006年第12期192-196,共5页
纸质文档通过图像获取设备转换为文档图像,由于人为因素和一些其它原因,文档图像不可避免地包含一定的倾斜角度。为了便于计算机处理,有必要对文档图像进行倾斜校正。文档版面十分复杂,包含文字、图像、图形、表格等内容。建立一个较为... 纸质文档通过图像获取设备转换为文档图像,由于人为因素和一些其它原因,文档图像不可避免地包含一定的倾斜角度。为了便于计算机处理,有必要对文档图像进行倾斜校正。文档版面十分复杂,包含文字、图像、图形、表格等内容。建立一个较为通用的文档图像倾斜校正算法是很困难的。提出了基于内容的文档倾斜自动校正方法,通过小波变换、游长平滑和细化处理,提取表格中的水平线和垂直线或文字行。针对不同的文档版面采用相应的倾斜校正策略。实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。 展开更多
关键词 版面分析 文档处理 倾斜校正
在线阅读 下载PDF
文档图象的版面分析—基于数学形态学的方法 被引量:2
19
作者 杨波 汪同庆 +1 位作者 叶俊勇 任莉 《小型微型计算机系统》 CSCD 北大核心 2003年第9期1673-1676,共4页
提出了基于 Hough变换的结构元素构造方法 (HTSEC)以及基于数学形态学的分割方法 (MMS) ,即首先将灰度文档图象利用半色调技术转换为二值图象 ,利用 Hough变换动态构造结构元素 ,然后利用数学形态学方法对版面进行划分并将其分为文字区。
关键词 文档图象分析 版面分析 数学形态学 HOUGH变换 动态结构元素
在线阅读 下载PDF
OFD版式文档国家标准解读 被引量:10
20
作者 高林 李海波 +1 位作者 丛培勇 王寒冰 《信息技术与标准化》 2016年第10期42-44,共3页
分析了OFD在电子文件标准体系中的定位,重点阐述了OFD的成像模型技术、自定义标引技术、安全支撑、多文档等方面的重要特性,并给出了OFD在电子公文、档案、电子证照等领域的应用实例。
关键词 版式文档 OFD 语义 成像模型技术 自定义标引 安全支撑 多文档
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部