-
题名数学公式识别系统:MatheReader
被引量:13
- 1
-
-
作者
靳简明
江红英
王庆人
-
机构
南开大学机器智能研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2006年第11期2018-2026,共9页
-
基金
国家自然科学基金天元基金(TY10026002-04-04-01)资助.
-
文摘
数学公式广泛存在于各类文献之中,但是公式的识别远比文字段落的识别困难.文章介绍了一个数学公式图像识别系统MatheReader,重点阐述了其在公式定位及公式分析方面的技术方案.在公式定位方面,抽取版式特征,采用Parzen分类器区分独立公式和普通文字行,在普通文字行内检测二维结构定位内嵌公式.在公式分析方面,定义十一种基本公式类型,并用产生式规则限定每类公式的唯一分解方法,提出先识别公式类型,然后分解为子表达式的公式分析方法.和已有系统比较,MatheReader的功能更加强大,能够处理的公式更加丰富.
-
关键词
公式定位
公式识别
公式分析
自动性能评估
文档图像处理
-
Keywords
expression extraction
expression recognition
expression analysis
automatic performance evaluation
document image processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名表格结构识别的自动性能评估
- 2
-
-
作者
靳简明
史广顺
张伟鹏
韩智
潘武模
王庆人
-
机构
南开大学机器智能研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第6期82-84,91,共4页
-
文摘
评估算法的性能需要反复大量的测试。人工评估既难以保证评价标准的一致,又无法保证测试的速度和规模,只有自动的性能评估才能解决上述问题。表格结构识别是进一步理解表格内容的前提。在定义通用表格结构描述的基础上,提出了基于表格线的表格结构识别的性能评估方法。自动评估系统能够指出识别结果与基准数据的区别,平均每秒比较38.6个表格,远超过人工评估的效率。
-
关键词
表格结构识别
自动性能评估
文档图像处理系统
字符识别
-
Keywords
automatic performance evaluation,document image processing,table structure
-
分类号
TP317.4
[自动化与计算机技术—计算机软件与理论]
-
-
题名数学公式图像处理综述
被引量:7
- 3
-
-
作者
靳简明
江红英
王庆人
-
机构
南开大学机器智能研究所
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2005年第4期429-440,共12页
-
文摘
数学公式广泛存在于各类文献之中,因此数学公式的自动定位、识别、分析和理解是文档图像处理必须研究的问题。但是数学公式和普通文本存在很大区别,所以数学公式的识别、分析远比文字段落的识别困难。本文回顾了数学公式图像处理的研究历程,提出了公式处理的模型,总结比较了公式定位、公式识别、公式分析以及性能评估等方面的主要处理方法,并展望了未来的研究方向。
-
关键词
数学公式图像处理
数学公式定位
数学公式识别
数学公式分析
自动性能评估
文档图像处理
-
Keywords
Mathematical Expression image processing, Expression Location, Expression Recognition,Expression Analysis, automatic performance evaluation, document image processing
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-