依存分析和HMM相结合的信息抽取方法被引量：4

Method of text information extraction based on dependency parsing and HMM

下载PDF

导出

摘要信息抽取是文本信息处理的一个重要环节,当前的信息抽取研究工作大多针对半结构化的文本。针对自由文本,提出一种依存分析和HMM相结合的文本信息抽取算法,该算法在运用依存分析对句子进行浅层句法分析的基础上制定相应规则,形成输入序列,结合HMM易于建立、适应性好、抽取精度较高的优势,实现自由文本的信息抽取。实验结果表明,新的算法在召回率、准确率和正确率指标上均有良好的性能,说明了算法的有效性,为文本信息的抽取提供了新思路。 Information extraction is an important part of text information processing. The current information extraction researches mostly focus on semi-structured text. It proposes a novel text information extraction algorithm based on the combination of dependency parsing and HMM. The algorithm formulates appropriate rules based on applying dependency parsing to shallow syntactic analysis of sentences, forming the input sequence of HMM to achieve free text information extraction combining the advantage of easily building, good adaptability and high extraction accuracy of HMM. Experimental results show that the new algorithm has very good performance on recall rate, accuracy and correct rate.

作者袁璐蒙祖强许珂

机构地区广西大学计算机与电子信息学院

出处《计算机工程与应用》 CSCD 2012年第9期138-140,共3页 Computer Engineering and Applications

基金国家自然科学基金(No.61063032) 广西教育厅科研基金项目(No.201012MS010)

关键词信息抽取自由文本隐马尔可夫模型依存分析 information extraction free text Hidden Markov Model（HMM）, dependency parsing

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1Appeltd D.Introduction to information extraction[J].AI Commun,1999,12(3):161-172.
2Miller S,Crystal M,Fox H,et al.Algorithms that learn to extract information-BBN:description of the SIFT system as used for MUC-7[C]//Proc of MUC-7,1998.
3Ciravegna F.Adaptive information extraction from text by rule induction and generalization[C]//Proc of the17th International Joint Conf on Artificial Intelligence,2001.
4林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：49
5周顺先,林亚平,王耀南,易叶青.基于二阶隐马尔可夫模型的文本信息抽取[J].电子学报,2007,35(11):2226-2231. 被引量：25
6于江德,肖新峰,樊孝忠.基于隐马尔可夫模型的中文文本事件信息抽取[J].微电子学与计算机,2007,24(10):92-94. 被引量：17
7Rabiner L E.A tutorial on hidden Markov models and selected application in speech recognition[J].Proceedings of the IEEE,1989,77(2):257-286.
8付剑锋,刘宗田,付雪峰,周文,仲兆满.基于依存分析的事件识别[J].计算机科学,2009,36(11):217-219. 被引量：20
9刘云中,林亚平,陈治平.基于隐马尔可夫模型的文本信息抽取[J].系统仿真学报,2004,16(3):507-510. 被引量：52
10谭鹏许,张来顺.采用树自动机推理技术的信息抽取方法[J].计算机工程与应用,2010,46(16):153-156. 被引量：2

二级参考文献62

1王茹,宋瀚涛,陆玉昌.基于树自动机的网页数据抽取[J].北京理工大学学报,2004,24(9):790-793. 被引量：6
2姜吉发.一种跨语句汉语事件信息抽取方法[J].计算机工程,2005,31(2):27-29. 被引量：12
3林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：49
4周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：115
5洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：58
6Daniel N, Radev D, Allison T. Sub-event based multi-document summarization[C] // Association for Computational Linguistics Morristown. NJ, USA, 2003 : 9-16.
7Filatova E, Hatzivassiloglou V. Event-based Extractive Summarization[C]//Association for Computational Linguistics, 2004: 104-111.
8Yang H, Chua T S, Wang S, et al. Structured use of external knowledge for event-based open domain question answering[M]. New York, NY, USA: ACM Press, 2003: 33-40.
9Nivre J, Scholz M. Deterministic dependency parsing of English text[C] // Association for Computational Linguistics Morristown. NJ, USA, 2004 : 64-70.
10Yakushiji A, Tateisi Y, Miyao Y, et al. Event extraction from biomedical papers using a full parser. 2001:408-419.

共引文献135

1孔静静,于琦,李敬华,于彤,张竹绿,田野,祖雅琪.实体抽取综述及其在中医药领域的应用[J].世界科学技术-中医药现代化,2022,24(8):2957-2963. 被引量：9
2张雪英,闾国年,叶鹏.大数据地理信息系统:框架、技术与挑战[J].现代测绘,2020(6):1-8. 被引量：10
3贾钰峰,章蓬伟,邵小青,张玉茜.印刷维吾尔文识别后处理[J].智能计算机与应用,2020(4):239-242.
4张前进,孙炎增,徐素莉.基于连续HMM与静态外观信息模型融合的步态识别[J].微电子学与计算机,2009,26(3):45-48. 被引量：4
5王敬普,林亚平,周顺先,岳文.基于包装器模型的文本信息抽取[J].计算机应用,2006,26(3):655-658. 被引量：8
6王雷,陈治平,李志成.基于文本分块的多模板隐马尔可夫模型的文本信息抽取[J].山东大学学报（理学版）,2006,41(3):25-28. 被引量：4
7顾铮,顾平.信息抽取技术在中医研究中的应用[J].医学信息（西安上半月）,2007,20(1):27-30. 被引量：12
8聂哲,顾明.基于XML的政府公文信息抽取中间件的设计与实现[J].计算机工程与设计,2007,28(5):1158-1160.
9周顺先,林亚平,王耀南.基于主动学习隐马尔可夫模型的文本信息抽取[J].湖南大学学报（自然科学版）,2007,34(6):74-77. 被引量：3
10郑彦宁,化柏林,张新民.信息检索与信息抽取差异性探析[J].图书情报工作,2007,51(10):17-20. 被引量：1

同被引文献45

1符福峘,吴显沪.情报科学的基本概念与方法(三)[J].情报科学,1985,6(6):72-91. 被引量：1
2董慧,杨宁,余传明,姜赢,徐国虎,张继东.基于本体的数字图书馆检索模型研究（Ⅰ） ——体系结构解析[J].情报学报,2006,25(3):269-275. 被引量：29
3董慧,余传明,姜赢,杨宁,徐国虎,张华.基于本体的数字图书馆检索模型研究（Ⅱ）——语义信息的提取[J].情报学报,2006,25(4):451-461. 被引量：18
4董慧,余传明,杨宁,陈亮,徐国虎,张继东,彭翠萍.基于本体的数字图书馆检索模型研究（Ⅲ）——历史领域资源本体构建[J].情报学报,2006,25(5):564-574. 被引量：45
5董慧,余传明,徐国虎,姜赢,敖青,陈亮,王国育,夏阳.基于本体的数字图书馆检索模型研究（Ⅳ）——历史领域知识推理机制[J].情报学报,2006,25(6):666-678. 被引量：17
6李广建,汪语宇,张丽.数字资源整合的实现机制及关键技术——对国外数字资源整合系统的实证研究[J].中国图书馆学报,2007,33(2):75-80. 被引量：34
7罗庆云,赵巾帼.语义化Web的理论基础与技术基础[J].甘肃联合大学学报（自然科学版）,2007,21(5):75-79. 被引量：1
8潘伟.个性化信息服务关键技术——聚类分析[J].现代情报,2007,27(10):212-214. 被引量：5
9刘成山,刘怀亮.基于语义网的数字图书馆[J].情报杂志,2008,27(1):49-51. 被引量：13
10熊回香,夏立新.汉语分词技术综述[J].图书情报工作,2008,52(4):81-84. 被引量：9

引证文献4

1楼雯.馆藏资源语义化关键技术及实证研究[J].中国图书馆学报,2013,39(6):27-40. 被引量：19
2李欣,张毅,汪志莉.图书馆异构特藏资源整合的数字人文研究需求[J].数字图书馆论坛,2017(11):48-53. 被引量：14
3丁晟春,王莉,刘梦露.基于规则的动物卫生事件舆情信息抽取研究[J].计算机应用与软件,2018,35(9):56-62. 被引量：7
4陈国,刘亮亮,张再跃.用户短文本无关语自动识别方法研究[J].计算机与数字工程,2019,47(7):1748-1752. 被引量：1

二级引证文献41

1韦绍芬.基于关联聚合的数字图书馆社区集成知识推送服务模式研究[J].图书馆学刊,2018,40(11):116-119. 被引量：2
2杨瑞仙,李露琪.国内外数字文献资源深度聚合研究现状的比较分析[J].图书情报知识,2014,31(6):68-74. 被引量：9
3李佳南,王曰芬,颜端武.馆藏资源语义知识库及服务平台构建探究--以台湾问题为例[J].图书馆学研究,2014(22):29-35. 被引量：3
4张洋,张海静.基于用户信息的馆藏资源语义化研究[J].图书情报知识,2015,32(1):95-106. 被引量：1
5楼雯.馆藏资源语义化理论体系研究[J].图书馆学研究,2015(2):35-40. 被引量：5
6赵蓉英,程震霖.国内馆藏数字资源语义化研究现状[J].信息资源管理学报,2015,5(2):97-103.
7刘晓娟,黄海晶,尤斌.语义网技术在图书馆数字资源深度聚合中的应用[J].图书馆杂志,2015,34(6):76-82. 被引量：10
8赵蓉英,杨永美.国内外馆藏资源语义化研究进展分析[J].图书馆学研究,2015(20):2-10. 被引量：2
9徐华洋.基于课程大规模开放的图书馆在线学习支持及其应用技术研究[J].现代情报,2015,35(12):134-138. 被引量：8
10李彤,王福.不规则知识晶格视角下的数字图书馆知识发现研究[J].情报理论与实践,2016,39(11):49-54. 被引量：4

1李良富,王汉杰,刘金玉,宋帅.基于黑板模型的地面气象数据质量控制[J].气象科技,2006,34(2):199-204. 被引量：16
2王攀,李幼凤,冯珊.模块化神经网络的Bayes子网集结新算法研究[J].智能系统学报,2006,1(2):79-83.
3罗兵.自动质量检测系统的性能评价指标[J].电子质量,2008(1):48-52.

计算机工程与应用

2012年第9期

浏览历史

内容加载中请稍等...

依存分析和HMM相结合的信息抽取方法被引量：4

参考文献11

二级参考文献62

共引文献135

同被引文献45

引证文献4

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

依存分析和HMM相结合的信息抽取方法 被引量：4

参考文献11

二级参考文献62

共引文献135

同被引文献45

引证文献4

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

依存分析和HMM相结合的信息抽取方法被引量：4