基于本体知识库的自动语义标注被引量：9

Automatic semantic annotation based on ontology and knowledge base

下载PDF

导出

摘要为了产生语义Web中的元数据,需要提取Web文档中的语义信息;面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法;语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于N-gram的语义消歧方法。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。 To recognize candidate named entities,designed the semantic dictionary and calculated semantic distance between entities by semantic relevance path.The most complex problem in semantic annotation was semantic disambiguation.This paper proposed a semantic disambiguation method based on the shortest path and N-gram.Experiments was made on a news corpus.The result shows that the method is effective for the task of automatic semantic annotation.

作者戚欣肖敏孙建鹏

机构地区武汉理工大学计算机科学与技术学院

出处《计算机应用研究》 CSCD 北大核心 2011年第5期1742-1744,1747,共4页 Application Research of Computers

基金中央高校基本科研业务费专项资金资助项目(2010-IV-023)

关键词语义标注 N-GRAM 语义消歧有向图知识库 semantic annotation N-gram semantic disambiguation directed acyclic graph knowledge base

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1BERNERS-LEE T, HENDLER J, LASSILA O. The semantic Web [J]. Scientific American, 2001, 284(5): 28-37.
2陈叶旺,李文,彭鑫,赵文耘.基于本体的文档语义标注改进方法[J].东南大学学报（自然科学版）,2009,39(6):1109-1113. 被引量：19
3DILL S, EIRON N, GIBSON D,et al. SemTag and Seeker:bootstrapping the semantic Web via automated semantic annotation [ C ]//Proc of the 12th International Conference on World Wide Web. New York: ACM, 2003:178-186.
4王灿辉,张敏,马少平.自然语言处理在信息检索中的应用综述[J].中文信息学报,2007,21(2):35-45. 被引量：51
5KIRYAKOV A, POPOV B, OGNYANOFF D. Semantic annotation, indexing, and retrieval [ J ]. Web Semantics: Science, Services and Agent on the world W:de Web,2004 2( 1 ) :49 -79.
6SHAFFER C. A practical introduction to data structures and algorithm analysis, Java edition[M]. New Jersey:Prentice Hall, 1998.
7张华平,刘群.基于N-最短路径方法的中文词语粗分模型[J].中文信息学报,2002,16(5):1-7. 被引量：99
8徐志明,王晓龙,关毅.N-gram语言模型的数据平滑技术[J].计算机应用研究,1999,16(7):37-39. 被引量：11

二级参考文献54

1张敏,宋睿华,马少平.基于语义关系查询扩展的文档重构方法[J].计算机学报,2004,27(10):1395-1401. 被引量：55
2苏祺,昝红英,胡景贺,项锟.词性标注对信息检索系统性能的影响[J].中文信息学报,2005,19(2):58-65. 被引量：9
3周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
4赵军,金千里,徐波.面向文本检索的语义计算[J].计算机学报,2005,28(12):2068-2078. 被引量：27
5金澎,刘毅,王树梅.汉语分词对中文搜索引擎检索性能的影响[J].情报学报,2006,25(1):21-24. 被引量：6
6Berners Lee T, Hendler J, Lassila O. The semantic web [ J ]. Scientific American Magazine,2001,284 ( 5 ) :28 - 37.
7Ciravegna F, Wilks Y. Designing adaptive information extraction for the semantic Web in Amilcare [ C ] //Annotation for the Semantic Web, Frontiers in Artificial Intelligence and Applications Amsterdam. Amsterdam, Netherlands: IOS Press, 2003 : 112 - 127.
8Alani H, Kim S, Millard D, et al. Automatic ontologybased knowledge extraction from Web documents [ J ]. Intelligent Systems,2003,18( 1 ) :14 -21.
9Lai Y, Wang R. Towards automatic knowledge acquisition from text based on ontology-centric knowledge representation and acquisition [ C ]//Proceedings of the KCAP Workshop on Knowledge Markup and Semantic Annotation. Sanibel, FL, USA,2003 : 111 - 127.
10Schutz A,Buitelaar P. RelExt:a tool for relation extraction from text in ontology extension [ C ] //Proceedings of the 4th International Semantic Web Conference. Berlin : Springer, 2005 : 593 - 606.

共引文献176

1李奕霖,周艳平.基于孪生网络和字词向量结合的文本相似度匹配[J].计算机系统应用,2022,31(10):295-302. 被引量：8
2魏伟,郭崇慧,邢小宇.基于语义关联规则的试题知识点标注及试题推荐[J].数据分析与知识发现,2020,4(2):182-191. 被引量：10
3骆魁永.一种面向不均衡数据集的CHI特征选择改进算法[J].商丘师范学院学报,2021,37(6):9-13.
4战疆,冯月利,王珊.PostgreSQL中文全文索引技术研究与实现[J].华中科技大学学报（自然科学版）,2005,33(Z1):213-216.
5郑婧,孙卫.国内自然语言处理技术研究与应用的状态[J].数字图书馆论坛,2008(7):27-31. 被引量：1
6隋丽萍,徐承韬,李瑞芳.一个中文全文检索系统的设计与实现[J].科技资讯,2007,5(18):244-245. 被引量：1
7张素娟,郑庆华,胡云华,孙霞.一种面向网络答疑的汉语切分歧义消除算法[J].计算机工程与应用,2004,40(25):55-58. 被引量：4
8王朝静,郑庆华.面向答疑文本的词类标注方法的研究与实现[J].计算机工程与应用,2004,40(16):57-60. 被引量：2
9刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：202
10张仰森,曹元大.基于语料库的自然语言建模方法研究[J].计算机科学,2004,31(5):176-179. 被引量：1

同被引文献120

1胡于进,周小玲,凌玲,王学林.基于向量空间模型的贝叶斯文本分类方法[J].计算机与数字工程,2004,32(6):28-30. 被引量：7
2李向阳,张亚非,陆建江.基于语义提升HMM的语义标注[J].解放军理工大学学报（自然科学版）,2005,6(1):30-35. 被引量：3
3朱远平,戴汝为.基于SVM决策树的文本分类器[J].模式识别与人工智能,2005,18(4):412-416. 被引量：25
4毛伟,徐蔚然,郭军.基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统[J].中文信息学报,2006,20(3):29-35. 被引量：17
5许斌,李涓子,王克宏.Web服务语义标注方法[J].清华大学学报（自然科学版）,2006,46(10):1784-1787. 被引量：23
6丁晟春,甘利人,陈开浩.本体的图形化可视检索研究与应用[J].中国图书馆学报,2007,33(3):64-68. 被引量：3
7邢军,韩敏,周开朋.领域本体信息源选取方法研究与实现[J].大连理工大学学报,2007,47(4):598-604. 被引量：3
8沙丽华.面向领域文档的语义标注方法研究[D].长春:吉林大学,2009.
9Lee TB, Hendler J, Lassila O. The Semantic Web. http://www. sciam.com/article.cfm?id=the-semantic-web.
10Rijsbergen V. A new theoretical framework for information retrieval. Proc. of AMC Conference on Research and Development in Information Retrieval 1998.194-200.

引证文献9

1胡川洌,符云清,钟明洋.基于领域本体的语义查询扩展[J].计算机系统应用,2012,21(7):83-89. 被引量：7
2杨朝阳,刘永坚.智能视频内容构建及无线投送系统的设计[J].武汉理工大学学报（信息与管理工程版）,2013,35(4):500-502.
3傅柱.面向文本文档的语义标注研究综述[J].情报学报,2014,33(4):439-448. 被引量：3
4熊晶,支丽平,袁冬.基于本体和依存句法的词汇语义关系标注及评价方法研究[J].中文信息学报,2015,29(3):58-64.
5陈凯,沈备军,王永剑,金波.源代码变量名的自动语义标注[J].计算机应用研究,2016,33(11):3349-3352. 被引量：1
6林文,林祖增.一种文本输入时语义标注系统的实现[J].福建电脑,2017,33(2):154-155.
7赵文娟.基于汉语框架本体的网络标注模型构建[J].办公自动化,2017,22(19):25-28.
8唐晓波,翟夏普.基于本体和Word2Vec的文本知识片段语义标引[J].情报科学,2019,37(4):97-102. 被引量：9
9何彬,李心宇,陈蓓蕾,夏盟,曾致中.基于属性关系深度挖掘的试题知识点标注模型[J].南京信息工程大学学报（自然科学版）,2019,11(6):727-734.

二级引证文献20

1曾辉,江健健,熊李艳,黄卫春.一种关联多本体的科技奖励检索方法[J].华东交通大学学报,2014,31(2):112-118.
2张杰,张海超,翟东升,孙武,陈蕾.基于领域本体的专利信息检索研究[J].情报科学,2014,32(10):9-14. 被引量：1
3刘毅,王宇,杨德礼.本体进化驱动的个性化语义搜索研究[J].情报学报,2015,34(10):1048-1055. 被引量：3
4张书波,张引,张斌,孙达明.平衡流行性和相似性的混合式查询扩展方法[J].小型微型计算机系统,2016,37(11):2385-2390.
5唐亮,赵晓峰,席耀一,易绵竹.融合局部共现和上下文相似度的查询扩展方法[J].山东大学学报（理学版）,2017,52(1):29-36. 被引量：2
6巩皓,杜军平,赖金财,梁美玉,王巍,罗盎.基于本体和局部查询反馈的微博查询扩展算法[J].南京大学学报（自然科学版）,2017,53(6):1004-1011. 被引量：1
7高学正,齐钒宇,贾丽琼,孔昭煜.地质资料目录现状与发展趋势研究:以全国地质资料馆为例[J].中国矿业,2019,28(6):55-59. 被引量：2
8李广建,陈瑜,张庆芝.新中国70年现代图书情报技术研究与实践[J].图书馆杂志,2019,38(11):4-20. 被引量：10
9张汝昊.基于语义和位置相似的作者共被引分析方法及效果实证[J].图书情报工作,2020,64(8):111-124. 被引量：7
10熊回香,赵登鹏,卢晨凡.基于词向量模型的中文序列比对研究[J].图书情报工作,2020,64(10):86-98. 被引量：7

1贾媛媛.自然语言处理中的语义消歧研究[J].淮南师范学院学报,2013,15(5):108-110. 被引量：2
2刘莉,谈文蓉.统计学习方法在语义消歧中的应用研究[J].西南民族大学学报（自然科学版）,2007,33(1):193-196.
3何佳,赵海燕,陈庆奎,席丽娜,曹健.基于WordNet的通用服务分类方法[J].计算机工程与科学,2013,35(9):157-161.
4许琦.一种基于知网的文档语义模型构建方法[J].中国科技资源导刊,2010,42(4):55-60.
5刘运通,孙华.基于动态规划的简单语义单元词义消歧[J].计算机工程与设计,2014,35(4):1480-1485. 被引量：1
6赵彦锋,周晓红.领域本体的语义相似度算法研究[J].软件导刊,2015,14(12):49-52. 被引量：2
7易军凯,冯佳明,万静.深度词汇网络学习的文本聚类研究[J].北京化工大学学报（自然科学版）,2015,42(2):107-112.
8王义,王小林.基于改进的义原关联度算法的词语相关度计算[J].情报学报,2012,31(12):1271-1275. 被引量：7
9林仙茂,黄沛杰,杨德,吴秀鹏,黄强.中文手机导购对话系统中的语义信息提取[J].现代计算机,2014,20(3):52-55. 被引量：1
10王永生,柴佩琪,卫蔚.德汉机器翻译中的语义消歧策略[J].中文信息学报,1998,12(2):54-62. 被引量：3

计算机应用研究

2011年第5期

浏览历史

内容加载中请稍等...

基于本体知识库的自动语义标注被引量：9

参考文献8

二级参考文献54

共引文献176

同被引文献120

引证文献9

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于本体知识库的自动语义标注 被引量：9

参考文献8

二级参考文献54

共引文献176

同被引文献120

引证文献9

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于本体知识库的自动语义标注被引量：9