界模型信息检索及其参数优化

Bound model of information retrieval and its parameter optimization

下载PDF

导出

摘要信息检索中,如何较好地理解和表达用户的信息需求是提高信息检索效果的关键。从语言的内涵和外延出发,挖掘、计算信息需求的上边界、下边界,确定信息需求的需求域,建立了一种表达用户信息需求的界模型。引入文档与信息需求域的相似度,在信息检索时计算各文档的相似度,并根据相似度对文档进行排序。使用Lemur工具进行的对比分析实验表明,界模型具有较理想的检索效果。进一步对相似度中的参数进行了优化,得到了更优的检索效果。 For information retrieval system, how to understand accurately and express user’s information need is the key to improve information retrieval results. This paper analyzes natural language’s connotation and denotation, calculates the upper bound, lower bound of information need, determines the information need domain and introduces an expression of user information need called Bound model. In information retrieval, similarity between document and the information need domain is defined and calculated, and documents are sorted according to the similarity. Experiments done using Lemur tools show that the Bound model has good retrieval results. This paper optimizes parameter of the similarity in Bound model further and gets better retrieval results.

作者王彪高光来

机构地区内蒙古大学计算机学院内蒙古财经学院计算机信息管理学院

出处《计算机工程与应用》 CSCD 2012年第1期153-156,161,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.60865003)

关键词信息需求域内涵外延界模型信息检索参数优化 information need domain connotation denotation Bound model information retrieval parameter optimization

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1王德福.论叶尔姆斯列夫语符学的四个理论模型[J].锦州师范学院学报（哲学社会科学版）,2003,25(5):55-59. 被引量：10
2赵元任,李芸,王强军,赵世开.语言的意义及其获取[J].语言文字应用,2001(4):59-69. 被引量：13
3马晖男,吴江宁,潘东华.一种基于同义词词典的模糊查询扩展方法[J].大连理工大学学报,2007,47(3):439-443. 被引量：18
4张敏,宋睿华,马少平.基于语义关系查询扩展的文档重构方法[J].计算机学报,2004,27(10):1395-1401. 被引量：55
5Xu J, Croft W B.Query expansion using local and global document analysis[C]//Proceedings of the Nineteenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1996:4-11.
6刘耕,方勇,刘嘉勇.基于关联词和扩展规则的敏感词库设计[J].四川大学学报（自然科学版）,2009,46(3):667-671. 被引量：14
7胡俊峰,俞士汶.唐宋诗中词汇语义相似度的统计分析及应用[J].中文信息学报,2002,16(4):39-44. 被引量：43
8Rocchio J J.Relevance feedback in information retrieval[M]// The SMART Retrieval System: Experiments in Automatic Document Processing.Upper Saddle River,NJ,USA:Prentice-Hall,Inc, 1971:313-323.
9Salton G,Buekley C.Improving retrieval performance by retrieval feedbaek[J].Journal of the American Society for Information Science, 1990,41 (4): 288-297.
10Harman D.Relevance feedback revisited[C]//Proceedings of the 15th Annual International SIGIR Conference, 1992 : 1-10.

二级参考文献59

1B.斯卡里契卡,王士燮.哥本哈根的结构主义和布拉格学派[J].当代语言学,1962(Z1):20-24. 被引量：3
2黄昌宁,李涓子.词义排歧的一种语言模型[J].语言文字应用,2000(3):85-90. 被引量：16
3刘晓志,黄厚宽,尚文倩.带专业词库的特征选择[J].北京交通大学学报,2006,30(2):97-100. 被引量：4
4黄维金,顾益军,赵勋平.基于自然语言理解的Web敏感信息监控[J].中国人民公安大学学报（自然科学版）,2006,12(1):80-83. 被引量：3
5鲁松白硕.词距离的计算方法.自然语言理解与机器翻译[M].北京:清华大学出版社,2001,7..
6俞士汶胡俊峰.唐宋诗之词汇自动分析及应用.台北中央研究院第三届汉学会议[M].,..
7Salton G. Automatic text processing: the Trans-formation, analysis, and retrieval of information by computer[M]. Boston: Addition_Wesley, 1989.
8Joachims T. Making large--scale SVM learning practical[A]//B Schokopf, C Burges, A Smola, eds. Advanced in Kernel Methods Support Vector Learning. Cambridge: MIT Press, 1999.
9Lian W, Cheung D W. An efficient and scalable algorithm for clustering XML documents by structure [J]. IEEE Trans on Knowledge and Data Engineering, 2004, 16(1): 82.
10Bollacker K, Lawrence S, Giles C. Discovering relevant scientific literature on the Web[J]. IEEE Intelligent Systems, 2000, 15(2): 42.

共引文献137

1甄沐华,陈鹏,王坤,范子杨,王者.基于关键词挖掘的热线文本数据犯罪线索筛查方法研究[J].知识管理论坛,2022(5):539-548. 被引量：2
2夏松,林荣蓉,刘勘.网络谣言敏感词库的构建研究——以新浪微博谣言为例[J].知识管理论坛,2019(5):267-275. 被引量：6
3姜永琢.论命名的语言学机制[J].广西大学学报（哲学社会科学版）,2008,30(z1):245-248. 被引量：2
4叶晶.自然语言处理在“立德树人”研究中的运用[J].佳木斯教育学院学报,2013(12):49-50.
5魏锦虹.低龄儿童词义理解的策略[J].修辞学习,2005(2):74-76. 被引量：6
6王瑞琴,孔繁胜.基于无导词义消歧的语义查询扩展[J].情报学报,2011,30(2):131-137. 被引量：4
7王美艳,赵伟.基于唐诗语料库“词”的提取及深入研究[J].长春工业大学学报,2005,26(3):217-220. 被引量：2
8章志凌,虞立群,陈奕秋,罗海飞,邵晓敏.基于Corpus库的词语相似度计算方法[J].计算机应用,2006,26(3):638-640. 被引量：17
9荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48. 被引量：41
10刘柏嵩,高济,李飞.知识管理中基于本体的扩展检索方法[J].计算机辅助设计与图形学学报,2006,18(4):556-562. 被引量：5

1乔亚男,齐勇,侯迪.文本信息检索实验方法研究[J].中国科技论文在线,2009,4(2):126-129. 被引量：1
2王彪,高光来.基于界模型的真相关反馈信息检索[J].东南大学学报（自然科学版）,2010,40(A02):301-306. 被引量：1
3周道奇.维修宇宙飞船的机器蟹[J].知识就是力量,2006(7):5-5.
4王修力,马利平.文本信息检索的代数模型综述[J].吉林大学学报（信息科学版）,2007,25(3):299-299. 被引量：3
5李德斌.汉语语言情感表达手段研究[J].中国校外教育,2014(4):26-26. 被引量：1
6沈金安,李春.翻译的理解与表达[J].科技咨询导报,2007(2):209-209.
7王修力,马利平.文本信息检索的代数模型综述[J].吉林大学学报（信息科学版）,2007,25(5):569-576. 被引量：1
8王秀红.学术论文复制检测的研究进展及新方法[J].图书情报工作,2009,53(5):111-114. 被引量：1
9张志昌,张宇,高立琦,袁新成,胡晓光,刘挺,李生.2005年863信息检索评测哈尔滨工业大学信息检索研究室技术报告[J].中文信息学报,2006,20(B03):83-90.
10刘春亚.如何利用多媒体提高后进生英语听说能力[J].中国教育技术装备,2011(28):133-133. 被引量：1

计算机工程与应用

2012年第1期

浏览历史

内容加载中请稍等...

界模型信息检索及其参数优化

参考文献12

二级参考文献59

共引文献137

相关作者

相关机构

相关主题

浏览历史