期刊文献+

界模型信息检索及其参数优化

Bound model of information retrieval and its parameter optimization
在线阅读 下载PDF
导出
摘要 信息检索中,如何较好地理解和表达用户的信息需求是提高信息检索效果的关键。从语言的内涵和外延出发,挖掘、计算信息需求的上边界、下边界,确定信息需求的需求域,建立了一种表达用户信息需求的界模型。引入文档与信息需求域的相似度,在信息检索时计算各文档的相似度,并根据相似度对文档进行排序。使用Lemur工具进行的对比分析实验表明,界模型具有较理想的检索效果。进一步对相似度中的参数进行了优化,得到了更优的检索效果。 For information retrieval system, how to understand accurately and express user’s information need is the key to improve information retrieval results. This paper analyzes natural language’s connotation and denotation, calculates the upper bound, lower bound of information need, determines the information need domain and introduces an expression of user information need called Bound model. In information retrieval, similarity between document and the information need domain is defined and calculated, and documents are sorted according to the similarity. Experiments done using Lemur tools show that the Bound model has good retrieval results. This paper optimizes parameter of the similarity in Bound model further and gets better retrieval results.
作者 王彪 高光来
出处 《计算机工程与应用》 CSCD 2012年第1期153-156,161,共5页 Computer Engineering and Applications
基金 国家自然科学基金(No.60865003)
关键词 信息需求域 内涵 外延 界模型 信息检索 参数优化 information need domain connotation denotation Bound model information retrieval parameter optimization
  • 相关文献

参考文献12

二级参考文献59

  • 1B.斯卡里契卡,王士燮.哥本哈根的结构主义和布拉格学派[J].当代语言学,1962(Z1):20-24. 被引量:3
  • 2黄昌宁,李涓子.词义排歧的一种语言模型[J].语言文字应用,2000(3):85-90. 被引量:16
  • 3刘晓志,黄厚宽,尚文倩.带专业词库的特征选择[J].北京交通大学学报,2006,30(2):97-100. 被引量:4
  • 4黄维金,顾益军,赵勋平.基于自然语言理解的Web敏感信息监控[J].中国人民公安大学学报(自然科学版),2006,12(1):80-83. 被引量:3
  • 5鲁松 白硕.词距离的计算方法.自然语言理解与机器翻译[M].北京:清华大学出版社,2001,7..
  • 6俞士汶 胡俊峰.唐宋诗之词汇自动分析及应用.台北中央研究院第三届汉学会议[M].,..
  • 7Salton G. Automatic text processing: the Trans-formation, analysis, and retrieval of information by computer[M]. Boston: Addition_Wesley, 1989.
  • 8Joachims T. Making large--scale SVM learning practical[A]//B Schokopf, C Burges, A Smola, eds. Advanced in Kernel Methods Support Vector Learning. Cambridge: MIT Press, 1999.
  • 9Lian W, Cheung D W. An efficient and scalable algorithm for clustering XML documents by structure [J]. IEEE Trans on Knowledge and Data Engineering, 2004, 16(1): 82.
  • 10Bollacker K, Lawrence S, Giles C. Discovering relevant scientific literature on the Web[J]. IEEE Intelligent Systems, 2000, 15(2): 42.

共引文献137

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部