基于N层向量空间模型的信息检索算法被引量：17

AN INFORMATION-RETRIEVAL METHOD BASED ON N-LEVEL VECTOR MODEL

下载PDF

导出

摘要 N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义了特征值向量和相似度的计算方法 ,使之能比较好地适应文档集合的动态扩充 .理论分析和实验结果表明。 A new information-retrieval algorithm based on the N-level vector model is proposed. The N-level vector model partitions a document into N level text paragraphs. The text feature vectors and the text weight vectors are defined according to the text paragraphs' context. The calculation method of the feature vectors and the similarity are defined much more precisely such that the algorithm can adapt the dynamitic extension of the document set. The theoretic analysis and the experimental results show that the new algorithm has higher precision and faster computation speed.

作者陈治平林亚平童调生

机构地区湖南大学计算机科学系

出处《计算机研究与发展》 EI CSCD 北大核心 2002年第10期1233-1237,共5页 Journal of Computer Research and Development

基金湖南省自然科学基金资助 ( 0 1 JJY1 0 0 7)

关键词 N层向量空间模型信息检索算法搜索引擎查准率查全率信息资源 WWW search engine, vector space model, precision, recall

分类号 G354.4 [文化科学—情报学] TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘芳,卢正鼎.有效地检索HTML文档[J].小型微型计算机系统,2000,21(9):986-988. 被引量：23
2战学刚,林鸿飞,姚天顺.Infolite中文检索系统[J].小型微型计算机系统,2000,21(9):989-992. 被引量：9

二级参考文献5

1上海交大远程教育中心，HTML 语言参考 .WWW书籍，1998年
2吴立德，大规模中文文本处理，1997年
3姚天顺，自然语言理解，1995年
4Salton G，Commun ACM，1975年，18卷，11期，613页
5Salton G，J Documentation，1973年，29卷，4期，351页

共引文献29

1钟敏娟,林亚平,陈治平.基于超链接和标记文本的信息检索算法[J].小型微型计算机系统,2004,25(7):1344-1347. 被引量：7
2刘志为,何丕廉,孙越恒,郑小慎.N层向量空间模型在Web信息检索中的应用[J].微型机与应用,2004,23(12):60-62. 被引量：5
3郑庆华,胡云华,张素娟.自然语言网络答疑系统的研究与实现[J].小型微型计算机系统,2005,26(3):554-560. 被引量：10
4胡健,陆一鸣,马范援.基于HTML文档结构的向量空间模型的改进[J].情报学报,2005,24(4):433-437. 被引量：10
5胡敏,杨红,戴玉刚.基于XML的向量空间模型在数字图书馆检索中的应用研究[J].福建电脑,2005,21(11):1-1.
6王卫东,宋丹,宋人杰.基于分解的向量空间模型的Web新闻信息检索[J].山东大学学报（理学版）,2006,41(3):37-40. 被引量：1
7付克志,林鸿飞.基于N-Level VSM在Web信息检索中的研究[J].计算机工程与应用,2006,42(19):158-160. 被引量：3
8刘斌,陈桦.向量空间模型信息检索技术讨论[J].情报杂志,2006,25(7):92-93. 被引量：21
9钟敏娟,凌传繁,白耀辉,郭攀.CDSE:一个面向领域的智能搜索引擎[J].计算机工程,2006,32(24):206-208.
10赵正文,康耀红.Web信息检索结构化排序函数与标引词加权技术[J].计算机工程与应用,2007,43(11):181-184. 被引量：1

同被引文献107

1李桂林,陈晓云.关于聚类分析中相似度的讨论[J].计算机工程与应用,2004,40(31):64-65. 被引量：26
2胡建强,邹鹏,王怀民,周斌.Web服务描述语言QWSDL和服务匹配模型研究[J].计算机学报,2005,28(4):505-513. 被引量：108
3董慧,余传明.中文本体的自动获取与评估算法分析[J].情报理论与实践,2005,28(4):415-418. 被引量：12
4李庆华,赵彦斌,赵峰,彭进劲.基于向量空间模型的并行信息检索算法[J].小型微型计算机系统,2005,26(9):1560-1562. 被引量：8
5罗选民,董娜,黎土旺.语料库与翻译研究——兼评Maeve Olohan的《翻译研究语料库入门》[J].外语与外语教学,2005(12):52-56. 被引量：29
6贺玲,吴玲达,蔡益朝,谢毓湘,雷震.多媒体数据挖掘中数据间的相似性度量研究[J].国防科技大学学报,2006,28(1):77-80. 被引量：5
7杜小勇,马文峰.领域本体工程[J].中国传媒科技,2006(4):26-28. 被引量：1
8杨建武,陈晓鸥.基于核矩阵学习的XML文档相似度量方法[J].软件学报,2006,17(5):991-1000. 被引量：10
9张兵,卢焕章.多传感器自动目标识别中的冲突证据组合方法[J].系统工程与电子技术,2006,28(6):857-860. 被引量：21
10焦玉英,宋晓晴.基于VSM的文档信息检索改进[J].情报理论与实践,2007,30(1):97-99. 被引量：5

引证文献17

1钟敏娟,林亚平,陈治平.基于超链接和标记文本的信息检索算法[J].小型微型计算机系统,2004,25(7):1344-1347. 被引量：7
2杨创新,彭宏,莫卓斌.基于N层向量空间模型的Web主题检索算法[J].广东自动化与信息工程,2004,25(3):7-9.
3曹红,袁津生.林业主题搜索引擎研究[J].计算机应用,2004,24(B12):321-323. 被引量：8
4董慧,余传明.中文本体的自动获取与评估算法分析[J].情报理论与实践,2005,28(4):415-418. 被引量：12
5丁月华,文贵华,郭炜强.基于核向量空间模型的专利分类[J].华南理工大学学报（自然科学版）,2005,33(8):58-61. 被引量：12
6张冉,卡米力.毛依丁.基于XML和N层VSM的Web信息检索[J].计算机技术与发展,2006,16(5):56-58. 被引量：4
7钟敏娟,凌传繁,白耀辉,郭攀.CDSE:一个面向领域的智能搜索引擎[J].计算机工程,2006,32(24):206-208.
8初建崇,刘培玉,王卫玲.Web文档中词语权重计算方法的改进[J].计算机工程与应用,2007,43(19):192-194. 被引量：14
9吴早亮,孟莉,徐凌宇,李严,黄文涛.一种具有属性集成/融合能力的搜索策略[J].计算机应用研究,2008,25(1):87-89.
10谷萌萌,高茂庭.搜索引擎研究与发展[J].计算机与数字工程,2008,36(7):74-77. 被引量：2

二级引证文献76

1王知津,赵洪.基于改进遗传算法的XML信息检索研究[J].图书馆杂志,2007,26(11):20-26. 被引量：2
2唐涛.基于文本挖掘的领域本体学习模型研究[J].图书情报工作,2010,54(S2):348-352. 被引量：3
3李长虹,李堂秋.一种改进的特征选择方法在文本分类系统中的应用[J].学术问题研究,2005,0(1):94-98.
4李长虹,李堂秋.一种改进的特征选择方法在文本分类系统中的应用[J].厦门大学学报（自然科学版）,2005,44(B06):239-242. 被引量：3
5伯琼,胡飞,钟国祥.基于DC元数据的Web网络搜索引擎系统设计[J].情报学报,2011,30(2):138-145. 被引量：1
6陈晓云,李荣陆,胡运发.基于最小词频阈值的文档特征选择[J].模式识别与人工智能,2006,19(4):531-537. 被引量：7
7杜光芹,张化祥.基于超链接结构和向量空间模型的网页排序算法研究[J].信息技术与信息化,2006(4):106-108.
8焦玉英,宋晓晴.基于VSM的文档信息检索改进[J].情报理论与实践,2007,30(1):97-99. 被引量：5
9李小斌.基于多用户表决的本体自适应演化[J].福建电脑,2007,23(2):13-13.
10宋海涛,孙延明,郑时雄.基于语义的产品分类刻面自动抽取[J].商场现代化,2007(03S):15-16.

1付克志,林鸿飞.基于N-Level VSM在Web信息检索中的研究[J].计算机工程与应用,2006,42(19):158-160. 被引量：3
2刘志为,何丕廉,孙越恒,郑小慎.N层向量空间模型在Web信息检索中的应用[J].微型机与应用,2004,23(12):60-62. 被引量：5
3张冉,卡米力.毛依丁.基于XML和N层VSM的Web信息检索[J].计算机技术与发展,2006,16(5):56-58. 被引量：4
4程诚,陈笑蓉,曾林肖.基于本体的GIS语料库信息检索[J].毕节学院学报（综合版）,2008,26(4):87-91.
5宋峻峰,李国辉.信息检索算法评价指标的分析与改进[J].小型微型计算机系统,2003,24(10):1800-1803. 被引量：6
6岳文,陈治平,林亚平.基于查询扩展和分类的信息检索算法[J].系统仿真学报,2006,18(7):1926-1929. 被引量：10
7张亮,邹福泰,张文举,马范援.基于社区的对等网络信息检索[J].上海交通大学学报,2006,40(5):767-770. 被引量：4
8呼凯凯,徐宗昌,刘凯,郭建,金飞.基于N层向量空间模型的装备IETM数据查询[J].装甲兵工程学院学报,2015,29(1):86-89. 被引量：1
9陶锐.信息检索中P2P技术的应用研究[J].电子技术与软件工程,2014(6):20-20. 被引量：2
10仲华,崔志明.基于XML的信息抽取和多层向量空间技术研究[J].计算机技术与发展,2007,17(7):49-52. 被引量：4

计算机研究与发展

2002年第10期

浏览历史

内容加载中请稍等...

基于N层向量空间模型的信息检索算法被引量：17

参考文献2

二级参考文献5

共引文献29

同被引文献107

引证文献17

二级引证文献76

相关作者

相关机构

相关主题

浏览历史

基于N层向量空间模型的信息检索算法 被引量：17

参考文献2

二级参考文献5

共引文献29

同被引文献107

引证文献17

二级引证文献76

相关作者

相关机构

相关主题

浏览历史

基于N层向量空间模型的信息检索算法被引量：17