摘要
N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义了特征值向量和相似度的计算方法 ,使之能比较好地适应文档集合的动态扩充 .理论分析和实验结果表明 。
A new information-retrieval algorithm based on the N-level vector model is proposed. The N-level vector model partitions a document into N level text paragraphs. The text feature vectors and the text weight vectors are defined according to the text paragraphs' context. The calculation method of the feature vectors and the similarity are defined much more precisely such that the algorithm can adapt the dynamitic extension of the document set. The theoretic analysis and the experimental results show that the new algorithm has higher precision and faster computation speed.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第10期1233-1237,共5页
Journal of Computer Research and Development
基金
湖南省自然科学基金资助 ( 0 1 JJY1 0 0 7)