LSI和kNN相结合的文本分类模型研究被引量：3

Text classification based on integrating LSI with k-nearnest neighbor

下载PDF

导出

摘要针对传统文本分类系统的不足 ,提出了一种基于隐含语义索引的kNN的文本分类模型 .该方法既充分利用了向量空间模型在表示方法上的巨大优势 ,又弥补了其忽略语义的不足 ,具备一定的理论和现实意义 . Because of the deficiency of traditional classification system,the text classification based on integrating k -nearest neighbor with latent semantic indexing was proposed. It took the advantage of abundant expression in Vector Space Model (VSM) and made up the shortage of less semantic information in VSM. The new scheme has significance both in theory and practice.

作者王天江叶卫国卢正鼎李永平

机构地区华中科技大学计算机科学与技术学院国家药品监督管理局

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2004年第4期59-60,86,共3页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金国家高性能计算基金资助项目 (0 0 30 3)

关键词文本分类 k最邻参照法隐含语义索引奇异值分解 text classification k-nearnest neighbor latent semantic indexing singular value decomposition

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1Berry M W, Dumais S T, O'Brien G W. Using linear algebra for intelligent information retrieval. SIAM Review, 1995, 37(4): 573-595.
2Dumais S T, Fumas G W, Landauer T K, et al. Using latent semantic analysis to improve information retrieval. In: ACM. Proceedings of CHI'88: Conference on Human Factors in Computing. New York: ACM, 1988. 281-285.
3Dumais S. Improving the retrieval of information from external sources. Behavior Research Methods, Instruments and Computers, 1991, 23(2) : 229-236.
4Yeung D S, Wang Xizhao. Improving performance of similarity-based clustering by feature weight learning. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(4): 556-561.
5Zhang X, Berry M W, Raghavan P. Search schemes for information filtering and retrieval. Information Processing and Management, 2001, 37(2): 313-334.

同被引文献32

1宋枫溪,高林.文本分类器性能评估指标[J].计算机工程,2004,30(13):107-109. 被引量：33
2SHIYong-feng ZHAOYan-ping.Comparison of Text Categorization Algorithms[J].Wuhan University Journal of Natural Sciences,2004,9(5):798-804. 被引量：4
3张剑,李春平.基于WordNet概念向量空间模型的文本分类[J].计算机工程与应用,2006,42(4):174-178. 被引量：16
4黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版社,1998..
5Rawat S,Pujari A K,Gulati V P.On the use of singular value decomposition for a fast Intrusion detection system.Views on Designing Complex Architectures,2004.
6Liao Yi-hua,Vemuri V R.Using text categorization techniques for intrusion detection[C]//Proceedings of the 11th USENIX Security Symposium,2002-08:51-59.
7Liao Yi-hua,Vemuri V R.Use of K-nearest neighbor classifier for intrusion detection[J].Computers & Security,2002,21(5):439-448.
8http://www.ll.mit.edu/IST/ideval/data/data_index.html.
9Denning D E.An intrusion-detection model[C]//Proceedings of the 1986 IEEE Symposium on Security and Privacy.IEEE Computer Society Press,1990:118-133.
10Ghosh A K,Schwartzbard A,Shatz A M.Learning program behavior profiles for intrusion detection[C]//Proceedings of 1st USENIX Workshop on Intrusion Detection and Network Monitoring,1999.

引证文献3

1杨清,李方敏.基于潜在语义模型的SVM入侵检测研究[J].计算机工程与应用,2007,43(5):143-145.
2张运良,张全.基于句类向量空间模型的自动文本分类研究[J].计算机工程,2007,33(22):45-47. 被引量：6
3张世博,刘博爱,柳朝阳,张宝全.基于潜在语义分析的文档检索设计方法[J].北京石油化工学院学报,2015,23(2):37-42. 被引量：4

二级引证文献10

1张璐,王景中.基于改进贝叶斯算法的文本广告邮件过滤[J].网络安全技术与应用,2009(1):55-57. 被引量：1
2何维,王宇.基于句子的文本表示及中文文本分类研究[J].情报学报,2009,28(6):839-843. 被引量：3
3刘勘,刘萍.基于VSM的专家领域分析及可视化研究[J].图书情报工作,2011,55(10):74-77. 被引量：1
4郭金龙,许鑫,陆宇杰.人文社会科学研究中文本挖掘技术应用进展[J].图书情报工作,2012,56(8):10-17. 被引量：26
5李海蓉.基于语义模板的文档自动分类模型研究[J].情报科学,2012,30(6):852-857. 被引量：2
6彭俊杰,陈丹敏.基于改进BoS的Web文本分类研究[J].南京邮电大学学报（自然科学版）,2013,33(1):79-83. 被引量：1
7张宁,朱礼军.中文问答系统问句分析研究综述[J].情报工程,2016,2(1):32-42. 被引量：14
8凌晔华,庞抗,张晓洁,郑鑫.基于Hubble.Net的加密文档检索系统[J].智能计算机与应用,2017,7(3):79-81.
9王勇.Web网络环境下的语义检索平台设计与分析[J].现代电子技术,2016,39(16):14-18. 被引量：3
10蔡利忠,蔡晓晨.DBN在中文文本分类中的应用[J].计算机工程与设计,2018,39(9):2974-2978. 被引量：2

1张玉连,张敏,张波.一种扩展的向量空间模型-隐含语义索引模型研究[J].燕山大学学报,2006,30(1):87-90.
2吴长城,淳光文,杨佐德.利用Visual Basic实现减速机的选择与校验[J].机械工程师,2014(8):162-163.
3高学锁,张新.Pro/E组件建模的一种实用方法[J].科技创新与应用,2016,6(6):144-145. 被引量：2
4王栋,吴军华.基于LSI和词典的文本语义相似度算法[J].煤炭技术,2010,29(12):217-218. 被引量：1
5魏保子,王儒敬.隐含语义索引在农业技术问答系统中的应用[J].微电子学与计算机,2008,25(7):48-51. 被引量：1
6朱学昊,王儒敬.隐含语义索引技术在供求信息分类中的应用[J].计算机工程与应用,2007,43(14):192-194.
7梁栋,杨杰,卢进军,常宇畴.基于非负矩阵分解的隐含语义图像检索[J].上海交通大学学报,2006,40(5):787-790. 被引量：7
8王星,王兆青,李蒙龙.基于参照法的人体测量的误差分析[J].工业控制计算机,2012,25(8):108-109. 被引量：2
9徐建锁,王正欧.基于LSI和自组织神经网络的高效文本聚类方法[J].天津大学学报（自然科学与工程技术版）,2004,37(11):1026-1030. 被引量：7
10曹华梁,朱星,俞勇.适用于P2P的系统查询扩展优化方法[J].上海交通大学学报,2005,39(10):1706-1710. 被引量：5

华中科技大学学报（自然科学版）

2004年第4期

浏览历史

内容加载中请稍等...

LSI和kNN相结合的文本分类模型研究被引量：3

参考文献5

同被引文献32

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

LSI和kNN相结合的文本分类模型研究 被引量：3

参考文献5

同被引文献32

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

LSI和kNN相结合的文本分类模型研究被引量：3