基于聚类的VSM模糊标引模式下文本检索问题研究
被引量:1
摘要
本文针对向量空间模型文本检索存在的几个问题进行了研究和探讨。在文本聚类模式下提出了特征项选取的改进方法;对TF-IDF因子提出了位置参数加权模式;对特征项标引问题引进模糊方式;对数据稀疏等问题总结了解决的方法。
出处
《工程地质计算机应用》
2007年第1期7-12,共6页
Engineering Geology Computer Application
参考文献7
-
1王知津,郑红军.基于集合理论的信息检索模型[J].情报科学,2004,22(11):1288-1291. 被引量:6
-
2曾玉.信息检索的模糊聚类分析模型[J].情报学报,2004,23(4):433-436. 被引量:15
-
3钟敏娟,林亚平,陈治平.基于分类和关键词组抽取的信息检索算法[J].系统仿真学报,2004,16(5):1009-1012. 被引量:11
-
4王知津,蒋伟伟.十五年来我国网络信息检索研究述评[J].情报科学,2004,22(4):385-389. 被引量:13
-
5李郎达.模糊理论在信息检索上的应用[J].情报科学,2004,22(3):343-345. 被引量:6
-
6夏立新,陈光祚.再论网络信息检索的失误[J].情报科学,2004,22(1):96-99. 被引量:5
-
7卜东波,白硕,李国杰.文本聚类中权重计算的对偶性策略[J].软件学报,2002,13(11):2083-2089. 被引量:20
二级参考文献50
-
1王玫.现代情报检索理论特性述略[J].图书与情报,1995(4):7-9. 被引量:3
-
2孙思,张玉峰.基于模糊逻辑推理的信息检索方法[J].图书情报知识,1996,13(1):41-44. 被引量:2
-
3赵建宏 周惠文 陈稼兴.模糊语意法在中文全文检索中之应用[A]..第六届国际信息管理学术研讨会论文集[C].,.227~228.
-
4黄建元.模糊集及其应用.宁夏人民出版社,1999年11月
-
5沈固朝.信息检索(多媒体)教程.高等教育出版社,2002年1月
-
6N. J. Belkin et al. ASK for Information Retrieval : Part Ⅰ,Background and Theory. Journal of Documentation,1982 (2).
-
7N. J. Belkin et al. ASK for Information Retrieval: Part Ⅱ Results of a Design Study. Journal of Documentation,1982 (3).
-
8S M Chen,Y J Horng, C H. IEE Document retrieval using fuzzy- valued concept networks. IEEE Trans System, Man, Cybernetics, Part B, vol. 31, pp. 111-118, Feb. 2001.
-
9Miyamoto S. Information Retrieval Based on Fuzzy Association. Fuzzy Sets and System, 1990, 38 (2):191-205.
-
10..http: //www. las. ac. cn/lis/bqgl/0105/bqg13. html. Sep25,2001.
共引文献61
-
1蒋宗礼,李宪雷,徐学可.基于主题Hub值的元搜索[J].北京工业大学学报,2009,35(3):397-402. 被引量:1
-
2刘海峰,王元元,张学仁.基于VSM的模糊标引文本检索若干问题研究[J].图书情报工作,2006,50(S2):127-130.
-
3王映,常毅,谭建龙,白硕.基于N元汉字串模型的文本表示和实时分类的研究与实现[J].计算机工程与应用,2005,41(5):88-91. 被引量:5
-
4赵明臻.网络信息检索障碍及排除策略探论[J].图书与情报,2005(1):42-45. 被引量:7
-
5李金波.从核心期刊文献统计看近十年我国的网络信息检索研究[J].图书馆杂志,2005,24(6):23-25. 被引量:1
-
6马国俊,贠卫国.基于潜在语义索引的中文文本聚类的研究[J].现代电子技术,2005,28(10):58-59. 被引量:4
-
7夏咏梅.基于文本挖掘的分类与聚类技术[J].情报探索,2005(3):65-67. 被引量:10
-
8林华兵,傅清祥.基于文本相似度的关键词分类算法[J].福建电脑,2005,21(8):46-47. 被引量:1
-
9侯丽敏,朱一,周舫,葛强.基于网络的智能答疑系统的研究[J].微机发展,2005,15(8):120-123. 被引量:3
-
10卢晓亮,佘诗武.对网络环境下多媒体信息检索的研究[J].情报杂志,2005,24(9):111-112. 被引量:3
同被引文献14
-
1寇莎莎,魏振军.自动文本分类中权值公式的改进[J].计算机工程与设计,2005,26(6):1616-1618. 被引量:25
-
2岳文,陈治平,林亚平.基于查询扩展和分类的信息检索算法[J].系统仿真学报,2006,18(7):1926-1929. 被引量:10
-
3Oyama S, Kodubo T, Ishida T. Domain - specific Web Search with Keyword Spices[ J]. IEEE Transactions on Knowledge and Data En- gineering,2004,16 ( 1 ) : 17 - 27.
-
4Dunja MLadenic. Feature Subset Selection in Text - learning [ J ]. Machine Learning: ECML- 98. Lecture Notes in Computer Science, 1998:95 - 100.
-
5Gerard Salto. Term - weighting Approaches in Automatic Text Re- trieval[ J ]. Information Processing & Management , 1988,24 (5) : 513 -523.
-
6Salton, Fox, Wu. Extended Boolen Information Retrieval [ J ]. Com- munication of ACM, 1983 (26) : 1022 - 1036.
-
7J R Quinlan. Introdution Decision Trees [J]. Machine Learning: 1986,1,(1) :81 -106.
-
8刘挺,秦兵,张宇.信息系统导论[M].北京:机械工业出版社,2008.50-58.
-
9Mitchell T M, Machine Learning[ M]. New York: McGraw -Hill, 1997.
-
10李霞,张绍林,张淼,刘华.基于新距离测度的区间数排序[J].西华大学学报(自然科学版),2008,27(1):87-90. 被引量:17
二级引证文献4
-
1王殿华,苏毅清.食品安全市场监管效果的检验及分析[J].软科学,2013,27(3):65-69. 被引量:24
-
2王中亮,石薇.信息不对称视角下的食品安全风险信息交流机制研究——基于参与主体之间的博弈分析[J].上海经济研究,2014,26(5):66-74. 被引量:16
-
3李强,周培.基于演绎法理念的农产品质量安全保障体系研究[J].软科学,2014,28(8):80-83. 被引量:1
-
4杨金龙,曾梦玲,刘千里.2000年以来我国信息检索模型研究综述[J].图书情报导刊,2019,4(4):72-79. 被引量:2
-
1刘海峰,王元元,张学仁.基于VSM的模糊标引文本检索若干问题研究[J].图书情报工作,2006,50(S2):127-130.
-
2王芬芬,陈华华.动态场景下的基于SIFT和CBWH的目标跟踪[J].杭州电子科技大学学报(自然科学版),2015,35(4):46-49.
-
3刘海峰,赵华,刘守生.一种基于位置的改进中文文本特征选择[J].图书情报工作,2009,53(21):102-105. 被引量:3
-
4金春霞,周海岩.位置加权文本聚类算法[J].计算机工程与科学,2011,33(6):154-158. 被引量:6
-
5郑波,楼旭阳,崔宝同.基于位置加权粒子群算法的WSNs能量优化[J].江南大学学报(自然科学版),2014,13(5):568-571. 被引量:3
-
6刘海峰,王元元,张学仁,姚泽清.文本分类中基于位置和类别信息的一种特征降维方法[J].计算机应用研究,2008,25(8):2292-2294. 被引量:9
-
7黄应清,梁新彬,谢志宏,文军.基于特征显著值归一化与位置加权的FT算法[J].兵器装备工程学报,2016,37(6):124-128. 被引量:4
-
8唐西西.一种新的混合遗传聚类算法[J].广西工学院学报,2006,17(3):77-81. 被引量:2
-
9谢剑斌,刘通,文特,闫玮.基于多特征和加权模式相似性测度的车牌字符识别方法[J].计算机工程与科学,2008,30(8):36-38. 被引量:1
-
10黄旭,朱艳琴,罗喜召.实时文本分类系统的研究与实现[J].计算机工程,2008,34(18):87-88. 被引量:5