基于粗糙集与支持向量机的Web文本分类被引量：1

Web Text Classification Based on Rough Set and Support Vect Machine

下载PDF

导出

摘要 Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率. The Web text classification is an important research direction in Web data mining. It obtains a classified system by training knowledge data, then according to homepage text content automatic distinct homepage category by using this system This article advances a Web text classification model which synthesis rough set and support vector machine. Using the rough set＇s attribute rednction method to reduce the dimension of support vector machine＇s training data, then enhances the Web text classification＇s performance and efficiency.

作者王娟

机构地区漳州师范学院计算机科学与工程系

出处《漳州师范学院学报（自然科学版）》 2009年第3期37-42,共6页 Journal of ZhangZhou Teachers College（Natural Science)

关键词粗糙集支持向量机 WEB文本分类 Rough Set Support Vector Machine Web text classification

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1Chute C G. An example based mapping method for text categorization and retrieval[J]. ACM Transactions on Information System, 1994, 12(3): 252-277.
2Pawlak Z.Rough Sets[J].International Journal of Computer anti Information Science, 1982,11(5): 341-356.
3鲁松,李晓黎,白硕,王实.文档中词语权重计算方法的改进[J].中文信息学报,2000,14(6):8-13. 被引量：120
4安金龙,王正欧,马振平.一种新的支持向量机多类分类方法[J].信息与控制,2004,33(3):262-267. 被引量：46

二级参考文献10

1Yang Yiming，ProceedingsoftheSeventeenthInternationalACMSIGIRConferenceonResearchandDevelopme，1994年，12页
2Bottou L, Cortes C, Denker J. Comparison of classifier methods:a case study in handwriting digit recognition [ A]. Preceedings of the 12th IAPR International Conference on Pattern Recognition [ C ]. Jerusalem: IEEE, 1994.77 ～ 82.
3Platt J C, Cristianini N, Shawe-Taylor J. Large margin DAGs for multiclass classification [ A ]. Advances in Neural Information Processing Systems [C]. 2000.547 -553.
4Vapnik V. Statistical Learning Theory [ M]. New York:Wiley,1998.
5Crammer K , Singer Y. On the lesrnability and design of output codes for multiclass problems [A]. Proceedings of the Thirteenth Annual Conference on Computational Learning Theory [ C ]. SanFransisco:Morgan Kanfmann, 2000.35 ～46.
6Hsu C W, Lin C J. A comparison of methods for multiclass support vector machines. hines [ J ]. IEEE Transactions on Neural Networks, 2002,13(2) :415 -425.
7边肇祺张学工等.模式识别[M].北京：清华大学出版社,2001..
8Kreβel U. Pairwise classification and support vector machines [ A]. Advances in Kernel Methods - Support Vector Learning [C]. Cambridge, MA:MIT Press,1999.255 -268.
9张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2313
10刘江华,程君实,陈佳品.支持向量机训练算法综述[J].信息与控制,2002,31(1):45-50. 被引量：98

共引文献164

1冯世杰,戴小鹏,王艳平.基于NIR-SVM对鸭梨褐变病果的识别[J].农业网络信息,2008(3):133-135. 被引量：6
2周延泉,张传福,张瑞华,李蕾,何华灿.移动个性化信息服务中的用户兴趣模型[J].北京邮电大学学报,2006,29(z2):144-147. 被引量：1
3许增福,梁静国,田晓宇.基于FVSM和自组织映射网络的Web文本自动分类方法[J].哈尔滨工业大学学报,2004,36(9):1168-1172. 被引量：2
4胡卓颖,徐可,万中英,陆玉昌,丁树良.专题型网页搜集系统的设计与实现[J].计算机与现代化,2004(10):1-5.
5王大亮,孙建涛,陆玉昌,夏克俭.一种面向自动文本摘要特征评价的新方法[J].计算机工程与应用,2004,40(33):176-178.
6徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：57
7吴卫华,袁宁,周劲,王洪军.基于文本集密度的特征词选择与权重计算方法[J].计算机与数字工程,2005,33(3):11-13. 被引量：4
8王术,付关友,朱征宇.面向个性化服务的网页特征描述[J].计算机工程与设计,2005,26(3):651-653. 被引量：3
9朱征宇,裴仰军,陈华月,付关友.个性化服务中用户近期兴趣视图的生成[J].计算机工程与设计,2005,26(4):951-954. 被引量：5
10谭金波,李艺,杨晓江.文本自动分类的测评研究进展[J].现代图书情报技术,2005(5):46-49. 被引量：13

同被引文献9

1牛强,王志晓,陈岱.基于SVM的中文网页分类方法的研究[J].计算机工程与应用,2007,28(8):1893-1895.
2Li XZ, Kong JM. Application of GA - SVM method with pa-rameter optimization for landslide development prediction [ J ] Natural Hazards and Earth System Sciences, 2014, (14) 525 - 533.
3Liu J J, Li Z, Hu FR, et al. A THz spectroscopy nondestruc- tive identification method for transgenic cotton seed based on GA-SVM [J] . Optical and Quantum Electronics, 2015, 47 (2): 313-322.
4Scholopf B, Platt JC, Shawetaylor J, et al. Estimating the support of a high - dimensional distribution [ J ] . Neural Computation, 2001, 13 (7) : 1443 - 1472.
5Vapnik VN. The nature of statistical learning theory [ M ] New York: Wiley, 1998.
6胡静,蒋外文,朱华.Web文本挖掘中数据预处理技术研究[J].现代计算机,2009,15(3):48-51. 被引量：13
7奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3):123-124. 被引量：289
8都衡,潘宏侠.基于信息熵和GA-SVM的自动机故障诊断[J].机械设计与研究,2013,29(5):127-130. 被引量：18
9冯是聪,张志刚,李晓明.一种中文网页自动分类方法的实现及应用[J].计算机工程,2004,30(5):19-20. 被引量：15

引证文献1

1方艺辉.基于遗传支持向量机算法的文本分类[J].福建商业高等专科学校学报,2016(4):90-94.

1李睿,王彤,李明.一种基于粗糙集的视频分类方法[J].微计算机信息,2006,22(08X):49-51. 被引量：3
2周丽芳,李伟生,吴渝.基于模糊粗糙集属性约简的人脸识别技术[J].计算机应用,2006,26(S2):125-127. 被引量：2
3万琼,商琳,李宁,谢振华,陈兆乾.基于粗糙集属性约减和神经网络集成的人脸识别技术[J].计算机应用研究,2005,22(6):238-239. 被引量：2
4杨传健,葛浩,汪志圣.基于粗糙集的属性约简方法研究综述[J].计算机应用研究,2012,29(1):16-20. 被引量：58
5齐耀龙.基于模糊粗糙集的数据库安全评价[J].合作经济与科技,2013(12):126-127.
6邹木春.粗糙集理论在视频特征提取与视频分类中的应用[J].今日科苑,2008(24):79-80.
7周何骏,王汝传,任勋益.入侵数据特征约简方法综述[J].信息安全与通信保密,2007,29(8):130-132.
8朱丹丹,廖祖华,张刘月,胡爽,吴树忠.基于粗糙集的房屋销售评价方法[J].模糊系统与数学,2016,30(1):165-173. 被引量：1
9张志飞,苗夺谦,岳晓冬,聂建云.强语义模糊性词语的情感分析[J].中文信息学报,2015,29(2):68-78. 被引量：8

漳州师范学院学报（自然科学版）

2009年第3期

浏览历史

内容加载中请稍等...

基于粗糙集与支持向量机的Web文本分类被引量：1

参考文献4

二级参考文献10

共引文献164

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于粗糙集与支持向量机的Web文本分类 被引量：1

参考文献4

二级参考文献10

共引文献164

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于粗糙集与支持向量机的Web文本分类被引量：1