期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
中文网页分类研究综述
在线阅读
下载PDF
职称材料
导出
摘要
介绍了中文网页分类的概念和过程,分析比较了中文网页分类的主要方法和关键技术,简述了实验数据集和实验方法,并讨论了网页分类研究存在的问题和未来的研究方向.
作者
郭淼霞
机构地区
泉州师范学院数计学院
出处
《赤峰学院学报(自然科学版)》
2011年第12期51-53,共3页
Journal of Chifeng University(Natural Science Edition)
关键词
互联网
分类
中文网页
评估指标
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
142
参考文献
24
共引文献
131
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
24
1
王小冷,王斌.
一种抗噪音的中文网页分类方法[J]
.中文信息学报,2007,21(4):48-54.
被引量:1
2
吴军,王作英,禹锋,王侠.
汉语语料的自动分类[J]
.中文信息学报,1995,9(4):25-32.
被引量:24
3
黄萱菁,吴立德.
基于向量空间模型的文档分类系统[J]
.模式识别与人工智能,1998,11(2):147-153.
被引量:24
4
邹涛,王继成,黄源,张福炎.
中文文档自动分类系统的设计与实现[J]
.中文信息学报,1999,13(3):26-32.
被引量:45
5
http://www.cwirf.org/.
6
谷峰,刘晨曦,吴扬扬.
基于序列数据挖掘的中文网页特征选择方法[J]
.山东大学学报(理学版),2006,41(3):97-100.
被引量:2
7
刘晨曦,吴扬扬.
一种基于块分析的网页去噪音方法[J]
.广西师范大学学报(自然科学版),2007,25(2):149-152.
被引量:8
8
Lin Shian-Hua ,Ho Jan-Ming.Discovering Informative Content Blocks from Web Documents[A].Proceedings of theeighth ACM SIGKDD International Conference on Knowled geDiscovery & Data Mining[C].NewYork,US-A: [s.n.] ,2002.588-593.
9
任玉,樊勇,郑家恒.
基于分块的网页主题文本抽取[J]
.广西师范大学学报(自然科学版),2009,27(1):141-144.
被引量:5
10
Yang Y, Slattery S, Ghani R. A study of approaches to hypertext categorization. Journal of Intelligent Infor- mation Systems,2002,18(2-3):219-241.
二级参考文献
142
1
封化民,刘飚,刘艳敏,方勇,宋国森.
含有位置坐标树的Web页面分析和内容提取框架[J]
.清华大学学报(自然科学版),2005,45(S1):1767-1771.
被引量:8
2
欧健文,董守斌,蔡斌.
模板化网页主题信息的提取方法[J]
.清华大学学报(自然科学版),2005,45(S1):1743-1747.
被引量:71
3
荆涛,左万利.
基于可视布局信息的网页噪音去除算法[J]
.华南理工大学学报(自然科学版),2004,32(Z1):84-87.
4
张志刚,陈静,李晓明.
一种HTML网页净化方法[J]
.情报学报,2004,23(4):387-393.
被引量:57
5
常育红,姜哲,朱小燕.
基于标记树表示方法的页面结构分析[J]
.计算机工程与应用,2004,40(16):129-132.
被引量:24
6
于满泉,陈铁睿,许洪波.
基于分块的网页信息解析器的研究与设计[J]
.计算机应用,2005,25(4):974-976.
被引量:55
7
吴军,王作英,禹锋,王侠.
汉语语料的自动分类[J]
.中文信息学报,1995,9(4):25-32.
被引量:24
8
许云,樊孝忠,张锋.
一种不需分词的中文文本分类方法[J]
.北京理工大学学报,2005,25(9):778-781.
被引量:5
9
陈琼,苏文健.
基于网页结构树的Web信息抽取方法[J]
.计算机工程,2005,31(20):54-55.
被引量:24
10
毛伟,徐蔚然,郭军.
基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统[J]
.中文信息学报,2006,20(3):29-35.
被引量:17
共引文献
131
1
吴光远,何丕廉,曹桂宏,聂颂.
基于向量空间模型的词共现研究及其在文本分类中的应用[J]
.计算机应用,2003,23(Z1):138-140.
2
徐慧,窦子辉,杨林,陈雪.
面向终端用户的网页过滤模板动态生成技术研究[J]
.计算机科学,2012,39(S2):90-93.
被引量:2
3
成奋华,吴家强.
数字图书馆中基于向量空间模型的文档分类系统[J]
.情报杂志,2004,23(7):9-11.
4
刘峰,王秀坤,杨南海,马霖.
中英文专业搜索引擎中数据采集加工的设计与实现[J]
.计算机应用研究,2004,21(10):155-157.
被引量:5
5
郑小慎,何丕廉,陈治纲,任大同,吴克敏.
基于凝聚点的文本动态聚类分析[J]
.微型机与应用,2004,23(8):58-60.
6
王冠,裘正定.
结合中文网页自动分类系统的AIP平台[J]
.微机发展,2005,15(3):136-138.
7
江志雄,丁岳伟.
基于K-近邻方法的网络信息文本分类[J]
.上海理工大学学报,2005,27(1):83-86.
被引量:2
8
丁尚友.
中小学图书馆(室)的业务管理[J]
.齐齐哈尔大学学报(哲学社会科学版),2005(3):138-138.
9
丁文斌,李斌,罗浩.
基于改进贝叶斯的垃圾邮件过滤系统设计与实现[J]
.计算机工程与应用,2005,41(18):127-130.
被引量:14
10
李兴鹏,武伟.
基于内容和地址的电子邮件过滤系统的研究及实现[J]
.上海应用技术学院学报(自然科学版),2005,5(1):35-37.
1
李勇.
中文网页分类研究综述[J]
.现代计算机,2012,18(15):3-7.
被引量:1
2
王振武,孙佳骏,于忠义,卜异亚.
基于支持向量机的遥感图像分类研究综述[J]
.计算机科学,2016,43(9):11-17.
被引量:56
3
陈湘涛,高亚静.
不平衡数据分类研究综述[J]
.邵阳学院学报(自然科学版),2017,14(2):1-11.
被引量:4
4
李元菊.
数据不平衡分类研究综述[J]
.现代计算机,2016,22(3):30-33.
被引量:6
5
王洪伟,郑丽娟,尹裴,史伟.
在线评论的情感极性分类研究综述[J]
.情报科学,2012,30(8):1263-1271.
被引量:19
6
薛春香,张玉芳.
面向新闻领域的中文文本分类研究综述[J]
.图书情报工作,2013,57(14):134-139.
被引量:26
赤峰学院学报(自然科学版)
2011年 第12期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部