摘要
该文介绍了Web文本挖掘的概念和一般处理过程,着重就Web文本挖掘中前期的分词、特征表示和特征提取的常用方法进行研究,同时对不同方法进行了初步比较。
Firstly,this paper introduces the definition and algorithms of Web text mining technology in a summing-up way. Then, several methods on Chinese automatic segmentation,document feature and feature extraction are analyzed, discussed and contrasted.
出处
《电脑知识与技术》
2006年第5期67-68,共2页
Computer Knowledge and Technology
关键词
特征提取
WEB挖掘
文本挖掘
分词
feature extraction
web mining
text mining
word segmentation