期刊文献+

Web挖掘系统的设计与实现 被引量:5

Design and Implementation of a Web Mining Tool
在线阅读 下载PDF
导出
摘要 介绍了挖掘理论,包括挖掘定义、挖掘任务、挖掘分类个方面,并简单介绍了实现文本挖掘系统WebWebWebWeb3WebWTMiner (的几个关键技术:分词,特征提取,分类器的设计。在分词中采用了支持首字和二分查找从而提高了分词速度,分类器Web Text Miner)Hash的设计中考虑到的训练算法速度慢的缺点,用近邻法以减少训练样本集中样本的数量,从而大大提高了算法速度。 Firstly, the paper introduces the theory of Web mining, including the definition, the task and the categorization of Web mining. Secondly, it also introduces several pivotal technologies in WTMiner (Web Text Miner), including word segmentation, term extraction and categorization method. In word segmentation, it uses two-way searching and hashing operation by means of the first Chinese character in a string to accelerate its speed.Considering the slow training speed to SVM (support vector machine), it uses K-nearest neighbor SVM to reduce the number of training set, so increase the algorithms speed greatly. ;;;
作者 陈建华 包煊
出处 《计算机工程》 CAS CSCD 北大核心 2002年第8期141-142,151,共3页 Computer Engineering
关键词 WEB 设计 文本分类 支持向量机 数据挖掘系统 数据库 计算机网络 信息检索 Web miningText categorizationSupport vector machine (SVM)Word segmentation.
  • 相关文献

参考文献5

二级参考文献9

共引文献419

同被引文献28

引证文献5

二级引证文献196

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部