期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一个基于字特征的文本分类模型 被引量:2
1
作者 王梦云 王素格 《计算机工程与应用》 CSCD 北大核心 2004年第13期64-65,191,共3页
提出了一种基于字特征的中文文本分类方法。该方法的出发点是变常用的基于表层的匹配为基于概念的匹配,用汉字特征向量作为文本的表示方法。算法根据文本中汉字的特征建立文本表示矩阵和类别表示矩阵,并通过线性最小二乘算法形成分类矩阵。
关键词 文本分类 分类矩阵 特征向量
在线阅读 下载PDF
基于VSM的中文文本分类系统的设计与实现 被引量:16
2
作者 张东礼 汪东升 郑纬民 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第9期1288-1291,共4页
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标... 文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。 展开更多
关键词 文字信息处理 中文文本分类系统 系统设计 VSM 向量空间模型 机器学习 特征提取
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部