期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于频繁关键字共现的诗词风格分类模型研究 被引量:4
1
作者 吴春龙 周昌乐 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第1期41-44,共4页
为了提高宋词文档分类的精确性,本文在广泛采用的向量空间模型(Vector space model,VSM)的基础上,对分类算法中使用的特征项做了相应的修改,提出了频繁关键字共现的概念.在实验过程中,首先提取了宋词语料库中的关键字,再利用发现关联规... 为了提高宋词文档分类的精确性,本文在广泛采用的向量空间模型(Vector space model,VSM)的基础上,对分类算法中使用的特征项做了相应的修改,提出了频繁关键字共现的概念.在实验过程中,首先提取了宋词语料库中的关键字,再利用发现关联规则的Apriori算法发现分类时所需要的频繁关键字共现,最后结合关键字和频繁关键字共现,利用最邻近算法(KNN)对宋词文档进行风格分类.实验结果发现,结合了频繁关键字共现的VSM可以提高对宋词风格分类的准确度.可见,频繁关键字共现确实提供了风格分类中所需的更多信息. 展开更多
关键词 文本分类 向量空间模型 fkc-vsm 最邻近算法 APRIORI算法 频繁关键字共现
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部