期刊文献+

基于改进隐马尔可夫模型的文本分类研究 被引量:3

Research on Improved HMM-Based Text Categorization
在线阅读 下载PDF
导出
摘要 将一种改进的隐马尔可夫模型(HMM)应用于文本分类中,在考虑其前向依赖的同时,需考虑状态的后向依赖性.将当前观测值和和当前状态对其后一状态的依赖性加入模型的学习,这样的改进模型能有效提高文本信息抽取准确率.在文本分类过程研究中,首先对训练样本进行文本预处理,对HMM分类器模型进行参数学习,建立HMM分类器后用测试集进行测试并做出性能评价.在性能评价中用改进的评测指标,可针对不同数据集做出准确评价,以及可对比不同分类工作在同一数据集上的性能,大大提高评价质量. The application of the improved Hidden Markov Models to text categorization should take the backward dependency as well as forward dependency on states into account.The accuracy of information extraction could be improved by applying the dependency of the current observation value and state on the backward ones into the learning of models.This paper is to preprocess the training samples in text categorization process,to learn the parameters of HMM classifier,establishing one and evaluating its performance through testing set.The improved evaluation criteria could give a fair evaluation of different dataset,make a comparison of different classifiers on the performance of the same dataset and feed back the classifier to improve.
出处 《微电子学与计算机》 CSCD 北大核心 2012年第11期161-165,共5页 Microelectronics & Computer
基金 国家自然科学基金项目(61170201)
关键词 隐马尔可夫模型 文本分类 期望交叉熵(ECE) χ2统计 TF-IDF方法 hidden markov models text categorization excepted cross entropy(ECE) χ2statistic TF-IDF method
  • 相关文献

参考文献11

二级参考文献54

共引文献137

同被引文献34

  • 1杨频,李涛,赵奎.一种网络舆情的定量分析方法[J].计算机应用研究,2009,26(3):1066-1068. 被引量:19
  • 2林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量:49
  • 3周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量:115
  • 4董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量:99
  • 5Marcinczuk M, Piasecki M. Study on named entity recognition for polish based on hidden Markov models [ C ]//Proceedings of Text, Speech and Dialogue-13th International Conference ( TSD 2010 ) ,2010 : 142 - 149.
  • 6Martens D,Baesens B,et al. Decompositional rule extraction from sup- port vector machines by active learning[ J]. Knowledge and Data Engi- neering,2008,21 (2) :178 - 191.
  • 7Tracy J,Ramsey J. Emotions[M].North Carolina:The Guilford Press,2001.21-25.
  • 8中国互联网信息中心.第二十五次中国互联网发展状况统计报告[R]中国互联网统计报告,20101-10.
  • 9Picard R W. Affective Compution[M].London:MIT Press,1997.12-17.
  • 10王良志.人工情感[M]{H}北京:机械工业出版社,200939-49.

引证文献3

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部