基于加窗策略聚类算法的主题追踪系统
摘要
使用加窗策略的聚类算法设计和实现了一个新闻主题追踪系统。实验结果表明了系统的有效性。主题追踪准确率达到87.42%,系统响应时间为未采用加窗策略前的20%。该系统符合在线新闻主题追踪的实用要求。
出处
《广西轻工业》
2008年第2期61-62,共2页
Guangxi Journal of Light Industry
参考文献6
-
1Jiawei Han, Micheline Kamber著.数据挖掘概念与技术[M].机械工业出版社.2005(2)(第一版).
-
2IRLAS.哈尔滨工业大学信息检索实验室.ht tp://ir.hit.edu.cn/.
-
3代六玲,黄河燕,陈肇雄.中文文本分类中特征抽取方法的比较研究[J].中文信息学报,2004,18(1):26-32. 被引量:230
-
4万小军,杨建武.在线新闻主题检测系统的设计与应用[J].华南理工大学学报(自然科学版),2004,32(z1):42-46. 被引量:7
-
5王科,刘渊,罗万伯,高行宇,高常波.基于中文文本主题跟踪的网络信息分析[J].四川大学学报(工程科学版),2004,36(1):114-118. 被引量:5
-
6李保利,俞士汶.话题识别与跟踪研究[J].计算机工程与应用,2003,39(17):7-10. 被引量:61
二级参考文献23
-
1黄昌宁 等.对自动分词的反思[A]..语言计算与基于内容的文本处理[C].北京:清华大学出版社,2003,7.26-38.
-
2[1]National Institute of Standards and Technology. The 2002topic detection and tracking (TDT2002) task definition and evaluation plan,version 1.1 [ EB/OL]. http://www.nist. gov/speech/tests/tdt, 2002 -05 - 13.
-
3[2]Allan J,Carbonell J,Doddington G,et al. Topic detection and tracking pilot study: final report [A]. In Proceedings of DARPA Broadcast News Transcription and Understanding Workshop [C]. Virginia: Lansdowne Conference Resort Lansdowne, 1998. 194 - 218.
-
4[3]Yang Y,Pierce T,Carbonell J. A study on retrospective and on-line event detection [A]. In the Proceedings of ACM SIGIR 1998 [C]. Melbourne: Association for Computing Machinery Press, 1998.28 - 36.
-
5[4]Yang Y,Carbonell J,Brown R,et al. Learning approaches for detecting and tracking news events [J]. IEEE Intelligent Systems: Special Issue on Applications of Intelligent Information Retrieval, 1999,14 (4) :32 - 43.
-
6[5]Hatch P,Stokes N,Carthy J. Topic detection, a new application for lexical chaining? [A]. British Computer Society IRSG 2000 [C]. Cambridge:British Computer Society ,2000.94 - 103.
-
7[6]Papka R. On-line new event detection,clustering and tracking[D]. Amherst: Department of Computer Science, University of Massachusetts Amherst,1999.
-
8[7]Allan J,Papka R,Lavrenko V. On-line new event detection and tracking [A]. In the Proceedings of ACM SIGIR 1998 [C]. Melbourne:Association for Computing Machinery Press, 1998.37 - 45.
-
9[8]Dharanipragada S, Franz M, McCarley J S, et al. Story segmentation and topic detection in the broadcast news domain [A]. In Proceedings of the DARPA Broadcast News Workshop [C]. Herndon: National Institute of Standar and Technology,1999.
-
10[9]Yamron J. P,Knecht S,van Mulbregt P. Dragon′s tracking and detection systems for the TDT2000 evaluation [A]. In Proceedings of Topic Detection and Tracking Workshop [C]. U S A :National Institute of Standar and Technology ,2000.75 - 80.
共引文献299
-
1龚丽娟,王昊,张紫玄,朱立平.Word2Vec对海关报关商品文本特征降维效果分析[J].数据分析与知识发现,2020,4(2):89-100. 被引量:9
-
2骆魁永.一种面向不均衡数据集的CHI特征选择改进算法[J].商丘师范学院学报,2021,37(6):9-13.
-
3张莉.网页自动分类技术概念分析[J].娄底职业技术学院学报(职教与经济研究),2007(2):58-62.
-
4张培颖.基于Web内容和日志挖掘的个性化网页推荐系统[J].计算机系统应用,2008,17(9):9-11. 被引量:6
-
5贾志洋,高炜,王勇刚.结合信息检索技术的半监督文本分类方法[J].苏州大学学报(自然科学版),2012,28(1):34-39. 被引量:1
-
6尤晶晶.基于贝叶斯的垃圾邮件过滤优化算法[J].烟台职业学院学报,2008(2):80-83.
-
7雷亚莉.档案文献主题探测方法探讨[J].黑龙江史志,2015(7):88-89.
-
8陈涛,宋妍,谢阳群.改进的信息增益特征选择方法在文本聚类中的应用[J].现代图书情报技术,2004(12):7-9. 被引量:2
-
9王秀娟,郭军,郑康锋.文本分类中一种新的特征选择方法[J].计算机应用,2005,25(3):661-663. 被引量:15
-
10张玉叶,李连,刘海见,王春歆.文本过滤中的特征抽取应用研究[J].海军航空工程学院学报,2005,20(1):139-141. 被引量:4
-
1陈志雄.基于关联分类的中文新闻主题追踪系统[J].内江科技,2007,28(9):25-26.
-
2万小军,杨建武.在线新闻主题检测系统的设计与应用[J].华南理工大学学报(自然科学版),2004,32(z1):42-46. 被引量:7
-
3潘渊,李弼程,张先飞.LS-SVM:一种有效的新闻主题追踪方法[J].计算机应用研究,2008,25(9):2661-2663. 被引量:3
-
4莫倩,刘书家,李凯.主题追踪系统的研究与实现[J].计算机工程与应用,2006,42(2):179-181. 被引量:5
-
5在线新闻[J].在线技术,2004(11):5-6.
-
6在线新闻[J].在线技术,2004(9):5-6.
-
7在线新闻[J].在线技术,2004(10):5-6.
-
8王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量:2
-
9方开红.一种安全的在线新闻发布系统的设计与实现[J].软件工程师,2014(8):12-13. 被引量:3
-
10在线新闻[J].在线技术,2005(6):5-6.