基于VC++/MFC的中文自动分词算法及其软件的实现被引量：5

VC /MFC-based Chinese Automatic Word Segmentation of Algorithm and Software Realization

下载PDF

导出

摘要中文自动分词一直是中文信息处理、Web文档挖掘等处理文档类研究的基础技术之一,传统的中文分词技术研究,主要集中在算法的改进研究上,对实验的平台,有关软件的实现涉及很少.本文通过探讨中文自动分词的重要性和不可或缺性,给出了基于VC++/MFC自动分词软件的开发技术,最后对软件实现的四种基于词典的机械匹配的算法进行了实验分析,实验证明该系统能够高效的给中文信息处理提供一个平台. The Chinese automatic word segmentation is always one basic component in many fields of Chinese information processing, the Web documents mining and so on, one of technologies is processing documents class research. The traditional Chinese word segmentation engineering research mainly concen- trates on algorithm improvement research. For the experimental platform, the related software realization involves very few. This article has given the VC/MFC-based automatic word segmentation software development technology. Four methods, actualized by software, is based on the dictionary machinery matched by algorithm. The experiment proved that this system can effectively provide a platform for Chinese information processing.

作者王艳元昌安覃晓彭昱忠宋叶俊

机构地区广西师范学院信息技术系

出处《广西师范学院学报（自然科学版）》 2008年第3期104-108,共5页 Journal of Guangxi Teachers Education University(Natural Science Edition)

基金国家科技型中小企业技术创新基金项目(06C26224501689) 广西自然科学基金(桂科自0679018)

关键词自动分词中文信息处理挖掘基于词典的机械匹配 automatic word segmentation Chinese information processing mining dictionary - based machinery match

分类号 TP274 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
2webs-sobs..中文分词技术[EB/OL]..http://blog, csdn. net/ministonenap/archivd 2006/11/23[1409113. aspx,,(2006 - 11 - 23) , [2007 - 12 - 20]..
3欧振猛,余顺争.中文分词算法在搜索引擎应用中的研究[J].计算机工程与应用,2000,36(8):80-82. 被引量：20
4马玉春,宋瀚涛.Web中文文本分词技术研究[J].计算机应用,2004,24(4):134-135. 被引量：39
5邓宏涛.中文自动分词系统的设计模型[J].计算机与数字工程,2005,33(4):138-140. 被引量：13

二级参考文献13

1徐秉铮,詹剑,贺前华.基于神经网络的分词方法[J].中文信息学报,1993,7(2):36-44. 被引量：16
2王玮,刘丹.汉语文献自动分词存在的问题及趋向[J].情报理论与实践,1994,17(6):28-30. 被引量：6
3.中国新闻社[EB/OL].http://www.chinanews.com.cn/,2003-10-01.
4[1]姚天顺.自然语言理解导论[M].辽宁:东北大学出版社,1993.
5李国臣刘开瑛等.汉语自动分词及歧义组合结构的处理[J].中文信息学报,1988,2(3):27-33.
6冯志伟.自然语言的计算机处理[J].中文信息,1997,14(4):26-27. 被引量：18
7张树武,黄泰翼.汉语统计语言模型的N值分析[J].中文信息学报,1998,12(1):35-41. 被引量：8
8刘挺,吴岩,王开铸.最大概率分词问题及其解法[J].哈尔滨工业大学学报,1998,30(6):37-41. 被引量：16
9牛耘,朱献有.神经网络技术在汉语歧义切分中的应用[J].情报学报,1999,18(3):213-218. 被引量：5
10姚天顺,张桂平,吴映明.基于规则的汉语自动分词系统[J].中文信息学报,1990,4(1):37-43. 被引量：43

共引文献70

1刘春辉,金顺福,刘国华,李颖.基于优化最大匹配与统计结合的汉语分词方法[J].燕山大学学报,2009,33(2):124-129. 被引量：9
2徐吉,朱兰娟.用于网络搜索引擎的中文分词消岐算法[J].微型电脑应用,2011(4):52-54.
3张建平,郝矿荣,施恒斌,马利.基于生物学的智能分析统计软件的开发[J].计算机时代,2005(3):14-15.
4邱均平,文庭孝,周黎明.汉语自动分词与内容分析法研究[J].情报学报,2005,24(3):309-317. 被引量：11
5王坚,赵恒永.专业搜索引擎中文分词算法的实现与研究[J].福建电脑,2005,21(7):55-55. 被引量：3
6王坚,赵恒永.专业搜索引擎的实现与研究——中文分词算法[J].电子科学技术评论,2005(3):77-79. 被引量：4
7文庭孝.汉语自动分词研究进展[J].图书与情报,2005(5):54-63. 被引量：20
8姜韶华,党延忠.基于长度递减与串频统计的文本切分算法[J].情报学报,2006,25(1):74-79. 被引量：14
9翟凤文,赫枫龄,左万利.基于统计规则的交集型歧义处理方法[J].吉林大学学报（理学版）,2006,44(2):223-228. 被引量：9
10党延忠.基础研究学科发展的宏观知识挖掘[J].管理工程学报,2006,20(2):102-107. 被引量：3

同被引文献22

1黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：85
2孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：102
3张江.基于规则的分词方法[J].计算机与现代化,2005(4):18-20. 被引量：15
4邓宏涛.中文自动分词系统的设计模型[J].计算机与数字工程,2005,33(4):138-140. 被引量：13
5熊回香.全文检索中的汉语自动分词及其歧义处理[J].中国图书馆学报,2005,31(5):54-57. 被引量：6
6周文帅,冯速.汉语分词技术研究现状与应用展望[J].山西师范大学学报（自然科学版）,2006,20(1):25-29. 被引量：16
7翟凤文,赫枫龄,左万利.字典与统计相结合的中文分词方法[J].小型微型计算机系统,2006,27(9):1766-1771. 被引量：42
8张科.多次Hash快速分词算法[J].计算机工程与设计,2007,28(7):1716-1718. 被引量：22
9黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：251
10陈小荷.现代汉语自动分析[M].北京语言文化大学出版社,2000.97-98.

引证文献5

1赵晓凡,胡顺义.基于正向最大匹配的汉语分词[J].安阳师范学院学报,2010(5):13-15. 被引量：2
2王希杰.最大正向匹配分词算法的VC++实现[J].福建电脑,2011,27(4):72-72. 被引量：1
3王成平.彝文自动分词系统的设计与实现[J].中国西部科技,2012,11(3):44-45. 被引量：1
4王成平.计算机彝文自动分词技术的设计研究[J].湘潭大学自然科学学报,2012,34(3):107-113. 被引量：4
5杨进才,陈忠忠,谢芳,胡金柱.基于汉语拼音首字母索引的混合分词算法[J].计算机系统应用,2016,25(4):221-225. 被引量：2

二级引证文献10

1汪向征,葛彦强,栗青生,吴艳丽.甲骨文信息检索系统的设计与实现[J].煤炭技术,2012,31(4):180-182.
2陈顺强.信息处理用彝语词法分析研究[J].西南民族大学学报（自然科学版）,2013,39(4):639-642. 被引量：1
3王晓丽,邓达康,孟祥龙,唐先明,郭攀红,林畅松.基于领域本体的油气勘探开发知识获取模式及实现[J].东北石油大学学报,2016,40(4):74-79. 被引量：2
4李书豪,陈宇,吕淑宝,张猛治.基于N-gram模型的中文分词前k优算法[J].智能计算机与应用,2016,6(6):31-35. 被引量：5
5曹海,彭龑.一种基于图像内容的对应关系在语义检索中的应用[J].湘潭大学自然科学学报,2017,39(2):122-126. 被引量：1
6杨光豹,杨丰赫,郑慧锦.基于字符树结构的高性能中文词库技术[J].计算机系统应用,2019,28(8):262-267.
7马爽.中国少数民族文字网络搜索引擎关键技术研究[J].无线互联科技,2020,17(13):84-86. 被引量：1
8邹微.中国彝语文研究的回顾与展望(1992-2021)——基于CiteSpace的文献计量分析[J].民族学刊,2021,12(10):106-114. 被引量：8
9曾庆雅,王成平.基于CiteSpace彝文信息处理研究的知识图谱分析[J].中央民族大学学报（自然科学版）,2023,32(2):51-60.
10符浩军,蒋秉川,陈星宇.利用多因子融合的多尺度点状地名匹配方法[J].地理空间信息,2024,22(12):34-37.

1何炎祥,冯夏根,周水庚.演化算法在中文自动分词中的应用[J].计算机工程,2002,28(5):80-82. 被引量：7
2陈莉,焦李成.文档挖掘与降维技术[J].西北大学学报（自然科学版）,2003,33(3):267-271. 被引量：13
3蔡荣彦.面向未登录领域词切分的中文分词技术研究[J].信息系统工程,2013,26(11):133-136. 被引量：1
4郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.
5欧振猛,余顺争.中文分词算法在搜索引擎应用中的研究[J].计算机工程与应用,2000,36(8):80-82. 被引量：20
6苏勇,王燕.基于XQuery的XML文档的关联规则挖掘[J].信息技术,2011,35(5):91-94. 被引量：1
7黄名选,钟智,张师超.基于频繁项集与负规则的局部反馈查询扩展[J].计算机工程与设计,2012,33(5):1863-1866.
8郑小慎.基于频繁特征项集的文档聚类研究[J].计算机应用,2006,26(4):875-877. 被引量：1
9江耿豪.自动答疑系统中文自动分词模块设计与实现[J].现代计算机,2010,16(2):8-10. 被引量：3
10宋江春,沈钧毅,宋擒豹.一个基于关联规则的多层文档聚类算法[J].计算机应用,2005,25(7):1570-1572. 被引量：4

广西师范学院学报（自然科学版）

2008年第3期

浏览历史

内容加载中请稍等...

基于VC++/MFC的中文自动分词算法及其软件的实现被引量：5

参考文献5

二级参考文献13

共引文献70

同被引文献22

引证文献5

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于VC++/MFC的中文自动分词算法及其软件的实现 被引量：5

参考文献5

二级参考文献13

共引文献70

同被引文献22

引证文献5

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于VC++/MFC的中文自动分词算法及其软件的实现被引量：5