基于规则的汉语自动分词系统被引量：43

A Rule-Based Chinese Automatic Segmenting System

下载PDF

导出

摘要本文通过对汉语自动分词难点的分析,讨论了词频和词结合力的关系,提出了一套机械切分与语义校正的汉语自动分词方法。系统包括建立绝对切分标志符表,变长度最大匹配法、2-3-1优先规则集、固有歧义切分和组合歧义切分校正方法等。最后列举了描述语义校正规则的实例。系统作为CETRAN.A的一部分,在SUN3-280工作站上实现。 By means of analysis to the difficulty of the Chinese Automatic segmenting words, this paper discussed the relation between the word frequency and combinational ability. Put forward a set of the Chinese automatic segmenting method, machine segmenting and semantic correction.The system has been set up the list of absolute segmenting marks; changable length maximum matching method;2-3-1 priority rule set; intrinsic ambiguous correction and combinational ambiguous correction, etc.Some examples used the rules are given. This system is a part of CETRAN.A and programmed in C language at SUN 3-280 workstation.

作者姚天顺张桂平吴映明

机构地区东北工学院

出处《中文信息学报》 CSCD 1990年第1期37-43,共7页 Journal of Chinese Information Processing

关键词汉语自动分词切分语义校正

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1张潮生，中文信息处理国际会议论文集，1987年
2梁南元，中文信息，1986年，1期
3姚天顺，计算机的汉字信息处理，1985年
4管纪文，中文信息处理国际研讨论文集，1983年

同被引文献274

1程宁,李斌,葛四嘉,郝星月,冯敏萱.基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究[J].中文信息学报,2020(4):1-9. 被引量：28
2颜维龙,盖杰,武港山,袁春风.面向网络的全文检索中索引文件的组织[J].计算机应用研究,2002,19(11):124-126. 被引量：12
3梁晓弘,杨文安.分词技术在信息处理中的研究综述[J].电脑知识与技术（过刊）,2007(22):1100-1102. 被引量：1
4孙茂松.谈谈汉语分词语料库的一致性问题[J].语言文字应用,1999(2):90-93. 被引量：20
5黄昌宁.中文信息处理中的分词问题[J].语言文字应用,1997(1):74-80. 被引量：85
6孙茂松,张磊.人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略[J].语言文字应用,1997(1):81-88. 被引量：7
7黄居仁,陈克健,陈凤仪,魏文真,张丽丽.《资讯处理用中文分词规范》设计理念及规范内容[J].语言文字应用,1997(1):94-102. 被引量：7
8刘开瑛.现代汉语自动分词评测技术研究[J].语言文字应用,1997(1):103-108. 被引量：15
9董振东.汉语分词研究漫谈[J].语言文字应用,1997(1):109-114. 被引量：11
10侯敏,孙建军.汉语自动分词中的歧义问题[J].语言文字应用,1996(1):68-72. 被引量：8

引证文献43

1苏芳仲,林世平.Web文本挖掘中的一种中文分词算法研究及其实现[J].福州大学学报（自然科学版）,2004,32(z1):67-71. 被引量：5
2刘怀亮,张治国,马志辉,孙蕾.基于SVM与KNN的中文文本分类比较实证研究[J].情报理论与实践,2008,31(6):941-944. 被引量：10
3付艳梅.智能答疑系统的中文分词[J].湖北工业大学学报,2009,24(1):65-67. 被引量：4
4孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：102
5李淑文.试论文本自动分类[J].现代计算机,2004,10(7):38-41. 被引量：2
6亢临生,张永奎.利用分词属性解决歧义切分[J].电脑开发与应用,1994,7(4):2-5. 被引量：4
7亢临生,张永奎.基于标记的分词算法[J].山西大学学报（自然科学版）,1994,17(3):283-286. 被引量：4
8张江.基于规则的分词方法[J].计算机与现代化,2005(4):18-20. 被引量：15
9王秀坤,李政,简幼良,刘剑.基于Hash方法的机器翻译词典的组织与构造[J].大连理工大学学报,1996,36(3):352-355. 被引量：12
10黄萱菁,吴立德,王文欣,叶丹瑾.基于机器学习的无需人工编制词典的切词系统[J].模式识别与人工智能,1996,9(4):297-303. 被引量：24

二级引证文献451

1赵薇.数字时代人文学研究的变革与超越——数字人文在中国[J].探索与争鸣,2021(6):191-206. 被引量：41
2李斌,袁义国,芦靖雅,冯敏萱,许超,曲维光,王东波.第一届古代汉语分词和词性标注国际评测[J].中文信息学报,2023,37(3):46-53. 被引量：8
3吴欢,应俊,王逸飞,胡华宇,徐洪丽,郑一琼.乳腺癌病理文本的结构化信息提取[J].解放军医学院学报,2020,41(7):746-751. 被引量：11
4孙宝刚,肖灵.计算机与数据库技术在舰船建造过程的节本与工时分析应用[J].舰船科学技术,2019,0(20):217-219. 被引量：2
5苏祺,胡韧奋,诸雨辰,严承希,王军.古籍数字化关键技术评述[J].数字人文研究,2021,1(3):83-88. 被引量：18
6段小斌,林雯,阮百尧,陈基漓.一种基于三级索引词库结构的中文分词方法研究[J].计算机与数字工程,2007,35(7):47-49. 被引量：5
7张泉,曾国荪,王伟,孙明军,谷华楠.基于改进的模糊C-均值聚类的信任文摘[J].计算机研究与发展,2008,45(z1):268-273. 被引量：2
8付艳梅.智能答疑系统的中文分词[J].湖北工业大学学报,2009,24(1):65-67. 被引量：4
9谢新吾.黄跃佳:北大失业生的三次跳跃[J].职业圈,2005(11):30-31.
10郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.

1尹锋.基于神经网络的汉语自动分词系统的设计与分析[J].情报学报,1998,17(1):41-50. 被引量：30
2袁琳琳,陈红平.汉语自动分词系统的设计与实现[J].信息与电脑（理论版）,2014,0(7):166-168.
3王彩荣,李晓毅,黄玉基.汉语自动分词系统的评价[J].微处理机,2003,24(5):28-30. 被引量：1
4王彩荣,王凯丽,黄玉基.歧义字段的归类及切分算法[J].微处理机,2005,26(3):33-35. 被引量：2
5马东坡.汉语自动分词系统设计[J].黑龙江科技信息,2004(10):39-39.
6李生琦,田巧燕,汤承.基于《（知网〉》词汇语义相关度计算的消歧方法[J].情报学报,2009,28(5):706-711. 被引量：13
7宗中.中文信息检索中词典机制分词算法的研究[J].计算机技术与发展,2014,24(4):118-121. 被引量：6
8龚汉明,周长胜.汉语分词技术综述[J].北京机械工业学院学报,2004,19(3):52-55. 被引量：26
9郭俊凤,岳金萍,王开铸.基于C程序实现汉语自动分词系统[J].信息与电脑（理论版）,2012(9):119-120.
10张占英,王中立.中文文本中公司名简称的识别[J].许昌学院学报,2003,22(2):99-101. 被引量：4

中文信息学报

1990年第1期

浏览历史

内容加载中请稍等...

基于规则的汉语自动分词系统被引量：43

参考文献4

同被引文献274

引证文献43

二级引证文献451

相关作者

相关机构

相关主题

浏览历史

基于规则的汉语自动分词系统 被引量：43

参考文献4

同被引文献274

引证文献43

二级引证文献451

相关作者

相关机构

相关主题

浏览历史

基于规则的汉语自动分词系统被引量：43