期刊文献+

一种利用注疏的《左传》分词新方法 被引量:21

A Method of Segmentation on "Zuo Zhuan" by Using Commentaries
在线阅读 下载PDF
导出
摘要 先秦文献的注疏文献中包含有大量词汇语义知识,是先秦文献自动分词的重要依据。该文以篇幅最大的先秦文献《左传》为研究对象,在对《左传》及其注疏文献进行自动对齐的基础上,提出了一种利用注疏的《左传》分词新方法。分词实验的F值达到89.0%,较之baseline有明显提升。该方法无需训练语料,利用注疏文献辅助分词的思想也适合推广到其他先秦文献的自动分词任务中去。 Commentaries of Pre-Qin documents contains a large lexical semantic knowledge which provide substantial evidences for segmentation.This paper uses "Zuo Zhuan" as the research object and proposes a new segmentation method based on commentaries aligned to "Zuo Zhuan".Segmentation F-score reaches 89.0%,much higher than the baseline in the experiments.This method needs no training,and the idea of commentaries assisted segmentation is can be applied to the segmentation of other pre-Qin documents.
出处 《中文信息学报》 CSCD 北大核心 2012年第2期13-17,45,共6页 Journal of Chinese Information Processing
基金 国家"211工程"三期重点学科建设项目"语言科技创新及工作平台建设"子课题"先秦文献词汇统计与知识检索系统" 江苏高校哲学社会科学重点研究基地重大项目"先秦文献词汇知识挖掘"(2010JDXM023)
关键词 先秦文献 注疏文献 自动对齐 自动分词 Pre-Qin documents commentaries documents automatic alignment automatic segmentation
  • 相关文献

参考文献5

二级参考文献31

共引文献122

同被引文献317

引证文献21

二级引证文献187

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部