期刊文献+

基于.NET的中文分词系统设计与实现 被引量:7

Chinese Word Segmentation System Design and Implementation Based on. NET
在线阅读 下载PDF
导出
摘要 针对中文分词的相关理论,讨论了中文分词的难点、语料库和中文分词算法,然后在.NET下设计了一个中文分词系统。在长词优先的原则下通过SQL Server 2005自建了一个语料库。在Visual Studio 2005下,采用改进的正向减字最大匹配分词算法,使用ASP.NET和C#语言实现了这个系统。结果表明该分词系统达到了较好的分词效果。 This article discussed Chinese word segmentation theory and corpus,then designed a Chinese word segmentation systems based on.NET.And SQL Server 2005 helped to build a corpus in principle of long-term priority.In Visual Studio 2005,word segmentation was implemented under improved forward maximum matching word method by using ASP.NET and C#language.Experiments show that the system can have a good segmentation results.
出处 《微计算机信息》 2010年第12期215-216,214,共3页 Control & Automation
关键词 中文分词 .NET 语料库 最大匹配算法 Chinese word segmentation .NET maximum matching word method
  • 相关文献

参考文献5

二级参考文献16

共引文献59

同被引文献36

  • 1张锋,许云,侯艳,樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究,2005,22(5):72-73. 被引量:36
  • 2张成昱.数字化文献的知识解构研究[J].中国图书馆学报,2005,31(3):32-36. 被引量:5
  • 3陈蔚丽.数字化文献与相关技术的发展[J].现代情报,2006,26(8):106-107. 被引量:1
  • 4谢红薇,王栋.基于Web文本挖掘中的一种中文分词算法研究[J].电脑开发与应用,2007,20(7):6-8. 被引量:2
  • 5张华平.计算所汉语词法分析系统ICTCLAS[EB/OL].2002-08-16.http://www.nip.org.ca/project/project.php?proj-id=6.
  • 6Gertz, Janet. Selection for Preservation in the Digital Age[J]. Library Resources and Technical Services, 2000, 44(2):97-104.
  • 7De Stefano, Paula. Selection for Digital Conversion in Academic Libraries [J], College & Research Libraries,62(1):58-69,2001.
  • 8Terry Eastwood. Appraising digital records for long-term preservation [J].Data Science Journal, 2004,3(4):202-208.
  • 9Alvin F. Martin, Mark A. Przybocki. NIST 2003 language recognition evaluation [C], in Proceedings of Eurospeech, 2003,1341 - 1344.
  • 10"The 2003 NIST language recognition evaluation plan," http:// www.nist.gov/speech/tests/lang/index.htm, 2003.

引证文献7

二级引证文献47

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部