期刊文献+

基于搭配对的汉语形容词-名词聚类 被引量:11

Clustering Of Chinese Adjectives Nouns Based on Compositional Pairs
在线阅读 下载PDF
导出
摘要 本文提出了一个双向分级聚类的算法同时对不同词性的词进行聚类。在聚类过程中 ,不同词性的词的聚类交替进行 ,相互影响。我们以最小描述长度的原理为基础构造了目标函数。为了减小数据稀疏的影响 ,又提出了修饰度的与修正距离的概念。将此算法应用于汉语形容词 -名词的搭配对 ,对形容词与名词进行聚类 。 This paper proposes a bidirctional hierarchical clustering algorithm of simultaneous clustering words of different categories.During clustering,the process is interactional and alternant.We construct an objective function based on Minimum Description Length (MDL).In order to solve the problem caused by sparse data two concepts of modificatory degree and modificatory distance are proposed.The further application to clustering Chinese adjectives and nouns demonstrates the algorithm is effective.
出处 《中文信息学报》 CSCD 北大核心 2000年第6期45-50,共6页 Journal of Chinese Information Processing
基金 自然科学基金!(6 97730 31) 国家重点基础研究 973项目!(G19980 30 5 0 7)
关键词 双向分级聚类 搭配对 修饰度 最小描述长度 汉语 bidirectional hierarchical clustering compositional pairs modificatory degree minimum description length
  • 相关文献

参考文献8

  • 1许伟.句法-语义一体化的汉语句法分析研究[硕士学位论文].北京:清华大学,1997..
  • 2边肇祺.模式识别[M].北京:清华大学出版社,1997..
  • 3边肇祺,模式识别,1998年
  • 4李涓子,基于组合实例的双向优化聚类 .JSCL - 97,1997年
  • 5许伟,硕士学位论文,1997年
  • 6Li Hang,Clustering Words with the MDL Principle ,cmplg/ 960 50 14,1996年
  • 7姬东鸿,汉语形容词和名词的语义组合模型,1996年
  • 8倪文杰,现代汉语辞海,1994年

共引文献2

同被引文献125

引证文献11

二级引证文献42

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部