期刊文献+

文本的图表示初探 被引量:17

Towards Graph-based Text Representation
在线阅读 下载PDF
导出
摘要 文本表示是文本信息处理中的基础问题 ,以向量空间模型 (VSM)为代表的多数文本表示模型没有考虑文本中特征项之间的序关系 ,这样的表示造成文本语义信息的损失。我们尝试在文本表示中引入序关系 ,用图结构来表示文本 ,提出了一种新的文本表示模型—图表示模型 ,并对该模型的表示效果进行了验证。实验结果表明目前我们的表示模型仍达不到VSM模型所取得的表示效果。本文总结了文本表示过程 ,提出了一种新颖的用于度量文本表示模型表示能力的方法 ,同时也提出了一系列与文本图表示相关的值得探讨的问题。 Text representation is the basis of text processing. Most text representation model didn’t consider the order of the terms in the text,which results in the losing of text semantics. We tried to introduce order in the text, using graphic structure to represent text. In this paper, we proposed a novel text representation model named Graph Space Model (GSM) and introduced a novel way to measure the representation ability of a text representation model. We compared the ability of the Vector Space Model [2] and our GSM. Our model didn’t excel the VSM now, but there are much more problems need to be investigated in the text representation to take back the losing semantics.
出处 《中文信息学报》 CSCD 北大核心 2005年第2期36-43,共8页 Journal of Chinese Information Processing
基金 国家重点基础研究资助项目 (973) (2 0 0 4CB31810 9)
关键词 计算机应用 中文信息处理 文本表示 VSM模型 图表示 computer application Chinese information processing text representation VSM model graph based representation
  • 相关文献

参考文献7

  • 1刘悦.[D].中科院计算所,2003.
  • 2Baeza-Yates, R. and Ribeiro-Neto, B.,. Modern Information Retrieval [ M], 1st ed. Addison-Wesley-Longman, Reading, MA, 1999.
  • 3Gerard Salton, A. Wong, C. S Yang, A Vector Space Model for Automatic Indexing [ A], Communications of the ACM,1975,18(11).
  • 4J.M. Kleinberg. Authoritative sources in a hyperlinked environment [ A], In Proc. of the Ninth Annual ACM-SIAM Symposium on Discrete Algorithms, pages 668- 677, San Francisco, California, 1998.
  • 5José Maria Gómez Hidalgo,Text Representation For AutoMatic Text Categoruation[A], 10th Conference of the European Chapter of the Association for Computational Linguistics(EACL03), 2003.
  • 6Lewis, D. D., An Evaluation of Phrasal and Clustered Representations on A Text Categorization Task[ A], Proceedings of the Fifteenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C], 1992,37 - 50.
  • 7Salton G, E. A. Fox and H. Wu. Extended boolean information retrieval [ A ], Communications of the ACM, 1983,26(11): 1022 - 1036.

同被引文献224

引证文献17

二级引证文献66

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部