期刊文献+

电子政务主题词表应用系统中主题标引算法研究 被引量:4

Algorithm about Subject Indexing in Applied System of E-Government Thesauri
在线阅读 下载PDF
导出
摘要 从政务文献主题标引的需求出发 ,面向《电子政务主题词表》的网络应用 ,探讨政务文献主题标引的方法和技术 ,提出了词典法和N gram提取技术相结合的实用算法。这一算法可以弥补传统的词典法由于政务文献涉及层面广泛和新词出现频繁所带来的词汇不足的问题。同时 ,讨论了利用该词表进行赋词标引的有关问题。 As one of the first e government standard project, e government thesaurus draft has been primly completed. Facing on its internet application, this paper makes a tentative discussion on the techniques and method about the requirement of government document subject indexing. This algorithm combines the techniques of dictionary based segment and the techniques of N gram based feature catching.It can solve the problem of lack of words when using traditional dictionary based segment is used in government document involved in wide fields and frequent term renewal. The method of extraction of thesaurus and
出处 《高技术通讯》 EI CAS CSCD 2003年第10期15-19,共5页 Chinese High Technology Letters
基金 86 3计划 (2 0 0 2AA1Z6 711)资助项目
关键词 电子政务 主题词表应用系统 主题标引算法 汉语 中国 政务文献 are also discussed. Key words: e government, Subject indexing, Dictionary based segment, N gram based feature catching
  • 相关文献

参考文献6

二级参考文献12

  • 1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量:24
  • 2赵伯璋 徐力.计算机中文信息处理(下册)[M].北京:宇航出版社,1987..
  • 3张琪玉.网络信息检索工具中的广告信息.网络信息检索工具发展的方向与提高竞争力的途径.巨灵研究报告GT1/RT0002[M].,2000,3..
  • 4[1]P.B. Baxendale: Machine- made for Technical Literaureuuan Experiment,IBM Journal, Oct. 1958, 354- 361
  • 5[3]H.P. Luhn:A Statistical Approach to Mechanized Encoding and searching of Literary Information, IBM Journal of Research and Developent, 1957,4 (1) 309- 317
  • 6Lang K,In International Conference on Machine Learning(ICML),1995年
  • 7赵伯璋,计算机中文信息处理.下,1987年
  • 8刘源,信息处理用现代汉语分词规范及自动分词方法
  • 9高惠璇.统计计算[M].北京大学出版社,1997..
  • 10张琪玉.网络信息检索工具的竞争力要素──网络信息检索工具发展的方向与提高竞争力的途径(连载一)[J].江苏图书馆学报,2002(2):3-5. 被引量:9

共引文献59

同被引文献44

引证文献4

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部