自动标引中自然主题词的切分被引量：1

The Natural Keyword Segmentation in Automatic Indexing

下载PDF

导出

摘要自动标引是计算机文献管理中的一个重要过程。主题词的切分是自动标引的第一步。一般标引词均有标准主题词库 ,而自然主题词千差万别 ,使切分有一定的困难。本文利用自然主题词的特点 ,给出了一个基于自然主题词基本结构的切分方法。先使用相关信息对自然主题词的可能起始部分进行判断 ,再根据约束条件对自然主题词的整体进行判断 ,同时根据其出现的频率及位置施以加权处理 ,从而得到正确完整的自然主题词。通过标引系统的标引结果证明了方法可行。 Automatic indexing is a important procedure in computer management.The first step in automatic index is keyword segmentation.Normal index word has standard keyword library,while natural keyword is variable.It is difficult to segment natural keyword.According to the characteristics of natural keyword,an automatic segmentation methods based on basic structure of the natural keyword is present in this paper.The method starts from identification of possible beginning of natrual keyword,then identify the entire of natural keyword.In the meantime frequency and positions of the natural keyword are weighted.A complete and correct natural keyword is obtained from this procedure.Experiments show the method is achievable.

作者靳从唐振民杨静宇

机构地区南京理工大学计算机系

出处《情报科学》 CSSCI 北大核心 2004年第3期337-339,共3页 Information Science

关键词自动标引自然主题词主题词切分主题词库计算机文献管理 Automatic index Automatic segmentation Natural keyword

分类号 G254.361 [文化科学—图书馆学]

引文网络
相关文献

参考文献3

1牛正雨,柴佩琪.文语转换系统中的中文姓名识别[J].计算机应用研究,2001,18(1):25-26. 被引量：7
2王永成,苏海菊,莫燕.中文词的自动办理[J].中文信息学报,1990,4(4):1-11. 被引量：13
3苏新宁.汉语文献自动标引综析[J].情报学报,1993,12(4):309-318. 被引量：18

二级参考文献2

1孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：88
2张俊盛,陈舜德,郑萦,刘显仲,柯淑津.多语料库作法之中文姓名辨识[J].中文信息学报,1992,6(3):7-15. 被引量：14

共引文献34

1苏武华.汉语自动分词和自动标引方法研究[J].农业图书情报学刊,2004,15(7):103-105. 被引量：4
2文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
3孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：102
4文庭孝,侯经川,邱均平,张洋.汉语自动分词新思维:无词典切分[J].情报杂志,2005,24(2):2-4. 被引量：2
5邱均平,文庭孝,周黎明.汉语自动分词与内容分析法研究[J].情报学报,2005,24(3):309-317. 被引量：11
6李成城,赵述芳,刘建毅,钟义信.基于动态规划算法的专有名词切分[J].计算机应用研究,2005,22(7):78-80. 被引量：2
7杨芳,杨振山.一种消除中文匹配中交集型歧义的方法[J].计算机辅助工程,2005,14(2):36-38. 被引量：2
8刘晓英.汉语自动分词研究的发展趋势[J].高校图书馆工作,2005,25(4):25-28. 被引量：4
9杨芳.基于电子政务主题词表的中文匹配方法[J].情报杂志,2005,24(8):14-15. 被引量：1
10唐振民,靳从,杨静宇,李远复.一种用于自动标引系统的主题词自动切分方法[J].南京理工大学学报,1995,19(5):401-404. 被引量：2

同被引文献6

1黄庆红.自动标引与机辅标引[J].现代图书情报技术,2002(S1):63-63. 被引量：2
2王士强,龚忠武,陈次白.英语自动标引的理论与实践[J].江苏图书馆学报,1996(6):6-9. 被引量：1
3朱琳,杨梁彬.网络信息资源自动标引面向中文网络文本信息的研究[C].北京大学校长基金论文集,2003.
4顾敏,史丽萍,李春玲.自动标引综述[J].黑龙江水专学报,2000,27(3):103-104. 被引量：7
5叶志清,刘瑞红,袁庆,胡修兰.文献信息计算机全文全自动标引方法[J].情报学报,2003,22(2):169-172. 被引量：3
6赵妍,侯汉清,耿金玉,叶常妍,何群.中文期刊论文自动标引加权设计研究[J].新世纪图书馆,2004(1):40-43. 被引量：13

引证文献1

1余秋冬,王战.基于逆文献频率和语词位置加权算法的文献自动标引的研究[J].天津职业院校联合学报,2010,12(2):71-75. 被引量：1

二级引证文献1

1赵麟,陈晓莉,王丽婷.基于逆文献频率加权和N元分析算法的自动标引研究[J].图书馆工作与研究,2013(6):125-128.

1马线莉,靖琦.科研计划的计算机管理系统[J].机械产品与科技,1999(3):32-33.
2唐振民,靳从,杨静宇,李远复.一种用于自动标引系统的主题词自动切分方法[J].南京理工大学学报,1995,19(5):401-404. 被引量：2
3麦淑平,冯志纲.论图书馆馆员与读者的整合[J].图书馆理论与实践,2009(1):29-31. 被引量：15
4张晋武.浅谈档案、图书、情报三者一体化[J].湖北财经高等专科学校学报,2002,14(5):62-64. 被引量：3
5云丽.试论文物的艺术价值[J].内蒙古艺术,2014(2):92-94. 被引量：2
6陈越.回溯数据库主题标引的研究[J].图书馆界,2004(2):22-24.
7武重年,单莉.论自动标引与主题词库的建立[J].浙江档案,1995,0(9):27-27.
8曲绍堂.如何做好电视新闻采访[J].采写编,2016,0(3):81-81. 被引量：1
9单莉.一种机标主题词库建立与维护方法[J].北京档案,1993,0(6):23-25.
10仰望星空,脚踏尸地（图）.吃的不是蛋糕[J].微型计算机,2010,30(20):78-79.

情报科学

2004年第3期

浏览历史

内容加载中请稍等...

自动标引中自然主题词的切分被引量：1

参考文献3

二级参考文献2

共引文献34

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

自动标引中自然主题词的切分 被引量：1

参考文献3

二级参考文献2

共引文献34

同被引文献6

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

自动标引中自然主题词的切分被引量：1