摘要
将短语结构标注引入CSSCI期刊论文题录信息分析,在关键词、术语构成上从语法角度深度探讨各组成词汇之间的语法关系,力图通过语法功能分析揭示其所蕴含的语义知识。在进行一定规模语料标注基础上,通过短语词汇、词性统计及短语语法功能分析获取学术文献中短语结构构成特征,并将这部分特征与清华树库语料短语特征混合,提高短语结构在科技文献中的识别率。
The paper introduces a new syntax method as the solution of term phrase identification on CSSCI corpus, and obtains the inter - relationship among terms in academic literature from the linguistic aspect based on phrase components, such as words, part - of - speech, grammar functions, etc. These linguistic features are mixed with phrase features which are extracted from Tsinghua Treebank so as to leverage the accuracy of phrase auto - identification in academic corpus.
出处
《现代图书情报技术》
CSSCI
北大核心
2012年第12期32-38,共7页
New Technology of Library and Information Service
基金
国家自然科学基金面上项目"面向知识服务的知识组织模式与应用研究"(项目编号:71273126)
高技术研究发展计划(863计划)项目"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206)
江苏省教育厅高校哲学社会科学研究基金项目"基于本体的高校突发事件网络舆情监控预警模式研究"(项目编号:2010SJB870003)的研究成果之一