摘要
介绍一种仅仅依靠中国知网文献磁盘文件提取元数据的方法。根据已下载的CNKI文献提取元数据,构建个人文献信息数据库,进而能建立个人文献信息管理系统。虽然CNKI文献库没有提供外界的数据库访问接口,但是文献的元数据都以web页面的方式展现。通过分析与文献绑定的属性页面的结构,利用正则表达式提取文献元数据,可以将其批量导入到数据库中。
A method of extracting CNKI papers' metadata just relying on files stored on hard disk is introduced. According to downloaded CNKI papers, the method can extract metadata, build personal literature database, and then create personal paper information management system. Although CNKI Archive does not provide database access interface to the outside world, the metadata of paper is shown on web pages. By analyzing the structure of binding properties web page of literature and using regular expression to extract metadata, the metadata can be batch imported into the database.
出处
《图书情报工作》
CSSCI
北大核心
2010年第19期111-114,共4页
Library and Information Service
基金
资源与环境信息系统国家重点实验室自主研究课题"地球科学数据质量评价研究"(项目编号:O88RA106SA)
中国科学院地理科学与资源研究所创新三期领域前沿项目(地球信息方法论体系)课题"地学数据空间化误差评价方法及案例研究"(项目编号:O66U0309SZ)研究成果之一