从社会性标签中进行语义关系抽取--一种元数据生成方法被引量：7

Semantic Relation Extraction from Socially-generated Tags:A Methodology for Metadata Generation

下载PDF

导出

摘要标签形式的社会性语义越来越占据主导地位,使元数据界在这种新形式的信息内容表达和检索方面面临机遇和挑战。其中,主要的挑战是与标签相关的语境信息的缺失。以Flickr标签为例,对如何利用社会性语义资源来丰富主题元数据进行了实验。实验过程包含4个步骤:收集Flickr标签样本;通过共有信息计算标签间的同现情况;通过Google检索结果来追踪标签对的语境信息;用自然语言处理和机器学习技术来抽取标签间的语义关系。本实验能够利用Google搜索结果构建语境库,并且以自然语言处理和机器学习算法对这些语句进行处理。这种新方法对于赋予标签对以一定语义关系有相当高的准确率。也探讨该方法在利用社会性语义丰富的主题元数据方面的意义。 The growing predominance of social semantics in the form of tagging presents the metadata communfty with both opportunities and challenges as for leveraging this new form of information content representation and for retrieval. One key challenge is the absence of contextual information associated with these tags. This paper presents an experiment working with Flickr tags as an example of utilizing social semantics sources for enriching subject metadata. The procedure included four steps ： 1 ） Collecting a sample of Flickr tags, 2） Calculating cooccurrences between tags through mutual information, 3） Trac- ing contextual information of tag pairs via Google search results,4） Applying natural language processing and machine learn- ing techniques to extract semantic relations between tags. The experiment helped us to build a context sentence collection from the Google search results, which was then processed by natural language processing and machine learning algorithms. This new approach achieved a reasonably good rate of accuracy in assigning semantic relations to tag pairs. This paper also explores the implications of this approach for using social semantics to enrich subject metadata.

作者 MiaoChen XiaozhongLiu JianQin 崔晓莉(译) 张春景(校)

机构地区美国雪城大学华东师范大学信息学系上海图书馆

出处《现代图书情报技术》 CSSCI 北大核心 2009年第3期38-45,共8页 New Technology of Library and Information Service

关键词关系抽取标签搜索引擎社会性语义元数据 Relation extraction Tags Search engine Social semantics Metadata

分类号 G250 [文化科学—图书馆学]

引文网络
相关文献

参考文献21

1Agichtein,Eugene,and Luis Gravano.(2000).Snowball:Extracting Relations from Large Plain-text Collections.In Kenneth M.Anderson,et al.(Ed.),Proceedings of the 5th ACM Conference on Digital Libraries,(pp.85-94).New York:Association for Computing Machinery.
2Brin,Sergey.(1998).Extracting Patterns and Relations from the World Wide Web.In Paolo Atzeni et al.(Ed.),Selected Papers from the International Workshop on the World Wide Web and Databases,(pp.172-183).London:Springer.
3Bunescu,Razvan C.,and Raymond J.Mooney.(2007).Extracting Relations from Text from Word Sequences to Dependency Paths.In Anne Kao,et al.(Ed.),Text Mining and Natural Language Processing,(pp.29-44).London:Springer.
4Culotta,Aron,and Jeffrey Serensen.(2004).Dependency Tree Kernels for Relation Extraction.Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics.Retrieved April 13,2008,from http://acl.ldc.upenn,edu/P/P04/P04-1054.pdf.
5Culotta,Aron,Andrew McCallum,and Jonathan Betz.(2006).Integrating Probabilistic Extraction Models and Data Mining to Discover Relations and Patterns in Text.Proceedings of the Main Conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics,(pp.296-303).
6Guy,Marieke,and Emma Tonkin.(2006).Folksonomies:Tidying up tags? D-Lib Magazine,12(1).Retrieved April 13,2008,from http://www.dlib.org/dlib/january06/guy/01 guy.html.
7Heymann,Paul,and Hector Garcia-Molina.(2006).Collaborative Creation of Communal Hierarchical Taxonomies in Social Tagging Systems.Technical Report 2006-10.Department of Computer Science,Stanford University.Retrieved April 13,2008,from http://labs.rightnow.com/colloquium/papers/tag_hier_mining.pdf.
8Iria,Jose,and Fabio Ciravegua.(2005).Relation Extraction for Mining the Semantic Web.Dagstuhl Seminar on Machine Learning for the Semantic Web.Retrieved April 13,2008,from http://tyne.shef.ac.uk/t-rex/pdocs/dagstuhl,pdf.
9Liu,Hugo and Pattie Maes.(2007).Introduction to the Semantics of People & Culture (Editorial preface).International Journal on Semantic Web and Information Systems,Special Issue on Semantics of People and Culture,3 (1).Retrieved March 28,2008,from http://larifari.org/writing/IJSWIS2007-SPC-EditorialPreface.paf.
10Mathes,Adam.(2004).Folksonomies-Cooperative Classification and Communication Through Shared Metadata.Unpublished manuscript.Retrieved April 13,2008,from http://www,adammathes.com/academic/computer-mediated-communication/folksonomies.html.

同被引文献68

1赵亮,楼向英,张春景,刘炜.元数据应用:语义、结构与句法[J].图书馆杂志,2004,23(7):49-55. 被引量：10
2曾伟忠,徐昕.搜索引擎及元搜索引擎工作原理及存在的不足[J].图书馆学刊,2004,26(5):58-59. 被引量：12
3杜小勇,李曼,王大治.语义Web与本体研究综述[J].计算机应用,2004,24(10):14-16. 被引量：64
4李健康,张春辉.本体研究及其应用进展[J].图书馆论坛,2004,24(6):80-86. 被引量：55
5成瑜,何洁月.基于本体的生物信息数据源的发现[J].微机发展,2005,15(1):38-40. 被引量：5
6宋峻峰,张维明,肖卫东,唐九阳.基于本体的信息检索模型研究[J].南京大学学报（自然科学版）,2005,41(2):189-197. 被引量：44
7吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：217
8谢晓专.网络信息资源组织模式研究[J].图书情报工作,2006,50(1):64-67. 被引量：10
9乔欢,刘漫,陈志新.OPAC历史沿革及其发展趋势[J].国家图书馆学刊,2006,15(4):5-9. 被引量：37
10徐德智,王怀民.基于本体的概念间语义相似度计算方法研究[J].计算机工程与应用,2007,43(8):154-156. 被引量：34

引证文献7

1钟莹.网络信息组织模式发展历程及趋势[J].情报探索,2011(7):80-83. 被引量：2
2钟莹.从Archie谈网络信息组织模式[J].河南图书馆学刊,2012,32(1):80-84.
3赵蓉英,程震霖.国内馆藏数字资源语义化研究现状[J].信息资源管理学报,2015,5(2):97-103.
4邹盼.基于中文语义词典的标签间语义关系挖掘[J].科技创业月刊,2016,29(7):92-94.
5谢琪,刘亮亮,曹馨宇,郭玉峰,刘保延,周洪伟.中医临床常用术语的本体构建技术探讨[J].中医杂志,2016,57(11):919-923. 被引量：12
6周知,梁宇.基于词表和句法规则的社会化标签分类研究[J].情报资料工作,2017,38(5):63-69. 被引量：2
7徐志玮.Folksonomy与受控词汇在OPAC中的融合研究[J].知识管理论坛,2010(9):1-5.

二级引证文献16

1倪菲,袁东超,杨茗茜,陈彦君,曲金桥,郭鹤,郑一,于睿,辛华.基于真实世界研究方法构建中医心系疾病症状术语知识体系[J].辽宁中医杂志,2022,49(3):41-43. 被引量：3
2林立,马保新.颈内静脉血氧饱和度用于急性脑损伤患者脑氧平衡的监测[J].临床麻醉学杂志,2000,16(1):33-34. 被引量：9
3冯静.基于数字信息服务的图书馆网络信息资源组织模式探讨[J].江西图书馆学刊,2012,42(6):28-30. 被引量：3
4王斌,陈迪,曹馨宇,周洪伟,史华新,张妮楠,谢琪.临床路径电子化中数据采集与预处理方法研究[J].中国数字医学,2018,13(2):40-41. 被引量：1
5李旭晖,李媛媛,马费成.我国图情领域社会化标签研究主要问题分析[J].图书情报工作,2018,62(16):120-131. 被引量：12
6朱伯君.解析网络信息组织的发展趋势[J].信息与电脑,2018,30(13):33-34.
7胡芳,李晓彤.博物馆用户生成内容的模式与问题研究[J].中国博物馆,2019(1):113-119. 被引量：2
8王浩,俞东青,张兴平,高云,魏戌,文腾,虹娜,陈红玉,王佩,葛伟韬.基于真实世界的膝骨性关节炎门诊结构化电子病历模板设计与制作[J].世界科学技术-中医药现代化,2019,21(5):931-935. 被引量：7
9杨茗茜,袁东超,倪菲,陈彦君,崔家鹏,王彩霞,李可大,董野,李思琦,季康寿.《素问》脾藏象理论相关咳类疾病知识本体探究[J].中国中医基础医学杂志,2021,27(2):199-202. 被引量：12
10王曦廷,卢涛.中医药认知计算:概念、框架与路径[J].中华中医药杂志,2022,37(1):35-40. 被引量：6

1潘杰.浅谈应用社会性标签改善学科导航的用户参与性[J].科技情报开发与经济,2010,20(13):84-86. 被引量：3
2常永军.构建高校档案信息管理系统探微[J].科技咨询导报,2007(30):236-236. 被引量：1
3楼婷渊,孟志青,胡强.文本挖掘技术在生物医学文献管理中的应用[J].现代营销（下）,2012(10):259-259.
4王秀艳,崔雷.应用关键动词抽取生物医学实体间语义关系研究综述[J].现代图书情报技术,2011(9):21-27. 被引量：1
5行业[J].网络传播,2007(7):7-8.
6Flickr上的美国国会图书馆珍藏集[J].数字图书馆论坛,2008(2):4-4.
7杨保军.传播态新闻语境信息构成分析[J].当代传播,2008(5):10-14. 被引量：5
8王建英.数字档案馆离我们有多远？[J].天津档案,2004(5):18-18.
9刘庄.对以众筹方式介入资讯节目生产的回顾与思考[J].东南传播,2015(3):11-13.
10邹贤启.党报的责任情怀与历史使命[J].新闻前哨,2013(8):9-9.

现代图书情报技术

2009年第3期

浏览历史

内容加载中请稍等...

从社会性标签中进行语义关系抽取--一种元数据生成方法被引量：7

参考文献21

同被引文献68

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

从社会性标签中进行语义关系抽取--一种元数据生成方法 被引量：7

参考文献21

同被引文献68

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

从社会性标签中进行语义关系抽取--一种元数据生成方法被引量：7