期刊文献+
共找到267篇文章
< 1 2 14 >
每页显示 20 50 100
基于Wikipedia的短文本语义相关度计算方法 被引量:15
1
作者 王荣波 谌志群 +2 位作者 周建政 李治 高飞 《计算机应用与软件》 CSCD 2015年第1期82-85,92,共5页
语义相关度计算是自然语言处理领域的研究热点。现有的以文本相似度计算代替文本相关度计算的方法存在不足之处。提出从语形相似性和组元相关性两个方面来综合度量短文本之间的语义相关性,并提出2个以Wikipedia作为外部知识库的短文本... 语义相关度计算是自然语言处理领域的研究热点。现有的以文本相似度计算代替文本相关度计算的方法存在不足之处。提出从语形相似性和组元相关性两个方面来综合度量短文本之间的语义相关性,并提出2个以Wikipedia作为外部知识库的短文本相关度计算算法:最大词语关联法和动态组块法。在一个网络短文本测试集上对算法进行测评。实验结果表明,该算法与典型相似度计算算法比较,在正确率方面提高了20%以上。 展开更多
关键词 短文本 wikipedia 相关度计算 自然语言处理
在线阅读 下载PDF
基于Wikipedia的资源型化学教与学 被引量:11
2
作者 陈凯 陈博 陆真 《中国电化教育》 CSSCI 北大核心 2009年第1期81-84,共4页
Wikipedia是基于Wiki技术的目前全球最著名的英文网络百科全书,它利用超级链接构建化学信息网络,展现大量的化学知识及与相关情境素材,鲜明体现了Web2.0特征。基于Wikipedia的丰富化学资源,可以应用于新课程教学备课、化学主题科普论文... Wikipedia是基于Wiki技术的目前全球最著名的英文网络百科全书,它利用超级链接构建化学信息网络,展现大量的化学知识及与相关情境素材,鲜明体现了Web2.0特征。基于Wikipedia的丰富化学资源,可以应用于新课程教学备课、化学主题科普论文写作,更可应用于开展多元化的化学教学活动。 展开更多
关键词 wikipedia 资源型教学 化学教学 双语教学
在线阅读 下载PDF
基于Wikipedia的语义相关度计算 被引量:10
3
作者 刘军 姚天昉 《计算机工程》 CAS CSCD 北大核心 2010年第19期42-43,46,共3页
在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语... 在意见挖掘中,为实现特殊领域知识的语义相关度计算,提出基于Wikipedia的语义相关度计算方法。在构建Wikipedia类别树的基础上,通过Wikipedia类别向量表示Wikipedia中的词汇,形成一部包含各种领域知识的Wikipedia词典,利用该词典计算语义相关度。实验结果表明,该方法的斯皮尔曼等级相关系数可达到0.77。 展开更多
关键词 语义相关度 领域知识 wikipedia类别树 意见挖掘
在线阅读 下载PDF
基于多知识库的短文本实体链接方法研究——以Wikipedia和Freebase为例 被引量:9
4
作者 周鹏程 武川 陆伟 《现代图书情报技术》 CSSCI 2016年第6期1-11,共11页
【目的】基于多知识库进行实体链接,解决基于单一知识库的实体链接覆盖度低的问题。【方法】首先生成文本的n-gram并利用词性和多个指称–实体字典获取候选指称,然后生成指称组合并保留覆盖度最大且不被其他组合包含的指称组合,接着生... 【目的】基于多知识库进行实体链接,解决基于单一知识库的实体链接覆盖度低的问题。【方法】首先生成文本的n-gram并利用词性和多个指称–实体字典获取候选指称,然后生成指称组合并保留覆盖度最大且不被其他组合包含的指称组合,接着生成候选实体序列并利用多知识库信息计算实体序列的相关度,最后选择相关度最大的实体序列为最终结果。【结果】以Wikipedia和Freebase为例的实验结果表明,基于Wikipedia+Freebase的实体链接准确率、召回率、F值分别达到71.81%、76.86%、74.25%。【局限】基于词性过滤n-gram缺乏理论依据,数据集FACC1具有高准确率和低召回率的特点。【结论】利用多个知识库的实体信息,能够提升实体链接效果。 展开更多
关键词 实体链接 知识库 wikipedia Freebase
原文传递
相关实体发现中基于Wikipedia的实体排序 被引量:1
5
作者 张俊三 瞿有利 +1 位作者 税仪冬 田盛丰 《计算机研究与发展》 EI CSCD 北大核心 2014年第6期1359-1372,共14页
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关... 针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种"去停止词重构关系"方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费. 展开更多
关键词 相关实体发现 实体排序 实体类型相关度 实体关系相关度 wikipedia
在线阅读 下载PDF
利用Wikipedia的结构化信息计算语义相关性 被引量:2
6
作者 王瑞琴 孔繁胜 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第2期315-320,共6页
提出了一种基于Wikipedia的链接信息的计算词汇间语义相关性的新方法.与WordNet知识库相比,Wikipedia的覆盖范围更广,知识更全面,内容更新更快,是进行语义处理的理想资源.与基于Wikipedia的计算语义相关性的同类方法相比,该方法只利用了... 提出了一种基于Wikipedia的链接信息的计算词汇间语义相关性的新方法.与WordNet知识库相比,Wikipedia的覆盖范围更广,知识更全面,内容更新更快,是进行语义处理的理想资源.与基于Wikipedia的计算语义相关性的同类方法相比,该方法只利用了Wikipedia的链接结构信息,无须繁重的文本处理,计算量小.在相关性计算中,综合考虑了指入型链接和指出型链接的积极作用,并配合链接数量调节因子消除偏斜.利用多个通用的人工定义语义相关性度量数据集,与当前已有的基于WordNet和基于Wikipedia的相关性度量方法进行了试验比较,结果表明此方法在计算语义相关性方面效果显著. 展开更多
关键词 wikipedia WORDNET 语义相似性 语义相关性
在线阅读 下载PDF
大数据领域的主题分析——基于WOS和Wikipedia的互证研究 被引量:4
7
作者 许鑫 冯诗惠 《情报杂志》 CSSCI 北大核心 2014年第11期124-130,共7页
利用WOS(Web of Science)和Wikipedia两种数据源,对大数据相关的内容进行词频统计、文本归类分析,得出两种数据源下大数据主题的共识和差异,并进一步梳理提炼出大数据领域的主题类别。共同的类别包括整体角度、技术层面、应用层面、实... 利用WOS(Web of Science)和Wikipedia两种数据源,对大数据相关的内容进行词频统计、文本归类分析,得出两种数据源下大数据主题的共识和差异,并进一步梳理提炼出大数据领域的主题类别。共同的类别包括整体角度、技术层面、应用层面、实体和活动等,进一步细分的主题包括数据及数据源、大数据处理和分析技术、大数据系统和应用、国家地区以及企业的推动、社会和人的讨论、行业和学科变化等。最后论文还结合相关数据探讨了大数据领域的研究前沿。 展开更多
关键词 大数据 主题分析 WEB of SCIENCE wikipedia
在线阅读 下载PDF
基于Wikipedia链接信息的词汇语义相关性度量 被引量:4
8
作者 王瑞琴 《情报学报》 CSSCI 北大核心 2013年第4期385-389,共5页
提出了一种只利用Wikipedia的链接结构化信息度量词汇间语义相关性的新方法,在语义相关性的计算过程中,综合考虑了两种指向的共享链接(指入型、指出型)和三种链接相关的类型(直接链接相关、间接链接相关、传递链接相关)。利用多... 提出了一种只利用Wikipedia的链接结构化信息度量词汇间语义相关性的新方法,在语义相关性的计算过程中,综合考虑了两种指向的共享链接(指入型、指出型)和三种链接相关的类型(直接链接相关、间接链接相关、传递链接相关)。利用多个通用的测试数据集与当前若干主流语义相关性度量方法进行了实验比较,结果表明本文方法在不需要进行任何的文本处理的情况下取得了前所未有的好效果。 展开更多
关键词 语义相关性 wikipedia 链接结构 链接相关
在线阅读 下载PDF
基于编辑文本与结构的Wikipedia作者信任模型 被引量:1
9
作者 李慧 相华婷 汤强 《情报学报》 CSSCI 北大核心 2015年第7期743-753,共11页
为了准确计算WJkipedia中作者可信度,本文通过分析比较现有的Wikipedia作者信任算法,提出一种基于编辑文本与结构的Wikipedia作者信任模型。该模型从作者编辑视角切入,以词条为单位,采用文本分析法对词条各版本内容按照先后顺序进... 为了准确计算WJkipedia中作者可信度,本文通过分析比较现有的Wikipedia作者信任算法,提出一种基于编辑文本与结构的Wikipedia作者信任模型。该模型从作者编辑视角切入,以词条为单位,采用文本分析法对词条各版本内容按照先后顺序进行对比获取各作者的编辑文本,并结合作者插入参考文献和图片的结构信息,获取作者动态信任值。实验结果证明该模型能够很好地区分高信任作者和捣乱者。 展开更多
关键词 作者信任 wikipedia 编辑历史
在线阅读 下载PDF
利用Wikipedia扩大数字馆藏——美国华盛顿大学图书馆给我们的启示 被引量:3
10
作者 李庆芬 《图书馆学研究》 CSSCI 2008年第8期60-62,共3页
本文介绍了华盛顿大学图书馆的数字馆藏,以及被公认的Wikipedia现象,同时还介绍了对Wikipedia文章添加链接的过程以及我们从华盛顿大学图书馆数字项目的获得的启示。
关键词 wikipedia 华盛顿大学图书馆 数字馆藏 维基百科 图书馆馆藏
在线阅读 下载PDF
基于Wikipedia的研究生专业课辅助教学模式探讨 被引量:2
11
作者 吴晗 李向荣 《高教论坛》 2018年第3期15-17,共3页
在学科交叉及研究生背景知识差异的背景下,提出了以Wikipedia(维基百科)资源库为辅助手段的研究生专业课程教学模式。研究生课程中不同学习背景的同学均会存在前序知识点的空缺,教学过程中由于课时限制,难以兼顾学术前沿知识和基础知识... 在学科交叉及研究生背景知识差异的背景下,提出了以Wikipedia(维基百科)资源库为辅助手段的研究生专业课程教学模式。研究生课程中不同学习背景的同学均会存在前序知识点的空缺,教学过程中由于课时限制,难以兼顾学术前沿知识和基础知识。认为借用Wikipedia资源库课前补充前序知识空缺点,课后巩固课程核心前沿知识点,十分有效。通过将每次课程的通用背景知识、专业背景知识、辅助讲解知识和课程核心知识,转换成知识点并对应到Wikipedia资源库的词条供学生学习。认为借助Wikipedia资源库辅助教学,可以提高课堂时间利用率、拓展学生国际化视野、培养学生自主学习能力。 展开更多
关键词 wikipedia资源库 研究生专业课 前序知识 学科交叉 自主学习
在线阅读 下载PDF
Wikipedia与WoS引用指标特征的比较研究
12
作者 杨柳 沈利华 《情报杂志》 CSSCI 北大核心 2022年第4期193-201,共9页
[研究目的]比较Wikipedia提及和WoS引用的指标特征,为学界更加充分地利用相关资源,为数字环境下构建更为客观完善的科研成果计量与评价体系提供参考。[研究方法]基于Altmetric.com追踪的Wikipedia提及数据,统计其数据量、学科等分布,获... [研究目的]比较Wikipedia提及和WoS引用的指标特征,为学界更加充分地利用相关资源,为数字环境下构建更为客观完善的科研成果计量与评价体系提供参考。[研究方法]基于Altmetric.com追踪的Wikipedia提及数据,统计其数据量、学科等分布,获取Wikipedia高提及论文的WoS引用数据,对比Wikipedia和WoS在传播新发表论文速度、指标值累积模式、关注论文持续性及关注主题上的特点,探究二者在不同学科、出版年上的相关性差异。[研究结论]近5年半,Wikipedia共提及论文617203篇,高达83.07%的论文仅被提及过1次,对理学、医学类论文提及较多,人文社科类论文提及较少。Wikipedia反映新发表论文的影响力更及时,指标值累积增长速度也更快,WoS对论文关注时间持续更久,论文出版第二年最易被WoS引用,出版当年最易被Wikipedia提及;Wikipedia关注高、WoS关注低的主题为动植物分布分类相关研究,二者关注皆高的主题为基因组学溯源人类演化史、发展史相关研究;WoS引用和Wikipedia提及之间相关性与指标值累积时间长短无关,但在不同学科上差异显著,仅历史与考古学、认知心理学的Wikipedia提及值对之后的WoS引用值有较好预见性。客观探究二者的相关性,至少需要考虑两个因素:一是过滤过多提及次数为1的论文对相关趋势的稀释影响;二是从学科角度进行分类分析。 展开更多
关键词 wikipedia WOS 科研评价 Altmetrics 指标特征 引用指标
在线阅读 下载PDF
基于结构和编辑历史的Wikipedia信任模型
13
作者 李慧 相华婷 汤强 《现代图书情报技术》 CSSCI 2015年第3期33-38,共6页
【目的】准确计算Wikipedia中词条的可信度。【方法】采用文本分析法将词条当前版本与其历史版本进行比较,获取各版本作者的有效编辑内容,并结合词条当前版本包含的参考文献数和图片数等结构信息,构建一个动态的词条信任评价模型。【结... 【目的】准确计算Wikipedia中词条的可信度。【方法】采用文本分析法将词条当前版本与其历史版本进行比较,获取各版本作者的有效编辑内容,并结合词条当前版本包含的参考文献数和图片数等结构信息,构建一个动态的词条信任评价模型。【结果】通过仿真实验表明该模型能够很好地区分Wikipedia中高信任词条和低信任词条。【局限】通过该算法得出的词条等级划分阈值对处于信任等级中间的B和C两类词条区分不明显。【结论】该算法简单有效,能够从微观层面了解词条的变化过程,动态计算其信任值。 展开更多
关键词 wikipedia 编辑历史 信任值 版本变化
原文传递
基于Wiki的数字资源系统知识组织研究--Wikipedia和GBIF的对比分析
14
作者 张闪闪 《图书馆学研究》 CSSCI 2015年第22期29-34,共6页
通过对基于Wiki的数字资源系统Wikipedia和GBIF从系统功能、知识组织方式、技术架构和运作模式等方面进行分析和比较,探讨了以Wiki系统为基础的不同类型的数字资源系统知识组织方式的特色,指出这两种系统中存在不确定性、垂直结构、精... 通过对基于Wiki的数字资源系统Wikipedia和GBIF从系统功能、知识组织方式、技术架构和运作模式等方面进行分析和比较,探讨了以Wiki系统为基础的不同类型的数字资源系统知识组织方式的特色,指出这两种系统中存在不确定性、垂直结构、精确匹配、用户友好性较差的问题,并据此归纳相应措施:建立用户管理机制、优化现有分类结构、利用神经网络模型扩展检索结果以及增加网站内部链接及浏览历史。 展开更多
关键词 知识组织 wikipedia GBIF
原文传递
Wikipedia中的语义析取 被引量:1
15
作者 余旸 林漳希 夏国平 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第10期1283-1286,共4页
维基百科(Wikipedia)现有搜索模块采用关键词匹配方式导致搜索效率相对低下.为了提高Wikipedia中的知识获取效率,提出基于链接分析的词间距算法(TDL,TermDistance based on Linkage).利用可扩展的计算模型,通过内部链接结构分析发现词簇... 维基百科(Wikipedia)现有搜索模块采用关键词匹配方式导致搜索效率相对低下.为了提高Wikipedia中的知识获取效率,提出基于链接分析的词间距算法(TDL,TermDistance based on Linkage).利用可扩展的计算模型,通过内部链接结构分析发现词簇,并且引入排序和推荐机制.基于Wikipedia 2009年5月快照数据的实验表明,TDL有效增强了Wiki-pedia知识检索的准确性,经由用户评判检验证实TDL算法能有效提高用户意图识别度达7%. 展开更多
关键词 wikipedia 链接分析 知识发现
原文传递
融合Wikipedia分类结构及显式语义特征的短文本检索 被引量:1
16
作者 李璞 张志锋 +2 位作者 杨百冰 肖宝 蒋运承 《河南农业大学学报》 CAS CSCD 北大核心 2019年第2期257-265,共9页
针对网络信息空间出现的大量短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,传统信息检索技术无法有效地对其进行处理的问题,本研究以语义关联度为出发点,基于当前主流的语义知识源Wikipedia来研究短文本检索技术。根据Wikip... 针对网络信息空间出现的大量短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,传统信息检索技术无法有效地对其进行处理的问题,本研究以语义关联度为出发点,基于当前主流的语义知识源Wikipedia来研究短文本检索技术。根据Wikipedia页面中包含的分类结构信息,提出一种显式语义特征选择及关联度计算方法。在此基础上,提出一种低维显式语义空间下的短文本检索方法,并通过实验测试验证了该方法的可行性和有效性。研究结果表明,本研究与当前基于图论的方法和基于链接的方法相比,分别在评估指标MAP上提高了6%和4. 1%,在P@30上提高了10. 4%和5. 8%,在R-Prec上提高了6. 1%和3%。 展开更多
关键词 wikipedia分类结构 显式语义特征 特征选择 短文本 信息检索
在线阅读 下载PDF
从Wikipedia中获取本体:原理与方法研究 被引量:10
17
作者 余传明 张小青 《情报学报》 CSSCI 北大核心 2011年第3期244-252,共9页
wikjpedia作为一个大型的知识库,正逐渐被人们应用于不同的领域。在本体构建领域,wikipedia以其丰富的组织结构为大规模协作式的本体学习提供了有效的环境,利用wikipedja进行本体学习逐渐成为一个新的研究热点。本文从这一角度出发... wikjpedia作为一个大型的知识库,正逐渐被人们应用于不同的领域。在本体构建领域,wikipedia以其丰富的组织结构为大规模协作式的本体学习提供了有效的环境,利用wikipedja进行本体学习逐渐成为一个新的研究热点。本文从这一角度出发,在剖析Wikipedia基本结构的基础上,分析和比较了从类别结构图、信息盒和定义句中获取本体概念和实例的相关原理和方法,阐述了利用wikjpedia获取本体关系的原理,分析了基于结构特征、基于词典、基于句法和基于混合方式的模式匹配方法,以及基于结构特征和文本特征的统计学习方法,并对利用各种方法获取本体关系的效果进行了比较。 展开更多
关键词 本体学习 wikipedja概念 实例 关系
在线阅读 下载PDF
在线知识社区知识系统与社会系统序化规律研究——以Wikipedia为例 被引量:2
18
作者 裘江南 杨畅 李灵 《情报科学》 CSSCI 北大核心 2017年第5期8-14,共7页
【目的/意义】在线知识社区中知识通过社会关系进行传播,形成知识网络,用户之间通过交流、沟通形成社会网络,通过网络结构来探索社会关系与知识结构的序化过程。【方法/过程】基于社会网络分析理论和网络结构熵理论,以英文维基百科为研... 【目的/意义】在线知识社区中知识通过社会关系进行传播,形成知识网络,用户之间通过交流、沟通形成社会网络,通过网络结构来探索社会关系与知识结构的序化过程。【方法/过程】基于社会网络分析理论和网络结构熵理论,以英文维基百科为研究对象,通过知识网络和社会网络的平均路径长度、聚类系数、同配系数、"蔡"结构熵,揭示网络的演化规律。【结果/结论】通过词条"Big Bang"的案例研究发现:在线知识社区中知识观点较社会关系更为紧密,聚合程度较高;社区演化初期,两个网络是无序的同配网络,随后逐渐演化为有序的异配网络。 展开更多
关键词 知识系统 社会系统 维基百科 序化
原文传递
Wikipedia跨语言链接发现中的锚文本译项选择
19
作者 郑剑夕 白宇 +1 位作者 郭程 张桂平 《中文信息学报》 CSCD 北大核心 2016年第2期196-201,216,共7页
Wikipedia跨语言链接发现主要研究从源语言Wikipedia文章中自动识别与主题相关的锚文本,并为锚文本推荐一组相关的目标语言链接。该研究涉及三个关键问题:锚文本识别、锚文本翻译和目标链接发现。在锚文本翻译中,一个锚文本可能存在多... Wikipedia跨语言链接发现主要研究从源语言Wikipedia文章中自动识别与主题相关的锚文本,并为锚文本推荐一组相关的目标语言链接。该研究涉及三个关键问题:锚文本识别、锚文本翻译和目标链接发现。在锚文本翻译中,一个锚文本可能存在多个目标译项,如果其译项选择有误,将会直接影响目标链接发现中的链接推荐的准确性。为此,该文提出了一种基于上下文的锚文本译项选择方法,使用基于逐点互信息投票的方式确定锚文本的译项。对中英文Wikipedia中的人名、术语以及缩略语的译项选择进行测试,实验表明该方法取得了较好的效果。 展开更多
关键词 wikipedia 跨语言链接发现 锚文本 译项选择 逐点互信息
在线阅读 下载PDF
基于WordNet与Wikipedia的平面几何本体的构建 被引量:1
20
作者 符红光 刘莉 +2 位作者 钟秀琴 蒋彦 孙媛媛 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第4期575-580,共6页
针对目前本体构建中存在的如手工构建难以确保高效性和可扩展性,且自动构建难度大,可操作性不强等研究现状,提出了一种基于WordNet和Wikipedia的学科领域本体半自动构建方法。首先构建一个领域顶层本体,在此基础上,重用WordNet的结构,... 针对目前本体构建中存在的如手工构建难以确保高效性和可扩展性,且自动构建难度大,可操作性不强等研究现状,提出了一种基于WordNet和Wikipedia的学科领域本体半自动构建方法。首先构建一个领域顶层本体,在此基础上,重用WordNet的结构,从深度上对其进行术语和术语层次的扩展;同时根据Wikipedia中的页面信息,从广度上对其进行术语间关系的扩展和术语的补充;并将该本体构建方法应用于平面几何领域。实验表明该方法能大大提高本体构建的效率,并在一定程度上保证了本体的质量。 展开更多
关键词 领域本体 半自动构建 维基百科 WORDNET
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部