期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
XML Schema匹配中的元素相似性度量算法研究
1
作者 苟和平 景永霞 姜永亮 《沈阳理工大学学报》 CAS 2014年第5期15-20,共6页
为了实现XML Schema自动匹配,解决XML数据共享问题,提出一种基于语义和结构的模式自动匹配算法。首先采用基于单词网络(wordnet)的语义匹配算法及字符串结构匹配(n-grams)算法计算来自两个模式树中节点对名称相似度,然后获取包含此节点... 为了实现XML Schema自动匹配,解决XML数据共享问题,提出一种基于语义和结构的模式自动匹配算法。首先采用基于单词网络(wordnet)的语义匹配算法及字符串结构匹配(n-grams)算法计算来自两个模式树中节点对名称相似度,然后获取包含此节点对的各自路径集,再通过计算对应路径集中每对路径的最大相似度获得此节点对的结构相似度。实验分析表明此方法具有较好的查全率和查准率。 展开更多
关键词 xml schema 模式匹配 语义 路径相似
在线阅读 下载PDF
基于加权XML模型的XML数据与DTD模式匹配
2
作者 李树青 程国达 王维民 《现代图书情报技术》 CSSCI 北大核心 2010年第1期57-65,共9页
首先说明利用加权XML数据模型分别得到标准XML参考实例和XML数据实例的方法,并对DTD约束修饰符的表达方法进行介绍。其次,详细阐述相似度算法的实现方法,重点说明在XML数据实例中寻找与标准XML参考实例的匹配节点算法和计算标准XML参考... 首先说明利用加权XML数据模型分别得到标准XML参考实例和XML数据实例的方法,并对DTD约束修饰符的表达方法进行介绍。其次,详细阐述相似度算法的实现方法,重点说明在XML数据实例中寻找与标准XML参考实例的匹配节点算法和计算标准XML参考实例与XML数据实例的相似度算法。最后,对相关实验及其结论进行总结。 展开更多
关键词 加权xml DTD 相似度 模式匹配
原文传递
A Novel Method for Transforming XML Documents to Time Series and Clustering Them Based on Delaunay Triangulation
3
作者 Narges Shafieian 《Applied Mathematics》 2015年第6期1076-1085,共10页
Nowadays exchanging data in XML format become more popular and have widespread application because of simple maintenance and transferring nature of XML documents. So, accelerating search within such a document ensures... Nowadays exchanging data in XML format become more popular and have widespread application because of simple maintenance and transferring nature of XML documents. So, accelerating search within such a document ensures search engine’s efficiency. In this paper, we propose a technique for detecting the similarity in the structure of XML documents;in the following, we would cluster this document with Delaunay Triangulation method. The technique is based on the idea of representing the structure of an XML document as a time series in which each occurrence of a tag corresponds to a given impulse. So we could use Discrete Fourier Transform as a simple method to analyze these signals in frequency domain and make similarity matrices through a kind of distance measurement, in order to group them into clusters. We exploited Delaunay Triangulation as a clustering method to cluster the d-dimension points of XML documents. The results show a significant efficiency and accuracy in front of common methods. 展开更多
关键词 xml Mining Document CLUSTERING xml CLUSTERING schema matching similarity Measures DELAUNAY TRIANGULATION Cluster
在线阅读 下载PDF
多策略相似度整合的XML模式匹配方法 被引量:1
4
作者 范红杰 柳军飞 +1 位作者 周鲁东 麻志毅 《计算机科学与探索》 CSCD 北大核心 2016年第1期14-24,共11页
模式匹配用于发现不同数据源中概念之间的语义对应关系,已成为数据集成、数据交换等领域的研究热点。研究者提出了大量的基于XML模式匹配方法,从而可以识别XML中数据的语义对应关系。XML模式匹配存在着一些挑战,例如如何将节点和结构匹... 模式匹配用于发现不同数据源中概念之间的语义对应关系,已成为数据集成、数据交换等领域的研究热点。研究者提出了大量的基于XML模式匹配方法,从而可以识别XML中数据的语义对应关系。XML模式匹配存在着一些挑战,例如如何将节点和结构匹配进行综合考虑,如何有效拟合多种相似度等。面对如上问题,针对XML节点和结构两方面进行相似度计算,得到相似度矩阵后整合这两个方面的相似度。随后通过多种策略组合和优化算法进行拟合,以得到优化的匹配结果。最后,通过基准测试平台对比,该方法相比于经典的模式匹配方法具有较高的精确率和召回率。 展开更多
关键词 数据交换 模式匹配 可扩展标记语言(xml) 相似度度量 多策略组合
在线阅读 下载PDF
一种多策略通用模式匹配方法 被引量:2
5
作者 程伟 周龙骧 +1 位作者 林河水 孙玉芳 《计算机科学》 CSCD 北大核心 2004年第11期121-123,共3页
模式匹配问题即寻找不同模式元素之间的语义对应关系,在数据仓库、异构数据源集成及语义Web等领域都是非常重要的研究基础。目前模式匹配仍大多主要由人工来完成,因此有很大局限性。提出了一种多策略通用模式匹配架构,可以方便地兼容其... 模式匹配问题即寻找不同模式元素之间的语义对应关系,在数据仓库、异构数据源集成及语义Web等领域都是非常重要的研究基础。目前模式匹配仍大多主要由人工来完成,因此有很大局限性。提出了一种多策略通用模式匹配架构,可以方便地兼容其他匹配策略。采用了一种基于词语间语义距离的方法来计算其语义相似度;提出了一种基于相似度传播的结构匹配算法,有效地考虑了相邻相似节点间的相互影响。实验结果表明这种匹配方法在处理模式匹配任务时能达到较高的精度。 展开更多
关键词 模式匹配 通用 结构匹配 异构数据源集成 语义相似度 语义WEB 匹配策略 配方法 对应关系 实验结果
在线阅读 下载PDF
基于SimHash和混合相似度的多模式匹配方法 被引量:4
6
作者 曹卫东 胡炜 +1 位作者 王家亮 王静 《计算机应用研究》 CSCD 北大核心 2020年第1期198-202,共5页
为了解决多源异构民航旅客服务数据集成过程中存在多模式匹配的效率不高、精确性不足、完整模式信息获取难度较大等问题,提出了一种基于Sim Hash和混合相似度的多模式匹配方法。该方法首先基于PMI计算特征单元权重,并通过Sim Hash算法... 为了解决多源异构民航旅客服务数据集成过程中存在多模式匹配的效率不高、精确性不足、完整模式信息获取难度较大等问题,提出了一种基于Sim Hash和混合相似度的多模式匹配方法。该方法首先基于PMI计算特征单元权重,并通过Sim Hash算法构造属性列的签名来表示属性特征,以降低特征维度,进而引入K-means++算法对属性聚类并生成候选匹配集。最后基于属性的混合相似度构建属性映射图,以直观的方式展示属性间的匹配关系,同时提高多模式匹配效率。实验结果表明该方法具有可行性,为高效地解决多源异构民航旅客服务数据集成中的模式冲突问题提供新的解决方案。 展开更多
关键词 多模式匹配 签名 点互信息 混合相似度 属性映射图
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部