期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
一种改进的并行连接算法Diag-Join及其性能分析
1
作者 庄毅 徐海力 《计算机工程》 CAS CSCD 北大核心 2004年第2期119-120,147,共3页
介绍了一种改进的并行连接算法:Diag-Join算法,并将它运用到并行环境中。实验表明,Diag-Join算法在内存足够时可以取得最好的性能,即使在内存较小的情况下,仍能得到令人满意的效果。
关键词 关系数据库 并行数据库 连接算法 索引 查询优化
在线阅读 下载PDF
RM树:一种支持字符串相似性操作的索引 被引量:6
2
作者 王金宝 高宏 +1 位作者 李建中 杨东华 《计算机学报》 EI CSCD 北大核心 2011年第11期2142-2154,共13页
字符串相似性操作在很多领域中被广泛应用,如数据清洁、信息集成等.现有研究工作主要为基于q-Gram和倒排索引的内存方法,在处理大量数据时具有以下缺点:内存消耗大、更新效率低、支持操作类型有限.现有的外存索引Bed树无法将相似的字符... 字符串相似性操作在很多领域中被广泛应用,如数据清洁、信息集成等.现有研究工作主要为基于q-Gram和倒排索引的内存方法,在处理大量数据时具有以下缺点:内存消耗大、更新效率低、支持操作类型有限.现有的外存索引Bed树无法将相似的字符串聚类,在查询处理过程中导致了较大的I/O代价.该文设计了支持多种字符串相似性操作的RM树索引,消除了现有内存方法的缺点,并通过字符串聚类的方法提高了相似性操作的效率.该文通过大量实验结果证明了RM树的有效性. 展开更多
关键词 字符串 相似性 索引 查询处理 连接处理
在线阅读 下载PDF
一种基于网格索引的空间连接查询处理优化算法 被引量:5
3
作者 乔百友 邓增安 +3 位作者 王秋杰 朱红印 孔德福 王国仁 《小型微型计算机系统》 CSCD 北大核心 2014年第10期2243-2248,共6页
针对云环境下的空间数据连接查询处理问题,提出一种基于MapReduce框架的高效空间连接查询处理优化算法.该算法采用网格划分方法将数据空间划分成大小相同的网格单元,并将其中一类数据集中的每个空间对象,按照其中心点的位置划分到所在... 针对云环境下的空间数据连接查询处理问题,提出一种基于MapReduce框架的高效空间连接查询处理优化算法.该算法采用网格划分方法将数据空间划分成大小相同的网格单元,并将其中一类数据集中的每个空间对象,按照其中心点的位置划分到所在的网格单元中,从而避免了连接对象的复制,网格单元之间根据其所包含数据对象的交叠关系构建网格索引;对另一类数据集中的对象,仅将其复制到与网格单元中数据有交叠的网格单元,从而过滤掉不可能有连接结果的数据对象,大大减少了后续的连接计算代价.合成数据和真实数据集上的大量实验表明,本文提出的空间数据连接查询处理优化算法在性能上明显优于原有SJMR查询处理算法. 展开更多
关键词 连接查询 MAPREDUCE 空间数据 网格索引
在线阅读 下载PDF
并发内存OLAP查询优化技术研究 被引量:4
4
作者 张延松 焦敏 +1 位作者 张宇 王珊 《计算机研究与发展》 EI CSCD 北大核心 2016年第12期2836-2846,共11页
基于多核处理器硬件技术和高并发查询负载需求,近年来的研究不仅关注于一次一查询模式的查询优化技术,而且也关注于一次一组模式的查询优化技术.通过将并发查询转换为共享负载,一些低访问延迟的操作,如磁盘I?O、cache访问,可以被多个并... 基于多核处理器硬件技术和高并发查询负载需求,近年来的研究不仅关注于一次一查询模式的查询优化技术,而且也关注于一次一组模式的查询优化技术.通过将并发查询转换为共享负载,一些低访问延迟的操作,如磁盘I?O、cache访问,可以被多个并发的查询所共享.当前的研究通常基于共享查询操作符,如扫描、连接、谓词处理等,通过生成全局执行计划优化并发查询.对于复杂的分析型负载,如何创建优化的执行计划是一个具有挑战性的问题.在广泛使用的星形模型的基础上提出一种模板OLAP查询执行计划来简化查询执行计划,以达到最大化查询操作符利用率的目标.1)提出了基于代理键的连接索引技术,将传统的基于值探测的连接操作转化为内存数组索引引用(AIR),使连接操作的CPU效率更高并且支持聚集计算的后物化;2)并发查询的谓词处理简化为cache line敏感的谓词向量,在单次cache line访问中最大化并发查询谓词计算性能;3)通过多核并行实现技术在SSB基准上进行测试.实验结果表明:共享扫描和共享谓词处理能够将并发OLAP查询处理性能提升1倍. 展开更多
关键词 并发O L A P 查询处理 数组索引引用 模板O L A P查询处理 连接索引 过滤向量
在线阅读 下载PDF
面向大规模机群的可扩展OLAP查询技术 被引量:8
5
作者 王会举 覃雄派 +2 位作者 王珊 张延松 李芙蓉 《计算机学报》 EI CSCD 北大核心 2015年第1期45-58,共14页
大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,... 大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,该文对传统数据仓库的数据组织模式及处理模式进行改造,提出了全新的无连接雪花模型和TRM执行模型.无连接雪花模型基于层次编码技术,将维表层次等关键信息压缩进事实表,使得事实表可以独立处理数据,从数据模型层保证了数据计算的独立性;TRM执行模型将OLAP查询的处理抽象为Transform、Reduce、Merge 3个操作,使得OLAP查询可被划分为众多可并行执行的独立子任务,从执行层保证了系统的高度可扩展特性.在性能优化方面,该文提出了Scan-index扫描和跳跃式扫描算法,以尽可能地减少I/O访问操作;设计了并行谓词判断、批量谓词判断等优化算法,以加速本地计算速度.实验表明:LaScOLAP原型可以获得较好的扩展性和容错性,其性能比HadoopDB高出一个数量级. 展开更多
关键词 大规模可扩展 OLAP查询 无连接雪花模型 TRM执行模型 跳跃式扫描 Scan-index 大数据
在线阅读 下载PDF
支持高效路径查询的数据空间索引方法 被引量:1
6
作者 王念滨 祝官文 +1 位作者 周连科 王红卫 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2016年第3期911-916,共6页
首先,通过索引连接例子,分析了影响效率的因素。在扩展倒排索引基础上,构建了B-树索引,以支持大规模数据的高效查找。然后,构建了二级索引,以减少索引连接中的大量重复判断。最后,提出了路径查询算法。实验结果表明:该索引方法能够有效... 首先,通过索引连接例子,分析了影响效率的因素。在扩展倒排索引基础上,构建了B-树索引,以支持大规模数据的高效查找。然后,构建了二级索引,以减少索引连接中的大量重复判断。最后,提出了路径查询算法。实验结果表明:该索引方法能够有效地解决索引连接问题和显著地改善数据空间路径查询效率。 展开更多
关键词 计算机软件 数据空间索引 辅助索引 索引连接 路径查询
在线阅读 下载PDF
空间数据库中连接运算的处理与优化 被引量:11
7
作者 李立言 秦小麟 《中国图象图形学报(A辑)》 CSCD 北大核心 2003年第7期732-737,共6页
空间数据库的性能问题严重制约了它的应用与发展 .由于空间连接运算是空间数据库中最复杂、最耗时的基本操作 ,因此其处理效率在很大程度上决定了空间数据库的整体性能 .尽管目前已经有许多空间连接算法 ,但空间连接运算的代价估计和查... 空间数据库的性能问题严重制约了它的应用与发展 .由于空间连接运算是空间数据库中最复杂、最耗时的基本操作 ,因此其处理效率在很大程度上决定了空间数据库的整体性能 .尽管目前已经有许多空间连接算法 ,但空间连接运算的代价估计和查询优化仍然有待进一步研究 .众所周知 ,大部分空间连接算法都是基于 R树索引实现的 ,如果参与空间连接运算的关系上没有索引或只有部分索引 ,那么就需要使用特殊的算法来处理 .另外 ,各种算法的代价评估模型需要一个相对统一的计算方法 ,实践证明 ,根据空间数据库的实际情况 ,使用 I/ O代价来估计算法的复杂性较为合理 .在此基础上 ,针对复杂的空间查询中可能出现多个关系参与空间连接运算的情况 ,故还需要合理地应用动态编程算法来找出代价最优的连接顺序 ,以便最终形成一个通用的算法框架 .通过对该算法框架的复杂性分析可以看出 ,在此基础上实现的空间数据库查询优化系统将具有较高的时空效率 。 展开更多
关键词 空间数据库 连接运算 R树索引 动态编程算法 查询优化系统
在线阅读 下载PDF
XML数据库结构连接算法之分析 被引量:1
8
作者 门爱华 周立柱 张亚鹏 《计算机科学》 CSCD 北大核心 2007年第6期136-138,176,共4页
结构连接是XML查询处理的核心操作,受到了计算机研究界的高度关注。高效的算法是高效查询处理的关键,目前已经提出许多结构连接的算法。本文介绍了几种典型的算法,并分析了这几种算法的优缺点。
关键词 XML查询处理 结构连接 编码 算法 索引
在线阅读 下载PDF
一种复杂多维层次的连接和聚集算法 被引量:1
9
作者 黄震华 薛永生 +1 位作者 段江娇 王劲波 《计算机研究与发展》 EI CSCD 北大核心 2004年第8期1345-1351,共7页
由于数据仓库中存储着不同粒度、容量巨大的数据记录 ,所以如何有效地执行联机分析处理 (OLAP)查询操作 ,特别是连接和聚集操作 ,便成为数据仓库领域的核心问题之一 为此 ,提出了一种降低连接和聚集操作的新算法 (joinandaggregationba... 由于数据仓库中存储着不同粒度、容量巨大的数据记录 ,所以如何有效地执行联机分析处理 (OLAP)查询操作 ,特别是连接和聚集操作 ,便成为数据仓库领域的核心问题之一 为此 ,提出了一种降低连接和聚集操作的新算法 (joinandaggregationbasedonthecomplexmulti dimensionalhierarchies,JACMDH) 算法充分考虑了复杂多维层次的特点 ,在原有的位图连接索引 (bitmapjoinindex)的基础上 ,采用层次联合代理 (hierarchycombinedsurrogate)和预先分组排序的方法 ,使得复杂的多维层次上的连接和聚集操作转化成事实表上的区域查询 ,从而在处理多维层次聚集的同时 ,提高了连接和聚集的效率 算法性能分析和实验数据表明 ,JACMDH算法和目前流行的算法相比 。 展开更多
关键词 数据仓库 OLAP 多维层次 位图连接索引 层次联合代理 聚集查询
在线阅读 下载PDF
XML/GML非空间数据查询的结构连接算法 被引量:1
10
作者 陈建华 王华军 +1 位作者 苗放 王卫红 《计算机工程》 CAS CSCD 北大核心 2010年第3期69-71,75,共4页
为利用Dewey前缀编码索引方案实现对XML/GML文档的编码并消除其缺点,提出一种扩展的Dewey编码方案——Ex-Dewey。在保留Dewey前缀编码优点的同时提出节点插入及删除对已有节点编码值串无影响的更新策略。针对Ex-Dewey编码方案提出一种在... 为利用Dewey前缀编码索引方案实现对XML/GML文档的编码并消除其缺点,提出一种扩展的Dewey编码方案——Ex-Dewey。在保留Dewey前缀编码优点的同时提出节点插入及删除对已有节点编码值串无影响的更新策略。针对Ex-Dewey编码方案提出一种在XML/GML非空间数据查询时快速确定候选节点间先辈-子孙、父-子关系的结构化连接算法——ED-XQ-SJ。给出算法思想、描述与验证。该算法无须访问实际存储的节点,算法复杂度较低且I/O开销减少。 展开更多
关键词 可扩展标记语言 地理标记语言 编码索引 扩展Dewey编码 非空间数据查询 结构化连接
在线阅读 下载PDF
应用聚簇索引的多连接查询优化方法 被引量:3
11
作者 孟军 李建强 张大鲲 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第z1期186-189,共4页
多连接查询优化是提高数据库性能的关键问题之一.查询优化主要针对连接等一些具有较高执行代价的操作进行研究.在分布式查询优化中,应同时考虑本地处理代价和传输代价.提出了一种应用聚簇索引来优化多连接查询的方法,旨在减小查询的代价... 多连接查询优化是提高数据库性能的关键问题之一.查询优化主要针对连接等一些具有较高执行代价的操作进行研究.在分布式查询优化中,应同时考虑本地处理代价和传输代价.提出了一种应用聚簇索引来优化多连接查询的方法,旨在减小查询的代价.分析对比证明该方法具有较好的效果. 展开更多
关键词 查询优化 多连接 聚簇索引
在线阅读 下载PDF
Efficient processing of ordered XML twig pattern matching based on extended Dewey 被引量:1
12
作者 Jin-hua JIANG Ke CHEN +2 位作者 Xiao-yan LI Gang CHEN Li-dan SHOU 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第12期1769-1783,共15页
Finding all occurrences of a twig pattern is a core operation of extensible markup language (XML) query processing. Holistic twig join algorithms, which avoid a large number of intermediate results, represent the stat... Finding all occurrences of a twig pattern is a core operation of extensible markup language (XML) query processing. Holistic twig join algorithms, which avoid a large number of intermediate results, represent the state-of-the-art algorithms. However, ordered XML twig join is mentioned rarely in the literature and previous algorithms developed in attempts to solve the problem of ordered twig pattern (OTP) matching have poor performance. In this paper, we first propose a novel children linked stacks encoding scheme to represent compactly the partial ordered twig join results. Based on this encoding scheme and extended Dewey, we design a novel holistic OTP matching algorithm, called OTJFast, which needs only to access the labels of the leaf query nodes. Furthermore, we propose a new algorithm, named OTJFaster, incorporating three effective optimization rules to avoid unnecessary computations. This works well on available indices (such as B+-tree), skipping useless elements. Thus, not only is disk access reduced greatly, but also many unnecessary computations are avoided. Finally, our extensive experiments over both real and synthetic datasets indicate that our algorithms are superior to previous approaches. 展开更多
关键词 XML querying Ordered twig join index Optimization
原文传递
基于扩展区间编码的XML结构连接算法 被引量:3
13
作者 朱晓娟 《计算机工程》 CAS CSCD 北大核心 2010年第22期49-51,共3页
结构连接的效率直接影响XML查询的性能。经典的Anc-Des-B+算法在判断双亲/孩子关系时跳过双亲节点的后裔(非孩子)节点的能力不强。为此,基于区间编码的思想提出一种改进的编码方法,把每个节点译码为六元组,并增加双亲节点的信息。给出的... 结构连接的效率直接影响XML查询的性能。经典的Anc-Des-B+算法在判断双亲/孩子关系时跳过双亲节点的后裔(非孩子)节点的能力不强。为此,基于区间编码的思想提出一种改进的编码方法,把每个节点译码为六元组,并增加双亲节点的信息。给出的ZParent算法可以跳过孩子列表中所有不参与连接的元素节点,只需要扫描一次列表P和列表C,即可实现基于该编码的结构连接计算。实验结果表明,该方法具有较好的时间性能。 展开更多
关键词 XML查询 扩展区间编码 B+树索引 结构连接
在线阅读 下载PDF
基于位图连接索引的复杂多维层次的连接和聚集算法 被引量:1
14
作者 荀亚玲 张素兰 《通讯和计算机(中英文版)》 2007年第2期10-14,37,共6页
在ROLAP中往往涉及到大量数据的复杂即席查询,从SQL角度看,这些查询通常都包含多表连接和分组聚集操作。本文提出了一种连接和聚集操作的新算法JAMDHBJI,该算法充分考虑了ROLAP中复杂多维层次的特点,同时考虑到并非全部维都具有维... 在ROLAP中往往涉及到大量数据的复杂即席查询,从SQL角度看,这些查询通常都包含多表连接和分组聚集操作。本文提出了一种连接和聚集操作的新算法JAMDHBJI,该算法充分考虑了ROLAP中复杂多维层次的特点,同时考虑到并非全部维都具有维层次的语义特性,将维层次编码和位图连接索引有效结合,把复杂的连接和分组聚集操作转化为在事实表上的区域查询,从而大大提高了连接和分组聚集的效率。理论分析表明该算法是高效的。 展开更多
关键词 ROLAP 多表连接 聚集查询 维层次编码 位图连接索引
在线阅读 下载PDF
基于连接操作的反轮廓查询处理算法
15
作者 信俊昌 王培 +2 位作者 王之琼 王国仁 郭欣宇 《小型微型计算机系统》 CSCD 北大核心 2014年第10期2249-2255,共7页
反轮廓查询在制定有效的市场决策方面具有重要的作用.随着信息量的增加,数据库中跨表的数据查询变得十分普遍.深入分析了基于数据表连接操作的反轮廓查询处理的性质,结合网格索引结构和两种提前终止策略,提出基本反轮廓连接查询算法(Bas... 反轮廓查询在制定有效的市场决策方面具有重要的作用.随着信息量的增加,数据库中跨表的数据查询变得十分普遍.深入分析了基于数据表连接操作的反轮廓查询处理的性质,结合网格索引结构和两种提前终止策略,提出基本反轮廓连接查询算法(Basic Reverse Skyline Join Algorithm,BRSJ),并通过将半支配操作提至连接操作之前对算法进行了改进,提出改进的反轮廓连接算法(Progressive Reverse Skyline Join Algorithm,PRSJ).实验结果表明,两种提前终止策略可以有效的减少数据访问量,两种算法均能获得很高的性能,并且后者在时间性能上更优于前者.两个算法都大大提高了基于连接操作的反轮廓查询处理的性能. 展开更多
关键词 连接 反轮廓查询处理 网格索引 半支配
在线阅读 下载PDF
基于路径索引与编码模式的路径连接
16
作者 施伟斌 孙未未 +1 位作者 施伯乐 顾宁 《小型微型计算机系统》 CSCD 北大核心 2005年第4期618-623,共6页
在各种XML查询语言中普遍采用路径表达式来表示对象间的嵌套和引用关系,路径表达式的求解是查询处理中的一个关键问题.本文提出一种基于路径索引与编码模式的路径连接方法,利用路径索引能够以与路径长度成比例的时间求出对象的后代或祖... 在各种XML查询语言中普遍采用路径表达式来表示对象间的嵌套和引用关系,路径表达式的求解是查询处理中的一个关键问题.本文提出一种基于路径索引与编码模式的路径连接方法,利用路径索引能够以与路径长度成比例的时间求出对象的后代或祖先的目标集,利用编码模式则可以用常数时间确定对象之间的祖先—后代关系.实验结果表明,本文提出的方法具有较高的效率,当对大量对象进行连接以及当路径的长度、路径上结点的出度或入度较大时,本文提出的方法明显优于自顶向下或自底向上遍历的方法. 展开更多
关键词 XML 连接 路径索引 编码模式 查询处理
在线阅读 下载PDF
改进的多连接算法:Jive
17
作者 周英飚 倪志鹏 《计算机工程与应用》 CSCD 北大核心 2006年第12期180-182,共3页
新的利用连接索引的算法Jive,它用中间产生的临时文件和分割输出连接结果的方法,采用已有的数据结构-连接索引,只需要对输入关系的一次扫描,即可完成连接.在一般情况下优于Valduriez(1987)所提出的连接算法,在输入关系很大的情况下性能... 新的利用连接索引的算法Jive,它用中间产生的临时文件和分割输出连接结果的方法,采用已有的数据结构-连接索引,只需要对输入关系的一次扫描,即可完成连接.在一般情况下优于Valduriez(1987)所提出的连接算法,在输入关系很大的情况下性能尤为突出。 展开更多
关键词 查询 多连接算法 连接索引 Jive 数据结构
在线阅读 下载PDF
多版本数据仓库的查询优化设计
18
作者 鲍蓉 《计算机工程与应用》 CSCD 北大核心 2008年第28期143-145,共3页
多版本数据仓库中,不同数据仓库版本的维度实例可以共享存储。直接建立维度表与事实表的位图连接索引会产生大量无用的索引项,影响查询效率。给出了一种数据仓库版本的形式定义和维度实例的共享存储方式,并在此基础上设计了查询优化算法... 多版本数据仓库中,不同数据仓库版本的维度实例可以共享存储。直接建立维度表与事实表的位图连接索引会产生大量无用的索引项,影响查询效率。给出了一种数据仓库版本的形式定义和维度实例的共享存储方式,并在此基础上设计了查询优化算法DWVOQ,通过建立维度实例的版本视图及其与事实实例的连接索引来降低索引空间代价,提高索引查询效率。 展开更多
关键词 数据仓库版本 维度实例 连接索引 查询优化
在线阅读 下载PDF
基于层次位图连接索引的数据仓库查询优化 被引量:6
19
作者 周彦 陈梅 +1 位作者 王翰虎 敖飞 《计算机技术与发展》 2011年第3期40-43,共4页
在数据仓库的联机分析处理的查询处理中,经常会涉及到大量数据的复杂即席查询。用户通过提交联机分析处理查询对数据进行分析和决策支持,这通常需要较快的查询响应速度。因此,提高联机分析处理的查询性能就成为了数据仓库领域的关键问... 在数据仓库的联机分析处理的查询处理中,经常会涉及到大量数据的复杂即席查询。用户通过提交联机分析处理查询对数据进行分析和决策支持,这通常需要较快的查询响应速度。因此,提高联机分析处理的查询性能就成为了数据仓库领域的关键问题。为了提高数据仓库的查询性能,结合维表层次结构的特点,提出一种将分段位图索引和位图连接索引有效结合的方法。实验证明,该方法节省了位图索引的储存空间,减少了I/O开销,有效地提高了数据仓库的查询效率。 展开更多
关键词 OLAP 数据仓库 查询优化 分段位图索引 位图连接索引
在线阅读 下载PDF
基于CUDA的并行K-近邻连接算法实现 被引量:2
20
作者 潘茜 张育平 陈海燕 《计算机科学》 CSCD 北大核心 2016年第10期190-192,219,共4页
针对大规模空间数据的K-近邻连接查询问题,设计了一种CUDA编程模型下K-近邻连接算法的并行优化方法。将K-近邻连接算法的并行过程分两个阶段:1)对参与查询的数据集P和Q分别建立R-Tree索引;2)基于RTree索引进行KNNJ查询。首先根据结点所... 针对大规模空间数据的K-近邻连接查询问题,设计了一种CUDA编程模型下K-近邻连接算法的并行优化方法。将K-近邻连接算法的并行过程分两个阶段:1)对参与查询的数据集P和Q分别建立R-Tree索引;2)基于RTree索引进行KNNJ查询。首先根据结点所在位置划分最小外包框,在CUDA下基于递归网格排序算法创建RTree索引。然后在CUDA下基于R-Tree索引进行KNNJ查询,其中涉及并行求距离和并行距离排序两个阶段:求距离阶段利用每一个线程计算任意两点之间的距离,点与点之间距离的求取无依赖并行;排序阶段将快速排序基于CUDA以实现并行化。实验结果表明,随着样本量的不断增大,基于R-Tree索引的并行K-近邻连接算法的优势更加明显,具有高效性和可扩展性。 展开更多
关键词 CUDA K-近邻连接 空间查询 并行计算 R-Tree索引
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部