-
题名基于改进DPhyp算法的Impala查询优化
被引量:2
- 1
-
-
作者
周强
陈岭
马骄阳
赵宇亮
吴勇
王敬昌
-
机构
浙江大学计算机科学与技术学院
浙江鸿程计算机系统有限公司
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第S2期114-120,共7页
-
基金
"核高基"国家重大科技专项基金项目(2010ZX01042-002-003)
国家自然科学基金项目(60703040)
+1 种基金
浙江省重大科技专项基金项目(2011C13042
2013C01046)
-
文摘
针对目前基于动态规划查询超图(dynamic programming hypergraphs,DPhyp)优化SQL查询算法产生指数运行时间、传统代价模型难以直接适用于Impala大数据实时查询系统等问题,提出基于改进DPhyp算法的Impala查询优化方法.首先,构建满足左线性树的搜索策略,缩小整个执行计划的搜索空间;接着,综合考虑数据移动代价及Hash join算法运行等关键因素,结合提出的代价模型,生成最佳的join顺序;最后,在生成的join顺序基础上构建执行计划,执行后返回最终查询结果.大量实验结果表明,改进的DPhyp算法与DPhyp生成的join顺序一致,且前者算法运行效率比后者要快近一倍.另外,改进的DPhyp算法结合提出的代价模型,比原始的Impala查询响应时间平均减少67%~80%.
-
关键词
查询超图
代价模型
Impala大数据实时查询
左线性树
执行计划
-
Keywords
query hypergraph
cost model
Impala big data real-time query
left deep tree
execution plan
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于遗传算法的关系数据库查询优化策略
被引量:8
- 2
-
-
作者
任美睿
李建中
李金宝
-
机构
黑龙江大学计算机科学技术学院
-
出处
《黑龙江大学自然科学学报》
CAS
2004年第3期64-67,共4页
-
基金
黑龙江大学青年科学基金
-
文摘
介绍基本遗传算法的基本思想和工作流程,针对数据库管理系统中最难处理和优化的连接操作,讨论在左深连接树的计划集合和浓密连接树的计划集合上的基于遗传算法的查询优化策略。同时通过具体的查询实例说明其左深度连接树和浓密连接树的染色体编码方法,并基于该编码方式进一步确定了基本遗传算法中其它的七个变元。
-
关键词
遗传算法
左深连接树
浓密连接树
查询计划树
-
Keywords
genetic algorithm
left-deep join tree
bushy join tree
query plan tree
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名列存储数据仓库中启发式查询优化机制
被引量:9
- 3
-
-
作者
严秋玲
孙莉
王梅
乐嘉锦
刘国华
-
机构
东华大学计算机科学与技术学院
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机学报》
EI
CSCD
北大核心
2011年第10期2018-2026,共9页
-
基金
核高基重大专项(2010ZX01042-001-003-004)
国家自然科学基金(61070031
61070032)资助~~
-
文摘
研究和实践表明列存储更加适合于大规模数据集上的即席查询的"读优化"应用需求.然而由于列存储的处理对象是列,此时传统的基于规则的查询优化方法并不完全适用.文中首先比较了列存储系统中查询优化与行存储系统的不同,在此基础上提出适合于列存储的启发式查询优化机制,其中包括启发式优化策略、重写规则、左深连接树结构和相关算法.实验表明:该文提出的启发式优化机制能有效减少候选计划的规模,排除大量不可能生成最优计划的计划,使得查询处理代价和执行时间大大减小.
-
关键词
列存储
查询优化
优化策略
重写规则
左深连接树
-
Keywords
column-store
query optimization
optimization strategy
rewrite rule
left-deep join tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-