期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于学习排序的查询优化算法 被引量:1
1
作者 余阳 彭煜玮 《计算机科学》 北大核心 2025年第8期109-117,共9页
查询优化是关系型数据库中的关键环节。在传统的查询优化过程中,为了获得较优的执行计划,通常需要对查询中的连接和过滤操作进行基数估计。然而,基数估计存在不准确的问题,导致查询优化效果往往不尽如人意。目前,已有部分研究通过基于... 查询优化是关系型数据库中的关键环节。在传统的查询优化过程中,为了获得较优的执行计划,通常需要对查询中的连接和过滤操作进行基数估计。然而,基数估计存在不准确的问题,导致查询优化效果往往不尽如人意。目前,已有部分研究通过基于机器学习的方法改善基数估计问题并取得了一定进展。尽管这些方法在处理查询中数值类型的过滤谓词时表现较好,但对于其他复杂的过滤谓词效果不佳。为解决这一问题,文中提出了一种基于学习排序的查询优化算法。该算法能够为单一查询智能评估多个执行计划并排序,从而选择最佳计划执行。该查询优化算法通过迭代挖掘较优执行计划,并协同机器学习方法,最终筛选出最优计划。实验结果表明,该算法在常规数据集上的性能优于当前基于学习的查询优化算法,并且在复杂数据集中具有更加显著的优势。 展开更多
关键词 查询优化 计划生成 学习排序 数据库 连接顺序 连接类型 扫描类型
在线阅读 下载PDF
基于机器学习的数据库多表连接顺序选择研究综述
2
作者 王浩 高锦涛 王杰 《计算机工程》 北大核心 2025年第7期31-46,共16页
多表连接顺序选择是指在进行查询优化时为查询语句中涉及的多个表选择最优的连接顺序以提升查询性能。在复杂查询中,不同的表连接顺序能够显著影响查询执行效率。在大数据时代,面对庞大的数据集、多样的应用环境以及复杂的查询语句,基... 多表连接顺序选择是指在进行查询优化时为查询语句中涉及的多个表选择最优的连接顺序以提升查询性能。在复杂查询中,不同的表连接顺序能够显著影响查询执行效率。在大数据时代,面对庞大的数据集、多样的应用环境以及复杂的查询语句,基于启发式规则的传统多表连接顺序算法无法根据环境动态适应和自我学习,缺乏泛化能力,因此选择次优的多表连接顺序,甚至会严重影响查询性能。随着机器学习技术的蓬勃发展,面向数据库的人工智能(AI4DB)技术逐渐引领查询优化领域。机器学习技术能够解决传统连接顺序选择算法存在的问题,在自我学习以及场景适应方面具有较好表现。首先介绍连接顺序的传统选择算法,挖掘其存在的问题,然后总结当前主流的针对多表连接的机器学习模型,并分别介绍它们的核心技术方案,在效果、可用场景等方面对它们进行横向对比,为该领域后续科研工作者提供有价值的参考。 展开更多
关键词 数据库 查询优化 机器学习 连接顺序 面向数据库的人工智能
在线阅读 下载PDF
QJoin:质量驱动的乱序数据流连接处理技术 被引量:1
3
作者 魏星贝 李陶深 +2 位作者 许嘉 吕品 杨宁 《广西科学》 CAS 2020年第3期266-275,共10页
数据流乱序现象会导致数据流处理结果的丢失,给数据流的分析处理带来了巨大困难。本研究探讨了质量驱动下的乱序数据流连接处理问题,提出一种质量驱动的乱序数据流连接处理技术(QJoin)。QJoin采用缓冲存储技术和对称连接策略,实现并确... 数据流乱序现象会导致数据流处理结果的丢失,给数据流的分析处理带来了巨大困难。本研究探讨了质量驱动下的乱序数据流连接处理问题,提出一种质量驱动的乱序数据流连接处理技术(QJoin)。QJoin采用缓冲存储技术和对称连接策略,实现并确保对流元组进行即时分析处理,从而降低了流元组处理的平均等待时间。同时,基于质量驱动的理念,根据临近阶段连接处理过程中收集统计的数据,自适应地调整和优化内存缓存区的大小,从而在满足用户结果质量要求的前提下,降低系统内部历史数据的内存缓存量,尽可能保证迟到元组的连接处理完整性。真实数据集上的实验结果表明,与传统的数据流乱序处理技术MP-K-slack相比,QJoin在满足用户结果质量要求的前提下,确保能够即时地分析处理数据流的流元组,显著降低系统的内存开销。 展开更多
关键词 质量驱动 连接处理 乱序数据流 存储开销 流元组 缓存
在线阅读 下载PDF
Efficient processing of ordered XML twig pattern matching based on extended Dewey 被引量:1
4
作者 Jin-hua JIANG Ke CHEN +2 位作者 Xiao-yan LI Gang CHEN Li-dan SHOU 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2009年第12期1769-1783,共15页
Finding all occurrences of a twig pattern is a core operation of extensible markup language (XML) query processing. Holistic twig join algorithms, which avoid a large number of intermediate results, represent the stat... Finding all occurrences of a twig pattern is a core operation of extensible markup language (XML) query processing. Holistic twig join algorithms, which avoid a large number of intermediate results, represent the state-of-the-art algorithms. However, ordered XML twig join is mentioned rarely in the literature and previous algorithms developed in attempts to solve the problem of ordered twig pattern (OTP) matching have poor performance. In this paper, we first propose a novel children linked stacks encoding scheme to represent compactly the partial ordered twig join results. Based on this encoding scheme and extended Dewey, we design a novel holistic OTP matching algorithm, called OTJFast, which needs only to access the labels of the leaf query nodes. Furthermore, we propose a new algorithm, named OTJFaster, incorporating three effective optimization rules to avoid unnecessary computations. This works well on available indices (such as B+-tree), skipping useless elements. Thus, not only is disk access reduced greatly, but also many unnecessary computations are avoided. Finally, our extensive experiments over both real and synthetic datasets indicate that our algorithms are superior to previous approaches. 展开更多
关键词 XML querying ordered twig join Index Optimization
原文传递
基于Greenplum数据库的查询优化 被引量:6
5
作者 邹承明 谢义 吴佩 《计算机应用》 CSCD 北大核心 2018年第2期478-482,共5页
针对分布式数据库查询效率随着数据规模的增大而降低的问题,以Greenplum分布式数据库为研究对象,从优化查询路径的角度提出一个基于代价的最优查询计划生成方法。首先,该方法设计一种有效的代价模型来估算查询代价;然后,采用并行最大最... 针对分布式数据库查询效率随着数据规模的增大而降低的问题,以Greenplum分布式数据库为研究对象,从优化查询路径的角度提出一个基于代价的最优查询计划生成方法。首先,该方法设计一种有效的代价模型来估算查询代价;然后,采用并行最大最小蚁群算法来搜索具有最小查询代价的连接顺序,即最优连接顺序;最后,根据Greenplum数据库对查询计划中不同操作的默认最优选择得到最优查询计划。采用该方法在自主生成的数据集与事务处理性能理事会测试基准(TPC-H)的标准数据集上进行了多组实验。实验结果表明,所提出的优化方法能有效地搜索出最优解,获得最优的查询计划,从而提升Greenplum数据库的查询效率。 展开更多
关键词 分布式数据库 Greenplum数据库 最优查询计划 代价模型 最优连接顺序
在线阅读 下载PDF
一种改进的相容关系聚类算法 被引量:2
6
作者 万仁霞 苏晓珂 董晓亮 《计算机应用与软件》 CSCD 北大核心 2012年第2期69-71,79,共4页
聚类分析是数据挖掘中的一个重要研究内容。按照数据对象间的关系进行聚类在许多情况具有特殊的意义。提出一种相容关系数据对象的聚类算法。该算法首先对每个数据对象按字典排序,利用相容集的反单调性性质来产生极大相容簇,即通过相容... 聚类分析是数据挖掘中的一个重要研究内容。按照数据对象间的关系进行聚类在许多情况具有特殊的意义。提出一种相容关系数据对象的聚类算法。该算法首先对每个数据对象按字典排序,利用相容集的反单调性性质来产生极大相容簇,即通过相容集的连接产生更高层的相容集的候选,再通过剪枝的方法来得到更高层的相容集。该方法可以有效压缩算法的搜索空间,是现有相容关系聚类算法的有益改进和补充。 展开更多
关键词 聚类 相容集 字典排序 连接 剪枝
在线阅读 下载PDF
用于多表连接优化的深度强化学习嵌入表示 被引量:2
7
作者 王江晴 王雪言 +2 位作者 孙翀 帖军 尹帆 《计算机工程与设计》 北大核心 2023年第2期576-581,共6页
针对数据库查询优化中多表连接优化问题,任务是找到一个合适的连接顺序使查询执行计划最优,为此提出一种查询语句的嵌入表示方法SmartEncoder。通过优化查询语句中多表连接的嵌入表示信息,得到更丰富的关于连接的信息,将多表连接顺序选... 针对数据库查询优化中多表连接优化问题,任务是找到一个合适的连接顺序使查询执行计划最优,为此提出一种查询语句的嵌入表示方法SmartEncoder。通过优化查询语句中多表连接的嵌入表示信息,得到更丰富的关于连接的信息,将多表连接顺序选择优化建模为深度强化学习问题,根据动作的概率分布选择连接,从过去的经验中学习,生成更好的查询执行计划。在Join Order Benchmark数据集上的实验结果表明,SmartEncoder能够有效提高查询的效率。 展开更多
关键词 查询优化 多表连接优化 连接顺序 执行计划 嵌入表示 深度强化学习 查询效率
在线阅读 下载PDF
关于电感线圈的联接问题 被引量:4
8
作者 文盛乐 《大学物理》 北大核心 2005年第7期12-15,共4页
探讨了电感线圈的几种联接,得到了两线圈顺接并联时完全耦合的必要条件,以及n个线圈串联或并联时的电感计算公式.
关键词 电感线圈 串联 并联 顺接 反接
在线阅读 下载PDF
基于均衡割的无叉积分区连接算法
9
作者 贾连印 章永彬 +3 位作者 李孟娟 丁家满 游进国 陈玮 《昆明理工大学学报(自然科学版)》 CAS 2016年第1期52-56,共5页
连接序问题是数据库查询优化中最重要且最具挑战性的问题.传统的动态规划算法通常具有指数级复杂度.基于图形分割的相关理论,提出均衡割分区算法(BCP),通过均衡割将查询图分割成大小相对均衡的分区,避免一次性处理所有连接的关系.BCP算... 连接序问题是数据库查询优化中最重要且最具挑战性的问题.传统的动态规划算法通常具有指数级复杂度.基于图形分割的相关理论,提出均衡割分区算法(BCP),通过均衡割将查询图分割成大小相对均衡的分区,避免一次性处理所有连接的关系.BCP算法分区不会产生叉积,并且可以轻易地集成进任何查询优化器中.在Postgre SQL上实现了该算法,并和Postgre SQL现有的分区算法——迭代动态规划算法(IDP)进行对比.实验结果表明:对25个关系以内的随机连接查询,BCP不仅在平均效率上优于IDP算法,而且对分区大小变化也有更好的适应性. 展开更多
关键词 查询优化 连接序 均衡割 分区动态规划 叉积
原文传递
有序加权几何均值(OWG)算子的序结构 被引量:1
10
作者 李楠 樊太和 《浙江理工大学学报(自然科学版)》 2011年第1期131-134,154,共5页
讨论有序加权几何均值(OWG)算子的比较问题。将原有的OWG算子定义作了推广,从而使得OWG算子对闭单位区间的乘积上所有元素都有定义。证明了按照权重向量的序关系OWG算子集合构成一个完备格。在此基础上,给出了权重向量中的并不可约元的... 讨论有序加权几何均值(OWG)算子的比较问题。将原有的OWG算子定义作了推广,从而使得OWG算子对闭单位区间的乘积上所有元素都有定义。证明了按照权重向量的序关系OWG算子集合构成一个完备格。在此基础上,给出了权重向量中的并不可约元的结构,并给出了用并不可约元表示权重向量集合里的所有元素的方法。 展开更多
关键词 有序加权几何均值算子 算子比较 并不可约元
在线阅读 下载PDF
Dtrie-allpair:高效的集合T-覆盖连接算法 被引量:2
11
作者 贾连印 奚建清 +3 位作者 李孟娟 游进国 刘勇 苗德成 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第6期109-117,共9页
传统的T-覆盖连接算法会因生成的候选集庞大而导致系统性能降低,为此,文中提出了一种基于trie的动态索引结构——DTI结构,并构建了基于该结构的相似度连接算法——Dtrie-allpair算法.通过该算法可以直接得到allpair连接的结果,不产生任... 传统的T-覆盖连接算法会因生成的候选集庞大而导致系统性能降低,为此,文中提出了一种基于trie的动态索引结构——DTI结构,并构建了基于该结构的相似度连接算法——Dtrie-allpair算法.通过该算法可以直接得到allpair连接的结果,不产生任何候选集,有效解决了高候选集产生的问题,克服了传统算法因生成并验证候选集而带来的开销.文中还研究了数据库中记录的顺序及记录中元素顺序对Dtrie-allpair算法性能的影响,并在msweb、msnbc两个数据集下对Dtrie-allpair算法与All-pair、PPJoin算法进行对比.结果表明:Dtrie-allpair算法具有明显的优势,覆盖阈值较小时优势更明显;对msweb数据集,阈值为2时,Dtrie-allpair算法的效率相对于All-pair、PPJoin算法提高近两个数量级;通过对数据集进行频率降序和长度升序组合预处理可大幅降低Dtrie-allpair算法访问的trie结点数量,从而显著提升性能. 展开更多
关键词 集合相似度 T-覆盖连接 覆盖阈值 基于trie的动态索引 All-pair算法 PP-join算法 频率降序 长度升序
在线阅读 下载PDF
函数型和参数型曲线、曲面的GC^r阶光滑连接 被引量:1
12
作者 朱晓英 《苏州大学学报(自然科学版)》 CAS 2001年第4期30-37,共8页
对函数型和参数型曲线、曲面进行了研究 ,给出了具有GCr 阶 (r≥ 1)
关键词 过渡曲线 过渡曲面 GC^r阶光滑连接 凸曲线 凸曲面 函数型 参数型 几何造型 设计
在线阅读 下载PDF
XML查询结构连接顺序选择算法分析与优化
13
作者 张艺濒 谢金晶 《计算机技术与发展》 2007年第1期82-84,共3页
如今对XML查询的优化是对XML的热点研究方向。其中的结构连接操作是XML数据库查询的主要操作。和关系数据库中的连接运算一样,结构连接顺序的选择是XML数据库查询优化的核心。文中主要通过对XML查询优化中各种选择连接顺序算法的研究,... 如今对XML查询的优化是对XML的热点研究方向。其中的结构连接操作是XML数据库查询的主要操作。和关系数据库中的连接运算一样,结构连接顺序的选择是XML数据库查询优化的核心。文中主要通过对XML查询优化中各种选择连接顺序算法的研究,提出了一种优化的算法,在规模较大的XML查询中能够有效缩减搜索空间,提高效率。 展开更多
关键词 XML查询优化 结构连接顺序选择 动态规划
在线阅读 下载PDF
超盒粒代数系统
14
作者 刘宏兵 郭颂 《计算机工程与应用》 CSCD 2014年第9期53-55,共3页
研究了超盒粒的表示方法、超盒粒之间的偏序关系和超盒粒之间的运算,构造由粒集、超盒粒之间的偏序关系和算子组成的代数系统,给出了超盒粒的格代数系统的相关定理及其证明。
关键词 超盒粒 偏序关系 合并算子 分解算子 代数系统
在线阅读 下载PDF
C/SiC复合材料有序多孔陶瓷接头的制备及其连接技术研究
15
作者 王浩 周卿军 +2 位作者 简科 邵长伟 朱旖华 《无机材料学报》 SCIE EI CAS CSCD 北大核心 2013年第7期763-768,共6页
采用st ber法制备出单分散氧化硅小球,并以此为模板,结合先驱体转化技术成功制备出C/SiC复合材料纳米有序多孔陶瓷接头,并对该接头制备工艺条件作了优化。对制备出的C/SiC多孔陶瓷接头分别采用先连后浸法(SJM)和直接浸渍法(DSM)进行了... 采用st ber法制备出单分散氧化硅小球,并以此为模板,结合先驱体转化技术成功制备出C/SiC复合材料纳米有序多孔陶瓷接头,并对该接头制备工艺条件作了优化。对制备出的C/SiC多孔陶瓷接头分别采用先连后浸法(SJM)和直接浸渍法(DSM)进行了连接。结果显示,两种方法连接的连接件的抗弯强度分别达82.4和20.5 MPa,表明C/SiC多孔陶瓷接头采用SJM连接较好。 展开更多
关键词 C SIC复合材料 连接 先驱体转化技术 模板技术 有序多孔陶瓷接头
在线阅读 下载PDF
一种嵌入式实时数据库系统查询优化算法 被引量:5
16
作者 宋静静 贾智平 《计算机工程》 CAS CSCD 北大核心 2007年第11期90-92,共3页
针对嵌入式实时数据库系统的特点,提出了一种新的连接顺序优化算法(Greedy Iterative Improvement,GII)。该算法结合了贪婪算法和迭代改进算法的优点,能满足系统的实时要求,可以控制查询优化时间,比传统查询优化策略更好地适应不同类型... 针对嵌入式实时数据库系统的特点,提出了一种新的连接顺序优化算法(Greedy Iterative Improvement,GII)。该算法结合了贪婪算法和迭代改进算法的优点,能满足系统的实时要求,可以控制查询优化时间,比传统查询优化策略更好地适应不同类型事务的需要。模拟实验结果表明,该算法在穷举式搜索适用时,能以比它小得多的时间和内存开销找到最优解;在穷举式搜索无法实现优化时,GII算法生成解的质量也明显优于贪婪算法和迭代改进。 展开更多
关键词 嵌入式实时数据库系统 连接顺序 贪婪算法 迭代改进 查询优化
在线阅读 下载PDF
基于异步Dueling DQN和计划时间预测网络的连接优化器 被引量:1
17
作者 高瑞玮 乔少杰 +5 位作者 韩楠 闵圣捷 李贺 覃晓 张桃 元昌安 《电子学报》 EI CAS CSCD 北大核心 2023年第7期1868-1874,共7页
连接顺序选择是查询优化领域中极具挑战性的研究方向,对于数据库管理系统获得良好的查询性能至关重要.然而,传统优化方法和现有智能优化方法均存在着不足,如规划时间过长、容易得到质量较差的连接计划、编码未考虑结构特征、依赖基数估... 连接顺序选择是查询优化领域中极具挑战性的研究方向,对于数据库管理系统获得良好的查询性能至关重要.然而,传统优化方法和现有智能优化方法均存在着不足,如规划时间过长、容易得到质量较差的连接计划、编码未考虑结构特征、依赖基数估计和代价估计使得连接计划无法反映真实的执行时间等.针对上述问题,提出了一种新型基于异步Dueling DQN(Deep Q-network)和计划时间预测网络的连接优化器:ADP-Join(Asynchronous Dueling DQN and Plan Latency Prediction Network for Join Order Selection).ADP-Join集成了一种新的编码方法,能够区分不同结构的连接计划.ADP-Join设计了计划时间预测网络PLN(Plan Latency Prediction Network)来改善现有基于强化学习优化器的奖励机制.再者,提出异步更新机制改进Dueling DQN模型来提升训练性能和减少训练时间.大量的实验结果表明,在TPC-H和JOB真实数据集上ADP-Join的性能优于现有的智能优化器. 展开更多
关键词 连接顺序选择 查询优化 连接计划 强化学习 异步更新
在线阅读 下载PDF
多关系连接顺序选择与代价估计
18
作者 冯凯平 《微型电脑应用》 2012年第5期49-51,共3页
在关系数据库的关系连接中,关系较多时将导致优化器搜索空间的迅速膨胀,使得查询效率大幅度降低。因此,当数据关系的连接涉及到3个以上的关系操作时,如何选择各个关系之间连接顺序就显得格外重要。使用左偏连接树将各个关系按由小到大... 在关系数据库的关系连接中,关系较多时将导致优化器搜索空间的迅速膨胀,使得查询效率大幅度降低。因此,当数据关系的连接涉及到3个以上的关系操作时,如何选择各个关系之间连接顺序就显得格外重要。使用左偏连接树将各个关系按由小到大的顺序进行连接,可以达到减少磁盘访问次数、节省CPU及I/O时间开销的目的。结合实际课题应用,利用平均值统计法,给出了对多属性连接操作代价的估计方法和对多关系连接操作代价的估计方法。 展开更多
关键词 多关系连接 左偏树 顺序选择 代价估计 查询
在线阅读 下载PDF
算子方程复合迭代解法收敛阶的一种估计方法
19
作者 赵维加 《纺织基础科学学报》 1994年第4期343-346,352,共5页
给出多个迭代算子的复合迭代过程收敛阶的一种计算方法.
关键词 算子方程 复合迭代法 收敛阶 估计
在线阅读 下载PDF
数据库外基于多模型的学习式查询优化方法 被引量:6
20
作者 李广龙 申德荣 +1 位作者 聂铁铮 寇月 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第2期288-296,共9页
对于AI与数据库优化问题,现有技术均须改动数据库底层,影响研究成果的应用且缺乏可扩展性.提出一种非嵌入数据库的学习式查询优化方法.在基数估计阶段,使用多模型的方法,对特定的子查询建立神经网络,独立训练不同的子模型,解决需要训练... 对于AI与数据库优化问题,现有技术均须改动数据库底层,影响研究成果的应用且缺乏可扩展性.提出一种非嵌入数据库的学习式查询优化方法.在基数估计阶段,使用多模型的方法,对特定的子查询建立神经网络,独立训练不同的子模型,解决需要训练集过多且可扩展性差的问题;在连接优化阶段,应用基于代价的强化学习方法,提高查询优化性能.针对每个查询,从基数估计到连接排序的优化过程都在数据库外执行,按照得到的优化策略对查询重写,并将重写结果返回到数据库中,通过设置参数使该查询按照指定的计划执行.在包含8个表的数据集上进行实验验证,与未进行优化的查询进行比较,非嵌入数据库的优化方法具有良好的优化效果. 展开更多
关键词 查询优化 基数估计 连接排序 神经网络 强化学习
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部