期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
Semantic-based query processing for relational data integration 被引量:1
1
作者 苗壮 张亚非 +2 位作者 王进鹏 陆建江 周波 《Journal of Southeast University(English Edition)》 EI CAS 2011年第1期22-25,共4页
To solve the query processing correctness problem for semantic-based relational data integration,the semantics of SAPRQL(simple protocol and RDF query language) queries is defined.In the course of query rewriting,al... To solve the query processing correctness problem for semantic-based relational data integration,the semantics of SAPRQL(simple protocol and RDF query language) queries is defined.In the course of query rewriting,all relative tables are found and decomposed into minimal connectable units.Minimal connectable units are joined according to semantic queries to produce the semantically correct query plans.Algorithms for query rewriting and transforming are presented.Computational complexity of the algorithms is discussed.Under the worst case,the query decomposing algorithm can be finished in O(n2) time and the query rewriting algorithm requires O(nm) time.And the performance of the algorithms is verified by experiments,and experimental results show that when the length of query is less than 8,the query processing algorithms can provide satisfactory performance. 展开更多
关键词 data integration relational database simple protocol and rdf query language(SPARQL) minimal connectable unit query processing
在线阅读 下载PDF
A method for improving graph queries processing using positional inverted index (P.I.I) idea in search engines and parallelization techniques 被引量:2
2
作者 Hamed Dinari Hassan Naderi 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第1期150-159,共10页
The idea of positional inverted index is exploited for indexing of graph database. The main idea is the use of hashing tables in order to prune a considerable portion of graph database that cannot contain the answer s... The idea of positional inverted index is exploited for indexing of graph database. The main idea is the use of hashing tables in order to prune a considerable portion of graph database that cannot contain the answer set. These tables are implemented using column-based techniques and are used to store graphs of database, frequent sub-graphs and the neighborhood of nodes. In order to exact checking of remaining graphs, the vertex invariant is used for isomorphism test which can be parallel implemented. The results of evaluation indicate that proposed method outperforms existing methods. 展开更多
关键词 graph query processing frequent subgraph graph mining data mining positional inverted index
在线阅读 下载PDF
RDF数据查询处理技术综述 被引量:65
3
作者 杜方 陈跃国 杜小勇 《软件学报》 EI CSCD 北大核心 2013年第6期1222-1242,共21页
随着语义网以及信息抽取技术等研究的发展,Web上涌现出越来越多的RDF数据,海量RDF数据的管理,已经成为学术界和工业界研究的热点之一.从RDF数据集形态及RDF数据组织存储两个维度以及查询表述、查询处理、查询优化等方面,深入地分析和比... 随着语义网以及信息抽取技术等研究的发展,Web上涌现出越来越多的RDF数据,海量RDF数据的管理,已经成为学术界和工业界研究的热点之一.从RDF数据集形态及RDF数据组织存储两个维度以及查询表述、查询处理、查询优化等方面,深入地分析和比较了RDF数据查询处理方法,并在此基础上提出了未来研究的方向和挑战. 展开更多
关键词 rdf rdf数据管理 rdf查询处理 查询优化
在线阅读 下载PDF
Automated Performance Tuning of Data Management Systems with Materializations and Indices
4
作者 Nan N. Noon Janusz R. Getta 《Journal of Computer and Communications》 2016年第5期46-52,共7页
Automated performance tuning of data management systems offer various benefits such as improved performance, declined administration costs, and reduced workloads to database administrators (DBAs). Currently, DBAs tune... Automated performance tuning of data management systems offer various benefits such as improved performance, declined administration costs, and reduced workloads to database administrators (DBAs). Currently, DBAs tune the performance of database systems with a little help from the database servers. In this paper, we propose a new technique for automated performance tuning of data management systems. Firstly, we show how to use the periods of low workload time for performance improvements in the periods of high workload time. We demonstrate that extensions of a database system with materialised views and indices when a workload is low may contribute to better performance for a successive period of high workload. The paper proposes several online algorithms for continuous processing of estimated database workloads and for the discovery of the best plan for materialised view and index database extensions and of elimination of the extensions that are no longer needed. We present the results of experiments that show how the proposed automated performance tuning technique improves the overall performance of a data management system.   展开更多
关键词 Automated Performance Tuning query processing MATERIALIZATION indexING data management Systems
在线阅读 下载PDF
分布式RDF数据管理综述 被引量:15
5
作者 邹磊 彭鹏 《计算机研究与发展》 EI CSCD 北大核心 2017年第6期1213-1224,共12页
资源描述框架(resource description framework,RDF)作为一个展示、共享和连接网络上的数据的模型,已经被广泛地用在各种应用中.同时,SPARQL(simple protocol and RDF query language)作为一种结构化查询语言则被用来支持对RDF数据进行... 资源描述框架(resource description framework,RDF)作为一个展示、共享和连接网络上的数据的模型,已经被广泛地用在各种应用中.同时,SPARQL(simple protocol and RDF query language)作为一种结构化查询语言则被用来支持对RDF数据进行查询检索.随着RDF数据规模的日益增长,在现有RDF数据库上进行SPARQL查询处理已经超出了单机的处理能力.于是,人们需要设计出高性能的分布式RDF数据库以支持对SPARQL查询进行高效的处理.当前,已经有大量的工作来讨论如何搭建分布式RDF数据管理系统.对这些不同的分布式RDF数据管理方法进行综述,将现有的分布式RDF数据管理方法分成3类:基于云计算平台的分布式RDF数据管理方法、基于数据划分的分布式RDF数据管理方法和联邦式系统.基于云计算平台的分布式RDF数据管理方法利用已有云平台进行RDF数据的管理;基于数据划分的分布式RDF数据管理方法首先将RDF数据图划分成若干子图,然后将这些子图分配到不同计算节点上;联邦式系统的特点是数据已经分布在不同节点上,数据管理系统无法控制数据的分布.在每类分布式RDF数据管理方法的介绍中,将深入讨论以帮助读者了解各种方法的特点. 展开更多
关键词 rdf数据管理 SPARQL查询处理 分布式数据库系统 云计算 关联数据
在线阅读 下载PDF
高可扩展的RDF数据存储系统 被引量:9
6
作者 袁平鹏 刘谱 +1 位作者 张文娅 吴步文 《计算机研究与发展》 EI CSCD 北大核心 2012年第10期2131-2141,共11页
由于资源描述框架(resource description framework,RDF)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范.近年来,其数据量在以飞快的速度增长.相应地,要求存储RDF数据的系统应具有高扩展性.介绍了一个高可扩展... 由于资源描述框架(resource description framework,RDF)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范.近年来,其数据量在以飞快的速度增长.相应地,要求存储RDF数据的系统应具有高扩展性.介绍了一个高可扩展的RDF数据存储系统TripleBit.为尽可能降低存储空间消耗,采用了增量压缩和变长整数编码方法.并采用了数据分块的存储方法,既使得存储管理方便又使得存储结构紧凑,加速了数据读取.系统提供了基于启发式规则的动态查询计划生成方法,所产生的查询计划在执行过程中根据中间结果会相应作调整,以保持最优的执行顺序.对于多变量的查询,使用二步执行策略以减少查询过程中产生的中间结果.与目前流行RDF数据存储系统相比较,在存储空间上RDF-3X比TripleBit至少多40%;在查询性能上,比RDF-3X和MonetDB获得数倍的提升. 展开更多
关键词 资源描述框架 语义数据存储 数据编码 查询处理 查询计划
在线阅读 下载PDF
一种基于HBase的RDF数据存储模型 被引量:8
7
作者 朱敏 程佳 柏文阳 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期23-31,共9页
随着语义网数据的爆炸式增长,如何高效地管理海量RDF数据成为一个关键问题.现有的集中式关系型RDF数据存储管理系统已难以适应这种需求,越来越多的研究者使用分布式系统和并行计算技术来管理海量RDF数据.提出一种基于分布式数据库HBase... 随着语义网数据的爆炸式增长,如何高效地管理海量RDF数据成为一个关键问题.现有的集中式关系型RDF数据存储管理系统已难以适应这种需求,越来越多的研究者使用分布式系统和并行计算技术来管理海量RDF数据.提出一种基于分布式数据库HBase的RDF数据存储模型,根据OWL本体定义文件,将数据按类划分,同一类的三元组数据保存在该类的S_PO和O_PS两张表中,实现该存储模型上的8种Triple Pattern和Basic Graph Pattern查询算法,并提供部分推理功能,在Hadoop集群环境下对存储模型与查询算法进行了可行性验证. 展开更多
关键词 资源描述框架 语义数据存储 SPARQL 基本图模式 查询处理
在线阅读 下载PDF
基于查询计算的时态RDF关键词查询
8
作者 黎海霞 《湘南学院学报》 2022年第2期28-34,58,共8页
随着时态数据的大量增加,如何查询和管理时态数据成为了当前的研究热点.资源描述框架(RDF)作为语义网标准的数据和知识表示语言已经广泛用来表示各种领域的数据,如何表示和查询时态RDF就成为了新的研究焦点.目前的大多数研究都是致力于... 随着时态数据的大量增加,如何查询和管理时态数据成为了当前的研究热点.资源描述框架(RDF)作为语义网标准的数据和知识表示语言已经广泛用来表示各种领域的数据,如何表示和查询时态RDF就成为了新的研究焦点.目前的大多数研究都是致力于如何表示时态RDF以及如何能够利用标准的SPARQL引擎查询时态RDF,但是普通用户掌握不了时态RDF数据的查询语言及模式.文章提出了新的关键词查询算法:首先根据时态RDF的特点对时态RDF进行压缩形成摘要图;然后建立两个索引,一个是借助关键词与所在时态实体的索引,本索引首次将关键字中的时间与时态实体进行对应,另一个是应用向前路径搜索优先级索引更快找到top-K子图,将待查询的关键词构建成时态SPARQL查询;最后将时态SPARQL查询转换成标准SPARQL查询,并使用SPARQL搜索引擎执行查询.实验结果表明,本方法查准率优于300METIS、300BFS、1000METI、1000BFS的图查询方法. 展开更多
关键词 时态数据 rdf SPARQL 关键词查询 OPST索引
在线阅读 下载PDF
System Ⅱ:A Native RDF Repository Based on the Hypergraph Representation for RDF Data Model 被引量:2
9
作者 吴刚 李涓子 +1 位作者 胡建强 王克宏 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第4期652-664,共13页
RDF is the data interchange layer for the Semantic Web. an RDF repository should provide not only the necessary scalability In order to manage the increasing amount of RDF data, and efficiency, but also sufficient inf... RDF is the data interchange layer for the Semantic Web. an RDF repository should provide not only the necessary scalability In order to manage the increasing amount of RDF data, and efficiency, but also sufficient inference capabilities. Though existing RDF repositories have made progress towards these goals, there is still ample space for improving the overall performance. In this paper, we propose a native RDF repository, System H, to pursue a better tradeoff among system scalability, query efficiency, and inference capabilities. System II takes a hypergraph representation for RDF as the data model for its persistent storage, which effectively avoids the costs of data model transformation when accessing RDF data. Based on this native storage scheme, a set of efficient semantic query processing techniques are designed. First, several indices are built to accelerate RDF data access including a value index, a labeling scheme for transitive closure computation, and three triple indices. Second, we propose a hybrid inference strategy under the pD* semantics to support inference for OWL-Lite with a relatively low computational complexity. Finally, we extend the SPARQL algebra to explicitly express inference semantics in logical query plan by defining some new algebra operators. In addition, MD5 hash value of URI and schema level cache are introduced as practical implementation techniques. The results of performance evaluation on the LUBM benchmark and a real data set show that System Ⅱ has a better combined metric value than other comparable systems. 展开更多
关键词 rdf data management query processing index
原文传递
Incomplete data management: a survey 被引量:3
10
作者 Xiaoye MIAO Yunjun GAO +1 位作者 Su GUO Wanqi LIU 《Frontiers of Computer Science》 SCIE EI CSCD 2018年第1期4-25,共22页
Incomplete data accompanies our life processes and covers almost all fields of scientific studies, as a result of delivery failure, no power of battery, accidental loss, etc. However, how to model, index, and query in... Incomplete data accompanies our life processes and covers almost all fields of scientific studies, as a result of delivery failure, no power of battery, accidental loss, etc. However, how to model, index, and query incomplete data in- curs big challenges. For example, the queries struggling with incomplete data usually have dissatisfying query results due to the improper incompleteness handling methods. In this pa- per, we systematically review the management of incomplete data, including modelling, indexing, querying, and handling methods in terms of incomplete data. We also overview sev- eral application scenarios of incomplete data, and summa- rize the existing systems related to incomplete data. It is our hope that this survey could provide insights to the database community on how incomplete data is managed, and inspire database researchers to develop more advanced processing techniques and tools to cope with the issues resulting from incomplete data in the real world. 展开更多
关键词 incomplete data query processing indexing application SYSTEM
原文传递
时空数据查询技术研究综述 被引量:1
11
作者 孟祥福 翁雪 徐永杰 《计算机科学与探索》 北大核心 2025年第8期2001-2023,共23页
随着现代信息技术的快速发展与应用,时空数据的规模迅速增长。这些数据呈现出海量聚集、高维异构以及动态复杂等特点。近年来,以时空数据为背景的时空查询技术得到广泛的研究和应用,如何有效地存储、管理和查询这些数据成为了研究的重... 随着现代信息技术的快速发展与应用,时空数据的规模迅速增长。这些数据呈现出海量聚集、高维异构以及动态复杂等特点。近年来,以时空数据为背景的时空查询技术得到广泛的研究和应用,如何有效地存储、管理和查询这些数据成为了研究的重点。对时空数据的相关查询技术进行综述,从时空数据相关基本概念入手,系统阐述了当前主流的时空查询处理模式,涵盖了范围查询、K近邻查询、反K近邻查询等多种类型;介绍了不同的时空索引技术,包括基于轨迹的索引结构、基于抽样的索引以及其他创新的索引方法;分析了结合其他技术的查询方法,主要包括时空-文本查询、语义近似轨迹查询、并行和分布式查询等,这些技术不仅提升了时空查询的多样性和准确性,还能有效地处理大规模时空数据。展望了时空查询技术的未来发展方向,包括查询结果的可视化展示、隐私保护以及结合机器学习的新型索引结构,为时空数据的高效利用提供了新的思路和挑战。 展开更多
关键词 时空数据 查询处理 索引技术 时空-文本 语义近似 分布式
在线阅读 下载PDF
机器学习赋能的多维数据查询处理研究综述 被引量:4
12
作者 马超红 郝新丽 +1 位作者 孟小峰 张旭康 《计算机学报》 北大核心 2025年第1期100-123,共24页
多维数据的查询和处理在数据库中普遍存在。高效的多维数据查询处理,一方面依赖于精细的索引结构,例如R-tree、KD-tree等被广泛应用;另一方面,也有诸多工作探索利用硬件优势设计高效的数据布局,即研究面向扫描的数据处理策略以及构建数... 多维数据的查询和处理在数据库中普遍存在。高效的多维数据查询处理,一方面依赖于精细的索引结构,例如R-tree、KD-tree等被广泛应用;另一方面,也有诸多工作探索利用硬件优势设计高效的数据布局,即研究面向扫描的数据处理策略以及构建数据概要,避免高代价地访问原始数据。然而,随着数字化社会的发展,网络Web服务更加普及,传感器网络无处不在,诸如网约车、电子地图等基于位置的服务愈发盛行,使得多维数据正在以前所未有的速度产生,对查询处理提出新的要求,包括更快的查询响应、更低的存储占用。近年来,机器学习包括深度学习算法不断优化,且计算机等硬件环境持续发展,为多维数据查询处理带来更多的优化契机,不仅降低查询执行时间,同时能够节省存储资源,取得显著性优势。因此,机器学习被广泛应用于构建更好的数据管理和数据分析任务解决方案。该文提出机器学习赋能的多维数据查询处理研究框架,一方面介绍机器学习模型对多维索引结构的优化和改进;另一方面,介绍机器学习对不依赖索引结构的查询处理任务的赋能研究,包括数据布局策略和数据概要研究。在总结已有研究现状的基础上,指出该领域面临的挑战和未来研究方向。 展开更多
关键词 查询处理 多维学习化索引 数据布局 数据概要 机器学习
在线阅读 下载PDF
语义Web数据管理研究进展 被引量:16
13
作者 杜小勇 王琰 吕彬 《软件学报》 EI CSCD 北大核心 2009年第11期2950-2964,共15页
从数据存储组织、查询优化和处理、原型系统和基准测试等方面介绍当前RDF数据管理的研究进展和比较分析,讨论存在的问题并给出未来的研究方向.
关键词 语义WEB rdf数据 数据管理 索引 存储组织 查询优化
在线阅读 下载PDF
大数据处理框架下的高效存储与查询优化研究
14
作者 包煜玺 王俊人 《计算机应用文摘》 2025年第10期218-220,共3页
大数据处理框架在海量数据分析中扮演着关键角色,但存储与查询性能瓶颈严重影响其处理效率。针对现有处理框架中JVM内存管理、数据序列化和反序列化开销大、垃圾回收时间长等问题,文章提出了一种融合分层存储、内存数据布局优化和查询... 大数据处理框架在海量数据分析中扮演着关键角色,但存储与查询性能瓶颈严重影响其处理效率。针对现有处理框架中JVM内存管理、数据序列化和反序列化开销大、垃圾回收时间长等问题,文章提出了一种融合分层存储、内存数据布局优化和查询计划智能生成的综合解决方案。通过将热点数据集中存储于专用内存区域,采用列式存储结构,利用基于代价模型的查询计划优化,实现了对数据密集型应用的高效支持。实验结果表明,该方案较传统方法可减少50%的垃圾回收开销,提高约40%查询吞吐量,在大规模数据集上展现出良好的扩展性。 展开更多
关键词 大数据处理框架 高效存储 查询优化 JVM优化 内存管理
在线阅读 下载PDF
基于图结构特征采样数据摘要的联邦知识图谱查询 被引量:1
15
作者 高峰 李秋 顾进广 《计算机工程》 CAS CSCD 北大核心 2023年第1期73-81,共9页
联邦SPARQL查询是通过构建查询计划来指导查询执行,数据摘要索引文件捕获了RDF数据集的结构和语义信息,对查询计划生成过程中子查询基数评估至关重要。现有的数据摘要生成方法需要远程遍历每个数据源的完整数据,该过程成本消耗较高,且... 联邦SPARQL查询是通过构建查询计划来指导查询执行,数据摘要索引文件捕获了RDF数据集的结构和语义信息,对查询计划生成过程中子查询基数评估至关重要。现有的数据摘要生成方法需要远程遍历每个数据源的完整数据,该过程成本消耗较高,且在大部分环境中联邦查询无法完成对大数据集的统计工作。为在减少数据摘要索引文件生成时间和内存开销的同时捕获尽可能真实的计数信息,考虑主语和谓语的分布偏差,提出利用样图生成原始图近似数据摘要的方法。使用对RDF图出度特征加权的采样方法获取原始图的典型样图,通过改进的映射函数将样图中的信息映射到原始图上,从而生成原始图的近似数据摘要。实验结果表明,该方法相比于基线方法至少节省了70%的数据摘要索引文件生成时间,并且仅采样0.5%的原始图生成的近似数据摘要即可在查询正确率上与基线方法保持高度一致。 展开更多
关键词 数据摘要 数据源索引 rdf图采样 联邦查询 查询性能
在线阅读 下载PDF
轨迹大数据:数据、应用与技术现状 被引量:55
16
作者 许佳捷 郑凯 +3 位作者 池明旻 朱扬勇 禹晓辉 周晓方 《通信学报》 EI CSCD 北大核心 2015年第12期97-105,共9页
移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术... 移动互联技术的飞速发展催生了大量的移动对象轨迹数据。这些数据刻画了个体和群体的时空动态性,蕴含着人类、车辆、动物的行为信息,对交通导航、城市规划、车辆监控等应用具有重要的价值。为了实现有效的轨迹数据价值提取,近年来学术界和工业界针对轨迹管理问题开展了大量研究工作,包括轨迹数据预处理,以解决数据冗余高、精度差、不一致等问题;轨迹数据库技术,以支持有效的数据组织和高效的查询处理;轨迹数据仓库,支持大规模轨迹的统计、理解和分析;最后是知识提取,从数据中挖掘有价值的模式与规律。因此,综述轨迹大数据分析,从企业数据、企业应用、前沿技术这3个角度揭示该领域的现状。 展开更多
关键词 时空数据库 轨迹数据管理 数据索引 查询优化
在线阅读 下载PDF
HiBase:一种基于分层式索引的高效HBase查询技术与系统 被引量:56
17
作者 葛微 罗圣美 +6 位作者 周文辉 赵頔 唐云 周娟 曲文武 袁春风 黄宜华 《计算机学报》 EI CSCD 北大核心 2016年第1期140-153,共14页
大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主... 大数据时代,众多应用领域的数据量爆炸式增长,迫切需要研究和寻找有效的大数据存储管理方法,提供实时或准实时的大数据查询分析能力.Hadoop HBase系统为大数据的存储管理提供了一种具有高可扩展性的技术方法和系统平台.然而HBase只有主键索引,不支持非主键索引,这导致HBase的数据查询效率较低,难以满足数据实时或准实时查询需求.为此,在HBase基础上提供面向非主键的快速查询能力,是目前Hadoop环境下急需研究和解决的一个重要问题.该文研究提出了一种基于分层式HBase非主键索引的查询模型和方法,该模型和方法首先建立基于HBase的持久性索引.然后,为了利用内存提升查询性能,该文进一步提出了一种索引热点数据缓存技术和一种高效的热度累积缓存替换策略,以降低对HBase索引表的磁盘访问开销.热度累积缓存替换策略克服了最近最少使用(LRU)算法的局限性,考虑数据访问的累积热度和时间局部特性,从而更准确地捕获数据访问的特征.为了使索引热点数据缓存内存层具有良好的可扩展性,HiBase设计了基于一致性哈希的分布式内存缓存,支持高效的基于非主键的单点查询和范围查询.最终,该文设计实现了完整的分层式索引和查询系统HiBase.在千万至十亿条记录规模数据集上的测试结果表明,HiBase冷查询响应时间比标准HBase快65倍(大结果集)到3000多倍(小结果集);而引入基于查询热度累积算法的内存索引缓存方法后,热查询性能可在HiBase冷查询基础上再提升5~15倍,使得总体查询性能比标准HBase快300多倍(大结果集)到1.7万倍(小结果集),比开源的Hindex系统快5~20倍. 展开更多
关键词 HBASE 非主键索引 查询处理 分层式索引 缓存替换策略 大数据
在线阅读 下载PDF
CPU-GPU异构环境下的大规模商品知识查询处理 被引量:1
18
作者 方创新 宋浩 +1 位作者 林煜明 周娅 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期157-168,共12页
知识图谱是将无结构的知识进行结构化表示和组织的有效途径,已经成为支持众多智能应用的基础设施.然而,与商品相关的知识通常呈现出海量性、异质性和层次性的特点,这对现有基于关系模型和图模型的知识查询处理方法提出了挑战.针对商品... 知识图谱是将无结构的知识进行结构化表示和组织的有效途径,已经成为支持众多智能应用的基础设施.然而,与商品相关的知识通常呈现出海量性、异质性和层次性的特点,这对现有基于关系模型和图模型的知识查询处理方法提出了挑战.针对商品知识的这些特点,本文设计与实现了一种利用CPU和GPU协同计算的商品知识查询处理方法.首先,为了充分发挥GPU的并行计算能力,提出了一种基于稀疏矩阵的商品知识存储策略,并针对商品知识进行存储优化;其次,根据稀疏矩阵的存储结构设计了一种查询转换方式,将SPARQL查询转化为对应的矩阵计算,并将连接查询算法扩展到GPU上进行加速.为了验证所提出方法的有效性,我们在LUBM数据集和一个半合成的商品数据集上进行了一系列的实验.结果表明,本文提出的方法,不仅在海量商品知识下相对于现有RDF查询引擎在检索效率上有较大提升,而且在通用的RDF标准数据集上也能取得较好的检索性能,并验证了GPU加速查询处理的有效性. 展开更多
关键词 商品知识 异构环境 rdf数据 查询处理
在线阅读 下载PDF
云数据管理系统中查询技术研究综述 被引量:47
19
作者 史英杰 孟小峰 《计算机学报》 EI CSCD 北大核心 2013年第2期209-225,共17页
作为一种全新的互联网应用模式,云计算在工业界和学术界备受关注.人们可以通过终端设备便捷地获取云端服务,并以按需使用的方式获得存储资源、计算资源以及软硬件资源.云计算的发展带来了一系列挑战性问题,而云数据的管理问题首当其冲.... 作为一种全新的互联网应用模式,云计算在工业界和学术界备受关注.人们可以通过终端设备便捷地获取云端服务,并以按需使用的方式获得存储资源、计算资源以及软硬件资源.云计算的发展带来了一系列挑战性问题,而云数据的管理问题首当其冲.文中结合云数据的特点提出了一个云数据管理系统的框架,并在此基础上从索引管理、查询处理、查询优化以及在线聚集等几个方面对云数据管理系统中查询技术的研究工作进行了总结分析,指明了该领域面临的挑战和未来的研究工作. 展开更多
关键词 云计算 云数据管理 查询处理 查询优化 索引管理 在线聚集
在线阅读 下载PDF
基于NoSQL数据库的大数据查询技术的研究与应用 被引量:29
20
作者 朱建生 汪健雄 张军锋 《中国铁道科学》 EI CAS CSCD 北大核心 2014年第1期135-141,共7页
基于NoSQL数据库理论,根据应用场景的不同,将NoSQL数据库分为面向高性能读写、面向文档和面向分布式计算的3种类型。对比分析这3种类型数据库的6种代表产品的优缺点,结合铁路客票实名制售票信息综合分析系统中的大数据操作的需求,选用No... 基于NoSQL数据库理论,根据应用场景的不同,将NoSQL数据库分为面向高性能读写、面向文档和面向分布式计算的3种类型。对比分析这3种类型数据库的6种代表产品的优缺点,结合铁路客票实名制售票信息综合分析系统中的大数据操作的需求,选用NoSQL数据库中的面向分布式计算的Cassandra数据库。基于Cassandra数据库,提出铁路客票实名制信息综合分析系统的技术架构,并设计反向索引以构建客票实名制乘车信息的查询策略和查询流程。通过性能测试,验证了NoSQL数据库技术在处理大数据查询和分析中的高可用性,可突破传统关系型数据库和数据仓库在应用中所遇到的查询性能、扩展性以及投资成本的瓶颈。 展开更多
关键词 NOSQL数据库 Cassandra数据库 大数据处理 反向索引 数据查询
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部