期刊文献+
共找到463篇文章
< 1 2 24 >
每页显示 20 50 100
Cache-Conscious Index Mechanism for Main-Memory Databases 被引量:5
1
作者 SUN Li-mei SONG Bao-yan YU Ya-xin LI Fang-fang YU Ge 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期309-312,共4页
Recent studies have addressed that the cache be havior is important in the design of main memory index structures. Cache-conscious indices such as the CSB^+-tree are shown to outperform conventional main memory indic... Recent studies have addressed that the cache be havior is important in the design of main memory index structures. Cache-conscious indices such as the CSB^+-tree are shown to outperform conventional main memory indices such as the AVL-tree and the T-tree. This paper proposes a cacheconscious version of the T-tree, CST-tree, defined according to the cache-conscious definition. To separate the keys within a node into two parts, the CST-tree can gain higher cache hit ratio. 展开更多
关键词 index structure main memory database real time application cache-conscious T-tree indexing CST-tree indexing
在线阅读 下载PDF
An Efficient Crash Recovery Technique for Real-Time Main Memory Database 被引量:3
2
作者 XIAOYing-yuan LIUYun-sheng LIAOGuo-qiong LIANGPing 《Wuhan University Journal of Natural Sciences》 CAS 2005年第1期61-64,共4页
This paper presents an efficient recovery scheme suitable for real-time mainmemory database. In the recovery scheme, log records are stored in non-volatile RAM which is dividedinto four different partitions based on t... This paper presents an efficient recovery scheme suitable for real-time mainmemory database. In the recovery scheme, log records are stored in non-volatile RAM which is dividedinto four different partitions based on transaction types. Similarly, a main memory database isdivided into four partitions based data types. When the using ratio of log store area exceeds thethreshold value, checkpoint procedure is triggered. During executing checkpoint procedure, someuseless log records are deleted. During restart recovery after a crash, partition reloading policyis adopted to assure that critical data are reloaded and restored in advance, so that the databasesystem can be brought up before the entire database is reloaded into main memory. Therefore downtime is obvionsly reduced. Simulation experiments show our recovery scheme obviously improves thesystem performance, and does a favor to meet the dtadlints of real-time transactions. 展开更多
关键词 real-time main memory database crash recovery log scheme
在线阅读 下载PDF
Oracle In-Memory列存储技术的研究与应用
3
作者 关锦明 《现代信息科技》 2025年第20期87-91,共5页
关系数据库根据表数据存储方式,可分为行式数据库和列式数据库,分别适用于联机事务处理和统计分析场景。单一存储模式的数据库难以同时满足联机事务处理和复杂统计查询的性能需求。文章对比分析了行式与列式数据库的架构与特点,并研究了... 关系数据库根据表数据存储方式,可分为行式数据库和列式数据库,分别适用于联机事务处理和统计分析场景。单一存储模式的数据库难以同时满足联机事务处理和复杂统计查询的性能需求。文章对比分析了行式与列式数据库的架构与特点,并研究了In-Memory列存储技术所具备的“双模式”存储架构如何使Oracle数据库同时支持行存储与列存储。通过实际应用与性能测试验证,该技术能够在保持联机事务处理效率的同时,显著提升统计查询的性能。 展开更多
关键词 ORACLE数据库 In-memory列存储 行式数据库 列式数据库
在线阅读 下载PDF
Domain semantic mapping of database metasearch engine
4
作者 苗广祥 陈向阳 《Journal of Southeast University(English Edition)》 EI CAS 2007年第3期357-360,共4页
In order to implement semantic mapping of database metasearch engines, a system is proposed, which uses ontology as the organization form of information and records the new words not appearing in the ontology. When th... In order to implement semantic mapping of database metasearch engines, a system is proposed, which uses ontology as the organization form of information and records the new words not appearing in the ontology. When the new word' s frequency of use exceeds the threshold, it is added into the ontology. Ontology expansion is implemented in this way. The search process supports "and" and "or" Boolean operations accordingly. In order to improve the mapping speed of the system, a memory module is added which can memorize the recent query information of users and automatically learn the user' s query interest during the mapping which can dynamically decide the search order of instances tables. Experiments prove that these measures can obviously reduce the average mapping time. 展开更多
关键词 ONTOLOGY domain mapping database metasearch engine memory module
在线阅读 下载PDF
A New Database Intrusion Detection Approach Based on Hybrid Meta-Heuristics 被引量:9
5
作者 Youseef Alotaibi 《Computers, Materials & Continua》 SCIE EI 2021年第2期1879-1895,共17页
A new secured database management system architecture using intrusion detection systems(IDS)is proposed in this paper for organizations with no previous role mapping for users.A simple representation of Structured Que... A new secured database management system architecture using intrusion detection systems(IDS)is proposed in this paper for organizations with no previous role mapping for users.A simple representation of Structured Query Language queries is proposed to easily permit the use of the worked clustering algorithm.A new clustering algorithm that uses a tube search with adaptive memory is applied to database log files to create users’profiles.Then,queries issued for each user are checked against the related user profile using a classifier to determine whether or not each query is malicious.The IDS will stop query execution or report the threat to the responsible person if the query is malicious.A simple classifier based on the Euclidean distance is used and the issued query is transformed to the proposed simple representation using a classifier,where the Euclidean distance between the centers and the profile’s issued query is calculated.A synthetic data set is used for our experimental evaluations.Normal user access behavior in relation to the database is modelled using the data set.The false negative(FN)and false positive(FP)rates are used to compare our proposed algorithm with other methods.The experimental results indicate that our proposed method results in very small FN and FP rates. 展开更多
关键词 Adaptive search memory clustering database management system(DBMS) intrusion detection system(IDS) quiplets structured query language(SQL) tube search
在线阅读 下载PDF
PLTree:一个高性能持久化内存学习索引
6
作者 张志国 谢钟乐 +1 位作者 陈珂 寿黎但 《软件学报》 北大核心 2025年第5期2321-2341,共21页
持久化内存(persistent memory,PM)作为主存的补充和替代,为数据存储提供了相对较低的价格成本,并且保证了数据的持久化.为PM设计的传统结构索引(如B+树等)未能充分利用数据分布特点来发挥索引在PM上的读写性能.最近的研究尝试利用学习... 持久化内存(persistent memory,PM)作为主存的补充和替代,为数据存储提供了相对较低的价格成本,并且保证了数据的持久化.为PM设计的传统结构索引(如B+树等)未能充分利用数据分布特点来发挥索引在PM上的读写性能.最近的研究尝试利用学习索引的数据分布感知能力提升索引在PM上的读写性能并实现持久化.但在面对真实世界的数据时,现有基于PM的持久化学习索引的数据结构设计会导致额外的内存访问,从而影响读写性能.针对PM学习索引在面对真实数据时读写性能下降的问题,提出一种DRAM/PM混合架构的学习索引PLTree.它通过以下方法提升在PM上的读写性能并减轻数据分布颠簸对性能的影响:(1)使用两阶段方法构建索引消除内部节点的局部搜索,减少PM的访问.(2)利用模型搜索来优化PM上的查找性能并通过在DRAM存储元数据加速查找.(3)根据PM的特性设计了日志式分层溢出缓存结构,优化写入性能.实验结果表明,在不同数据集上,与现有的持久化内存索引(APEX,FPTree,uTree,NBTree和DPTree)相比,PLTree在索引构建性能上平均提升了约1.9–34倍;单线程查询/插入性能平均提升了约1.26–4.45倍和2.63–6.83倍;在多线程场景,查询/插入性能最高提升了约10.2倍和23.7倍. 展开更多
关键词 学习型索引 持久化内存 持久化内存索引 数据库
在线阅读 下载PDF
面向远程内存图数据库的应用感知分离式存储设计
7
作者 李纯羽 邓龙 +1 位作者 李永坤 许胤龙 《计算机科学》 北大核心 2025年第1期151-159,共9页
图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注.对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素.随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数... 图数据在各种应用中日益普及,其因涵盖多种实体类型和存在丰富的关联关系而备受关注.对于图数据库用户而言,高效的图查询服务是保障系统性能的关键因素.随着数据量增加,单机图数据库很难满足将所有数据存储在内存中的需求,而分布式图数据库在拓展性和资源利用率方面受到挑战.基于RDMA的远程内存系统的引入为克服这些挑战提供了一种新的选择,通过分离计算和存储资源,实现了更为灵活的内存使用方式.然而,在使用远程内存的情况下如何最大程度地优化图查询性能成为了当前研究的重点问题.文中首先分析了利用操作系统分页机制透明使用远程内存构建图数据库存在的问题,并在应用层次上设计了远程内存图数据库的存储模型.根据不同数据的特点和访问模式,设计了属性图在远程内存中的存储结构,优化了数据布局和访问路径.实验结果表明,在本地内存受限的情况下,与透明使用远程内存相比,应用感知的设计方式的端到端性能最高提升了12倍. 展开更多
关键词 图查询 图数据库 图存储 远程内存 属性图模型
在线阅读 下载PDF
The Multi-level Recovery of Main-memory Real-time Database Systems with ECBH
8
作者 ZOU Yong-gui, GE Jun-wei (College of Computer Science and Technology, Chonqqing University of Posts and Telecommunications, Chongqing 400065, P.R. China) 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2003年第1期15-24,共10页
Storing the whole database in the main-memory is a common method to processreal-time transaction in real-time database systems. The recovery mechanism of Main-memory Real-timeDatabase Systems (MMRTDBS) should reflect ... Storing the whole database in the main-memory is a common method to processreal-time transaction in real-time database systems. The recovery mechanism of Main-memory Real-timeDatabase Systems (MMRTDBS) should reflect the characteristics of the main-memory database andreal-time database because their structures are quite different from other conventional databasesystems. In this paper, therefore, we propose a multi-level recovery mechanism for main-memoryreal-time database systems with Extendable Chained Bucket Hashing (ECBH). Owing to the occurrence ofreal-time data in real-time systems, we should also consider it in our recovery mechanism .According to our performance test, this mechanism can improve the transaction concurrency, reducingtransactions ' deadline missing rate. 展开更多
关键词 DBMS multi-level recovery HASH main- memory database real-time
原文传递
基于知识图谱的中国图书馆学人数字记忆平台构建研究 被引量:1
9
作者 张文亮 陈重阳 李璇 《高校图书馆工作》 2025年第2期58-67,共10页
图书馆的历史不仅是社会文化发展的历史,也是图书馆学人传承文明、服务社会的历史。构建图书馆学人数字记忆,于公众层面,有助于增进大众对中国图书馆事业发展脉络及重要学术人物的认知;于专业领域,在图书馆学人精神传承、知识挖掘与发... 图书馆的历史不仅是社会文化发展的历史,也是图书馆学人传承文明、服务社会的历史。构建图书馆学人数字记忆,于公众层面,有助于增进大众对中国图书馆事业发展脉络及重要学术人物的认知;于专业领域,在图书馆学人精神传承、知识挖掘与发现、揭示图书馆学人的研究领域与价值等方面具有独特价值。研究以《中国图书馆事业开拓者:杜定友》为例,以图书馆学人为核心,从时空维度构建了中国图书馆学人本体模型。结合实体识别、词性标注、正则化表达式等自动化方法与人工标引方法从传记文本中提取实体与关系,并通过Neo4j构建中国图书馆学人知识图谱。最终,基于中国图书馆学人本体模型,构建了中国图书馆学人数字记忆平台,包含人物简介、作品检索、大事年表、知识图谱、时空轨迹及智能问答等6项功能,能够为中国图书馆学人记忆的保护与传承提供有力支撑。 展开更多
关键词 图书馆学人 知识图谱 专题数据库 数字记忆 数字人文
在线阅读 下载PDF
保温板生产线故障知识图谱构建方法研究
10
作者 王言韬 华德正 +1 位作者 MD ABDULLAH AL MIRAJ 刘新华 《制造业自动化》 2025年第8期124-130,共7页
当前保温板生产线设备的故障诊断手段缺乏对历史故障数据的系统整理和有效利用,针对该问题,研究提出一种保温板生产线故障知识图谱构建方法。首先,在模式层上,分析选取的故障知识特点,设计定义保温板生产线故障知识本体。其次,在数据层... 当前保温板生产线设备的故障诊断手段缺乏对历史故障数据的系统整理和有效利用,针对该问题,研究提出一种保温板生产线故障知识图谱构建方法。首先,在模式层上,分析选取的故障知识特点,设计定义保温板生产线故障知识本体。其次,在数据层上,对多源故障数据进行预处理和序列标注,形成可用于实验的数据集。基于此数据,引入BERT-BiLSTM-CRF等深度学习模型进行实体识别。基于句法树对实体进行关系匹配,形成三元组数据。最后,采用Neo4j图数据库存储三元组信息,完成生产线故障知识图谱构建。研究结果表明:实体识别模型的精确度84.84%,召回率89.88%,F1值为87.29%,根据此构建的保温板生产线故障知识图谱可实现对故障知识的有效利用以及对故障原因的精确解释,研究结果可为保温板生产线故障诊断提供知识支持。 展开更多
关键词 生产线 知识图谱 故障诊断 实体识别 图数据库 双向长短期记忆网络
在线阅读 下载PDF
基于cgroup的数据库内存超限冻结方法
11
作者 杨铸 高琳 《智能计算机与应用》 2025年第1期75-80,共6页
分布式数据库作为一种大数据应用软件,需要使用有限的系统资源完成复杂并发计算和存储任务。海量的数据计算对内存需求也很大,为了多任务资源隔离,需要对不同任务组进行内存限制。当内存超限(OOM)时,操作系统默认强制杀死进程是高风险... 分布式数据库作为一种大数据应用软件,需要使用有限的系统资源完成复杂并发计算和存储任务。海量的数据计算对内存需求也很大,为了多任务资源隔离,需要对不同任务组进行内存限制。当内存超限(OOM)时,操作系统默认强制杀死进程是高风险行为。为此,本文从一个简化应用开始,探求一种基于Linux内核控制群组(cgroup)功能的内存超限进程冻结与解冻技术,并应用于开源的Greenplum Database分布式数据库。 展开更多
关键词 大数据 分布式数据库 控制群组 内存
在线阅读 下载PDF
智能终端数据中心性能优化技术研究
12
作者 陆寒熹 蒋长献 李雨晴 《电工电气》 2025年第10期71-76,共6页
在大规模、高频数据采集场景中,如何高效管理和存储数据成为亟待解决的问题。围绕智能终端数据存储性能优化和数据安全性保障,从读写性能优化、数据安全性设计以及主动预防策略三个角度提出了优化方法。通过引入数据分仓、内存数据库与... 在大规模、高频数据采集场景中,如何高效管理和存储数据成为亟待解决的问题。围绕智能终端数据存储性能优化和数据安全性保障,从读写性能优化、数据安全性设计以及主动预防策略三个角度提出了优化方法。通过引入数据分仓、内存数据库与缓存技术,并基于写入放大因子进行分析,设计了一个测试系统评估优化措施对性能和存储寿命的影响。实验结果表明,优化后的数据存储系统显著提高了数据读写性能,尤其在高频访问和大规模数据场景下表现优异,数据读性能提升48.9%,写性能提升57.6%;同时通过优化写入放大因子,eMMC存储器写入数据量减少至原来的4.9%,有效延长了存储设备寿命,提升了数据安全性。 展开更多
关键词 智能终端 存储性能 内存数据库 数据缓存 数据安全性 主动预防策略
在线阅读 下载PDF
基于时序数据库与长度记忆网络的网络行为分析模型的研究
13
作者 薛杉 李川 田杰 《自动化与仪表》 2025年第5期129-133,共5页
当前高校大学生网络行为问题突出,如何营造一个良好的校园网络环境是一个重要课题。该文研究时序网络行为数据收集、处理、存储的过程,构建TSDB+LSTM的网络行为分析模型。设计网络行为时序数据结构,基于时间戳的B-Tree索引结构,基于指... 当前高校大学生网络行为问题突出,如何营造一个良好的校园网络环境是一个重要课题。该文研究时序网络行为数据收集、处理、存储的过程,构建TSDB+LSTM的网络行为分析模型。设计网络行为时序数据结构,基于时间戳的B-Tree索引结构,基于指数平滑的预测模型,NLC数据压缩、数据聚合优化、元数据优化等。通过基于Attention机制的CNN-LSTM模型,进行网络行为识别。采用开源的InfluxDB对模型进行实验,以points结构组织数据,使用TSDB+LSTM模型在不同学生数时进行实验,并与其他模型进行了对比实验,计算均方误差、准确率,该模型均表现良好。该模型有助于高校有效的管理学生,构建更加科学、完善的网络行为管理和引导体系。 展开更多
关键词 时序数据库 长短记忆法 网络行为 卷积神经网络
在线阅读 下载PDF
Preliminary abnormal electrocardiogram segment screening method for Holter data based on long short-term memory networks 被引量:2
14
作者 Siying Chen Hongxing Liu 《Chinese Physics B》 SCIE EI CAS CSCD 2020年第4期208-214,共7页
Holter usually monitors electrocardiogram(ECG)signals for more than 24 hours to capture short-lived cardiac abnormalities.In view of the large amount of Holter data and the fact that the normal part accounts for the m... Holter usually monitors electrocardiogram(ECG)signals for more than 24 hours to capture short-lived cardiac abnormalities.In view of the large amount of Holter data and the fact that the normal part accounts for the majority,it is reasonable to design an algorithm that can automatically eliminate normal data segments as much as possible without missing any abnormal data segments,and then take the left segments to the doctors or the computer programs for further diagnosis.In this paper,we propose a preliminary abnormal segment screening method for Holter data.Based on long short-term memory(LSTM)networks,the prediction model is established and trained with the normal data of a monitored object.Then,on the basis of kernel density estimation,we learn the distribution law of prediction errors after applying the trained LSTM model to the regular data.Based on these,the preliminary abnormal ECG segment screening analysis is carried out without R wave detection.Experiments on the MIT-BIH arrhythmia database show that,under the condition of ensuring that no abnormal point is missed,53.89% of normal segments can be effectively obviated.This work can greatly reduce the workload of subsequent further processing. 展开更多
关键词 ELECTROCARDIOGRAM LONG SHORT-TERM memory network kernel density estimation MIT-BIH ARRHYTHMIA database
原文传递
Real-Time Memory Data Optimization Mechanism of Edge IoT Agent
15
作者 Shen Guo Wanxing Sheng +2 位作者 Shuaitao Bai Jichuan Zhang Peng Wang 《Intelligent Automation & Soft Computing》 SCIE 2023年第7期799-814,共16页
With the full development of disk-resident databases(DRDB)in recent years,it is widely used in business and transactional applications.In long-term use,some problems of disk databases are gradually exposed.For applica... With the full development of disk-resident databases(DRDB)in recent years,it is widely used in business and transactional applications.In long-term use,some problems of disk databases are gradually exposed.For applications with high real-time requirements,the performance of using disk database is not satisfactory.In the context of the booming development of the Internet of things,domestic real-time databases have also gradually developed.Still,most of them only support the storage,processing,and analysis of data values with fewer data types,which can not fully meet the current industrial process control system data types,complex sources,fast update speed,and other needs.Facing the business needs of efficient data collection and storage of the Internet of things,this paper optimizes the transaction processing efficiency and data storage performance of the memory database,constructs a lightweight real-time memory database transaction processing and data storage model,realizes a lightweight real-time memory database transaction processing and data storage model,and improves the reliability and efficiency of the database.Through simulation,we proved that the cache hit rate of the cache replacement algorithm proposed in this paper is higher than the traditional LRU(Least Recently Used)algorithm.Using the cache replacement algorithm proposed in this paper can improve the performance of the system cache. 展开更多
关键词 Disk resident database real-time database main memory database internet of things industrial process control
在线阅读 下载PDF
基于cGAN-SAE的室内定位指纹生成方法 被引量:2
16
作者 刘伟 王智豪 +1 位作者 李卓 韦嘉恒 《电子测量技术》 北大核心 2024年第14期57-63,共7页
针对室内定位中指纹采集成本高、构建数据集难等问题,提出了一种基于条件稀疏自编码生成对抗网络的室内定位指纹生成方法。该方法通过增加自编码器隐藏层和输出层,增强了特征提取能力,引导生成器学习并生成指纹数据的关键特征。利用指... 针对室内定位中指纹采集成本高、构建数据集难等问题,提出了一种基于条件稀疏自编码生成对抗网络的室内定位指纹生成方法。该方法通过增加自编码器隐藏层和输出层,增强了特征提取能力,引导生成器学习并生成指纹数据的关键特征。利用指纹选择算法筛选出最相关的指纹数据,扩充至指纹数据库中,并用于训练卷积长短时记忆网络模型以进行在线效果评估。实验结果表明,条件稀疏自编码生成对抗网络在不增加采集样本的情况下,提高了多栋多层建筑室内定位的精度。与原始条件生成对抗网络模型相比,在UJIIndoorLoc数据集上的预测中,定位误差降低了6%;在实际应用中,定位误差降低了14%。 展开更多
关键词 室内定位 稀疏自编码器 指纹数据库 条件生成对抗网络 卷积长短时记忆网络
原文传递
卷烟滤棒成型加工区域集控系统实现 被引量:2
17
作者 段青娜 沙利波 +3 位作者 罗运河 邱潇 高阔 杨四林 《机械工程与自动化》 2024年第3期147-149,共3页
针对滤棒成型作业区分散、设备种类多、制造厂家和数量多、接口协议复杂且不统一以及海量数据变量难识别等问题,设计并开发了基于OPC UA架构和实时内存数据库的就地滤棒加工区数采和监控系统。自主开发OPC服务器,实现了滤棒成型主、辅... 针对滤棒成型作业区分散、设备种类多、制造厂家和数量多、接口协议复杂且不统一以及海量数据变量难识别等问题,设计并开发了基于OPC UA架构和实时内存数据库的就地滤棒加工区数采和监控系统。自主开发OPC服务器,实现了滤棒成型主、辅设备的实时数据采集,并通过高效内存数据库服务器对生产及设备信息进行海量存储,进而实现了对滤棒成型车间生产过程信息的全面、准确迁移集成,以及对滤棒生产、产量、质量、机台效率、设备状态等信息的可视化区域集控。 展开更多
关键词 滤棒成型加工 区域集控 OPC UA 实时内存数据库
在线阅读 下载PDF
MMOS:支持超卖的多租户数据库内存资源共享方法 被引量:1
18
作者 徐海洋 刘海龙 +2 位作者 杨超云 王硕 李战怀 《计算机科学》 CSCD 北大核心 2024年第2期27-35,共9页
多租户数据库为每个租户分配固定的资源配额,而这些资源配额通常未全部得到有效利用,这种静态分配策略导致资源利用率不高。若在不影响租户性能的前提下将未利用的空闲资源共享给其他租户使用,即实现资源超卖,则可以提高资源利用率、提... 多租户数据库为每个租户分配固定的资源配额,而这些资源配额通常未全部得到有效利用,这种静态分配策略导致资源利用率不高。若在不影响租户性能的前提下将未利用的空闲资源共享给其他租户使用,即实现资源超卖,则可以提高资源利用率、提升平台收益。为了支持资源超卖,需要准确预测租户的资源需求,动态地按需为租户分配资源。已有的针对多租户数据库的资源共享方法的研究对象主要是CPU资源,鲜有支持超卖的内存资源共享方法。鉴于此,在联机分析处理场景下,提出了一种支持超卖的多租户数据库内存资源共享方法MMOS(Multi-tenant database Memory resource Overselling and Sharing)。该方法通过准确预测每个租户的内存需求区间,按照区间上限为租户动态调整内存配额,在不影响租户性能的前提下,统一管理空闲内存资源以支持更多租户,实现内存超卖。实验结果表明,MMOS在租户负载动态变化的场景下具有较好效果。在不同资源量的资源池下,支持的租户数可以增加2~2.6倍,资源利用率峰值提升175%~238%。同时,每个租户的业务与性能未受影响。 展开更多
关键词 多租户数据库 资源超卖 内存资源 资源预测 资源分配
在线阅读 下载PDF
面向内存数据库的类字典树索引综述与性能比较 被引量:4
19
作者 储召乐 罗永平 金培权 《计算机学报》 EI CAS CSCD 北大核心 2024年第9期2009-2034,共26页
如何快速存取海量数据是大数据时代数据库系统面临的重大挑战.利用大内存构建内存数据库系统是实现大数据实时存取的可行途径.在此背景下,用于加速内存数据存取的内存数据库索引成为近几年国内外的研究热点.但是,内存数据库索引也面临... 如何快速存取海量数据是大数据时代数据库系统面临的重大挑战.利用大内存构建内存数据库系统是实现大数据实时存取的可行途径.在此背景下,用于加速内存数据存取的内存数据库索引成为近几年国内外的研究热点.但是,内存数据库索引也面临着诸多挑战.以常见的内存B+树索引为例,第一个问题是索引的空间效率较低,这是因为内存B+树索引的节点内部存在较大的空间浪费;第二个问题是索引的查询复杂度较高,B+树的查询复杂度受限于数据规模,随着数据规模的扩张,索引的搜索效率也会下降;第三个问题是变长数据支持弱,B+树对于变长键的支持比较差,往往难以适应实际应用的需要.近年来,由于字典树具有空间代价低、查询效率与数据规模无关、支持变长键等优点,逐步成为了内存数据库索引研究中的一个主要方向.本论文围绕面向内存数据库的类字典树索引,首先介绍了字典树的概念、特点和历史,然后系统梳理和总结了类字典树索引的现状和最新进展,之后提出了一种全新的分类方法对类字典树索引进行了分类.在此基础上,论文对主流的六种类字典树索引进行了实验,在多个数据集和负载上进行了性能对比,并基于实验结果讨论了类字典树索引的设计和使用建议,最后展望了未来类字典树索引的发展方向. 展开更多
关键词 内存数据库 字典树索引 性能对比
在线阅读 下载PDF
SQL-to-text模型的组合泛化能力评估方法 被引量:1
20
作者 陈琳 范元凯 +3 位作者 何震瀛 刘晓清 杨阳 汤路民 《计算机工程》 CAS CSCD 北大核心 2024年第3期326-335,共10页
数据库的结构化查询语言(SQL)到自然语言的翻译(SQL-to-text)能提高关系数据库的易用性。近年来该领域主要使用机器学习的方法进行研究并已取得一定进展,然而现有翻译模型的能力仍不足以投入实际应用。由于组合泛化能力是SQL-to-text模... 数据库的结构化查询语言(SQL)到自然语言的翻译(SQL-to-text)能提高关系数据库的易用性。近年来该领域主要使用机器学习的方法进行研究并已取得一定进展,然而现有翻译模型的能力仍不足以投入实际应用。由于组合泛化能力是SQL-to-text模型在实际应用中提升翻译效果的必要能力,且目前缺少对此类模型组合泛化能力的研究,因此提出一种SQL-to-text模型的组合泛化能力评估方法。基于现有的SQL-to-text数据集生成大量SQL和对应的自然语言翻译(SQL-自然语言对),并按SQL-自然语言对所含SQL子句的个数将其划分为训练数据与测试数据,使测试数据中的SQL子句皆以不同的组合方式在训练数据中出现,从而得到可评估模型组合泛化能力的新数据集。评估结果表明,该方法对查询知识的使用程度较高,划分数据的方式更加合理,所得数据集符合评估组合泛化能力的需求且贴近模型的实际应用场景,受到原始数据集的限制程度更低,并证实现有模型的组合泛化能力仍需提升,其中针对SQL-to-text任务设计的关系感知图转换器模型组合泛化能力最弱,表明原有的SQL-to-text数据集对组合泛化能力的考察存在欠缺。 展开更多
关键词 结构化查询语言 组合泛化 机器翻译 数据库 长短期记忆模型
在线阅读 下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部