期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于LSM Tree的分布式索引实现 被引量:3
1
作者 隆飞 翁海星 +1 位作者 高明 张召 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期36-44,66,共10页
近年来Log-Structured-Merge(LSM)Tree在NoSQL系统中得到了广泛地应用.主要是因为LSM Tree架构提出了延迟更新和批量写入的算法,将随机写转换为批量写,减少了磁盘臂的移动开销,从而大大地提升了数据库的写入性能.然而,读性能却也因此受... 近年来Log-Structured-Merge(LSM)Tree在NoSQL系统中得到了广泛地应用.主要是因为LSM Tree架构提出了延迟更新和批量写入的算法,将随机写转换为批量写,减少了磁盘臂的移动开销,从而大大地提升了数据库的写入性能.然而,读性能却也因此受到影响.LSM Tree和B Tree之间的本质区别使得NoSQL系统不适宜直接引用B Tree作为辅助索引结构.本文实现了LSM Tree下的一种分布式辅助索引结构,提出针对这种读写分离架构的索引批量加载策略,并对LSM Tree的查询计划树进行了缓冲优化,避免了重复的查询解析,使得索引读的性能得到了相应的提升. 展开更多
关键词 辅助索引 日志结构合并树 NOSQL
在线阅读 下载PDF
基于LSM-Tree的分布式数据库异步融合机制研究与实现 被引量:1
2
作者 杜轶德 刘文洁 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第2期303-309,共7页
信息技术的不断发展,使得分布式数据库成为研究热点。由于NoSQL架构的分布式数据库对SQL支持有限且在事务处理及一致性方面存在缺陷,基于LSM-Tree的NewSQL数据库逐渐成为应用的主流,例如TiDB、OceanBase等。分布式LSM-Tree的存储架构将... 信息技术的不断发展,使得分布式数据库成为研究热点。由于NoSQL架构的分布式数据库对SQL支持有限且在事务处理及一致性方面存在缺陷,基于LSM-Tree的NewSQL数据库逐渐成为应用的主流,例如TiDB、OceanBase等。分布式LSM-Tree的存储架构将数据分为基线数据与增量数据,通过合并操作将不同分区的增量数据与基线数据不断融合,并存储在磁盘,从而减少内存压力。但合并会占用大量系统资源,严重影响系统可用性。因此提出了一种基于LSM-Tree架构的异步融合机制,通过细分合并流程,将数据融合异步化,有效地缩短了单次数据合并的时间。实验表明,提出的异步融合机制可显著缩短数据合并时间,提高系统在高频写入场景下的鲁棒性和可用性。 展开更多
关键词 分布式数据库 lsm-tree 数据合并 异步融合 数据分区
在线阅读 下载PDF
基于LSM-Tree的键值存储系统的读写性能优化
3
作者 程浩津 胡乃平 《计算机测量与控制》 2024年第6期262-268,275,共8页
在写密集型工作环境中,日志结构合并树(LSM-Tree)已逐渐成为主流存储系统,LSM-Tree存在读操作速度慢、写操作成本高、范围查询操作效率低等问题;针对这些问题,为提升LSM-Tree的性能进行了研究,提出了一种基于LSM-Tree的键值存储系统的... 在写密集型工作环境中,日志结构合并树(LSM-Tree)已逐渐成为主流存储系统,LSM-Tree存在读操作速度慢、写操作成本高、范围查询操作效率低等问题;针对这些问题,为提升LSM-Tree的性能进行了研究,提出了一种基于LSM-Tree的键值存储系统的读写性能优化策略,通过键值分离策略设计vTree结构,并提出层内归并与消极的层间合并相结合的方法,以及范围查询优化合并的策略,从而优化系统的范围查询性能,在LSM-Tree和vTree采用不同的压缩结构,以实现系统读写性能的提升;实验结果表明,与RocksDB相比读性能提升30%,与RocksDB-vTree相比范围查询性能提升10%。 展开更多
关键词 读性能 lsm-tree 消极的层间合并 范围查询优化合并 范围查询
在线阅读 下载PDF
基于细粒度缓存与学习型索引的LSM树键值存储系统性能优化
4
作者 许睿达 李永坤 许胤龙 《计算机科学》 北大核心 2025年第2期33-41,共9页
在数据量飞速增长的大数据时代背景下,基于日志结构合并树的(Log-Structured Merge-Tree-based,LSM-Tree-based)键值存储系统因其优秀的灵活性与扩展性被广泛应用于NoSQL系统。但是,传统的LSM-Tree结构键值存储系统在查询数据时,因搜索... 在数据量飞速增长的大数据时代背景下,基于日志结构合并树的(Log-Structured Merge-Tree-based,LSM-Tree-based)键值存储系统因其优秀的灵活性与扩展性被广泛应用于NoSQL系统。但是,传统的LSM-Tree结构键值存储系统在查询数据时,因搜索多个SSTable引起的读放大问题会产生额外的I/O开销,影响系统性能。针对这一问题,提出了一种新型键值存储系统优化设计方案——FCLI-LSM。FCLI-LSM结合了细粒度键值对缓存和学习型索引的优化方法,旨在提升基于LSM-Tree结构的键值存储系统的查询性能。通过对数据访问热点的分析,FCLI-LSM对数据进行热、温、冷数据的三级分级。FCLI-LSM为热数据设计了基于键值分离的细粒度缓存机制,有效减少了读放大问题带来的额外I/O开销;此外,还设计了一种针对学习型索引的缓存亲和优化,进一步提高了存储系统对温数据的查询效率。实验结果表明,与现有的查询优化方案相比,FCLI-LSM能带来超过40%的平均查询时延下降以及超过1.7倍的系统吞吐率提升。 展开更多
关键词 大数据 键值存储系统 日志结构合并树 学习型索引 缓存
在线阅读 下载PDF
基于LSM树的视频数据扩容存储系统设计
5
作者 李斌 刘思尧 《电子设计工程》 2025年第1期31-35,共5页
针对视频清晰度过高导致存储容量不足以及处理耗时长的问题,设计基于LSM树的视频数据扩容存储系统。利用EMCX4-480磁盘阵列储存备份数据,使用FPGA实现数据缓存管理与控制。应用LSM树控制存储过程中出现的延迟问题,并通过分割机制计算数... 针对视频清晰度过高导致存储容量不足以及处理耗时长的问题,设计基于LSM树的视频数据扩容存储系统。利用EMCX4-480磁盘阵列储存备份数据,使用FPGA实现数据缓存管理与控制。应用LSM树控制存储过程中出现的延迟问题,并通过分割机制计算数据节点的分割存储数量,由此完成系统扩容。利用LSM树组织视频数据,应用概率描述存储期望值,实现视频数据扩容存储。由实验结果可知,该系统能够将所有视频数据存储在系统中,且数据存储最大耗时为179 ms,能够达到在短时间内实现全部视频数据有效存储的目的。 展开更多
关键词 lsm 视频数据 扩容存储 数据重叠 系统扩容
在线阅读 下载PDF
基于非易失性内存的LSM-tree存储系统优化 被引量:3
6
作者 余阳 胡卉芪 周煊 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第5期37-47,共11页
随着大数据时代的到来,金融行业产生的数据越来越多,对数据库的压力也越来越大. LevelDB是谷歌开发的一款基于LSM-tree架构的键值对数据库,有写入快和占用空间小的优点,被金融行业广泛应用.针对LSM-tree架构的写停顿、写放大、对读不友... 随着大数据时代的到来,金融行业产生的数据越来越多,对数据库的压力也越来越大. LevelDB是谷歌开发的一款基于LSM-tree架构的键值对数据库,有写入快和占用空间小的优点,被金融行业广泛应用.针对LSM-tree架构的写停顿、写放大、对读不友好等缺点,提出了一种基于非易失性内存和机器学习的L0层的设计方法,能够减缓甚至解决上述问题.实验结果表明,该设计能够实现较好的读写性能. 展开更多
关键词 非易失性内存 机器学习 lsm-tree架构
在线阅读 下载PDF
基于LSM树的在线监测数据安全存储系统设计 被引量:1
7
作者 李林 左天才 +1 位作者 杜泽新 谢志奇 《电子设计工程》 2024年第7期63-67,共5页
水电厂在线监测数据对于水电厂设备维护方案的制定和实施具有重要的参考作用,一旦泄露或者丢失,造成的损失将是巨大的。为了保证监测数据的安全性,设计基于日志结构合并树(Log-Structured Merge-Tree,LSM树)的水电厂在线监测数据安全存... 水电厂在线监测数据对于水电厂设备维护方案的制定和实施具有重要的参考作用,一旦泄露或者丢失,造成的损失将是巨大的。为了保证监测数据的安全性,设计基于日志结构合并树(Log-Structured Merge-Tree,LSM树)的水电厂在线监测数据安全存储系统。该系统由硬件接口层、数据传输层以、数据存储层以及安全功能模块层四部分组成。以LSM树为基础设计数据存储模型,当RAM中的存储量达到限值后,将水电厂在线监测数据从微处理器中的内部存储器RAM转移到后者外部磁盘当中,完成数据存储。为存储模型设置三个安全防护模块,在实现数据存储的同时,保证数据的安全性。结果表明,四个磁盘的写入数据大小始终维持在100 kB以上,磁盘存储空间利用率高于90%,由此说明该系统的存储性能较为优越;检测灵敏度系数在1.0以上,密文的敏感度在10以下,说明水电厂在线监测数据安全性较高,实现了安全存储。 展开更多
关键词 lsm 水电厂在线监测数据 硬件电路 安全防护模块 安全存储系统
在线阅读 下载PDF
L2SM:a query-optimized linked LSM-tree for HTAP workloads
8
作者 Xiaoyue FENG Dashan WEI +1 位作者 Chaopeng GUO Jie SONG 《Frontiers of Computer Science》 2025年第7期143-145,共3页
1 Introduction The LSM-tree has become a preferred solution for the storage structure of key-value(KV)NoSQL systems due to its efficient write performance[1,2].Its ability to efficiently process large-scale data write... 1 Introduction The LSM-tree has become a preferred solution for the storage structure of key-value(KV)NoSQL systems due to its efficient write performance[1,2].Its ability to efficiently process large-scale data write operations makes it show high performance in handling TP(Transactional Processing)tasks.The increasing volume of real-time data processing and complex analytics tasks in current applications has made it necessary for databases to support HTAP(Hybrid Transactional/Analytical Processing)workloads. 展开更多
关键词 analytics tasks key value systems query optimization lsm tree HTAP transactional processing storage structure write performance
原文传递
LazyStore:基于混合存储架构的写优化键值存储系统 被引量:1
9
作者 杜云箫 陈珂 +3 位作者 寿黎但 江大伟 骆歆远 陈刚 《软件学报》 北大核心 2025年第2期805-829,共25页
基于日志合并树(LSM-tree)的键值(key-value)存储由于其出色的读写性能而被广泛用于许多应用中.大多数现有的日志合并树采用多层结构来存储数据.尽管多层数据结构可以很好地服务于适度的写密集型应用,但这种结构并不十分适合高写密集型... 基于日志合并树(LSM-tree)的键值(key-value)存储由于其出色的读写性能而被广泛用于许多应用中.大多数现有的日志合并树采用多层结构来存储数据.尽管多层数据结构可以很好地服务于适度的写密集型应用,但这种结构并不十分适合高写密集型应用.这是因为以多层方式保存数据会引入写放大问题,即新的数据插入会引发很大一部分已经存储在多层中的数据被重组的问题.这种巨大的(有时是频繁的)数据重组是昂贵的,并且在许多高写密集型的应用中降低了写入性能.此外,多层结构不能为热数据持续提供出色的读取性能.这是因为多级结构不能通过及时合并重叠的范围来优化热数据的读取操作.为了解决上述两个问题,提出LazyStore,一种基于混合存储架构的新型单层日志合并树.LazyStore通过将数据存储在单一逻辑层而不是多个逻辑层来解决写放大的问题.因此,昂贵的多级数据重组在很大程度上被消除.为了进一步提高写入性能,LazyStore根据每个存储设备的容量和读/写性能,将逻辑层中的数据分布到多个存储设备中,如内存、非易失性内存和闪存.此外,LazyStore引入实时合并操作,以提高热数据范围的读取性能.实验表明,与其他多级日志合并树相比,LazyStore最多将写入性能提高3倍,并将写入放大率降低至1/4.而对于热门范围的读取,LazyStore的实时数据合并优化可以将范围查询处理的延迟降低一半. 展开更多
关键词 键值存储 日志合并树 非易失性内存
在线阅读 下载PDF
一种基于LSM树的键值存储系统性能优化方法 被引量:6
10
作者 王海涛 李战怀 +1 位作者 张晓 赵晓南 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1792-1802,共11页
目前,键值(key-value, KV)存储系统在众多数据密集型的应用系统中发挥着关键作用,例如页面索引、电子商务以及云存储系统等.在各种键值存储系统中,基于日志结构合并(log-structured merge, LSM)树的KV存储系统获得了广泛的应用.主要原... 目前,键值(key-value, KV)存储系统在众多数据密集型的应用系统中发挥着关键作用,例如页面索引、电子商务以及云存储系统等.在各种键值存储系统中,基于日志结构合并(log-structured merge, LSM)树的KV存储系统获得了广泛的应用.主要原因是基于LSM树的KV存储系统能够将随机写操作转化为顺序写操作,从而提升数据写性能.然而,这些存储系统也存在一些严重的性能问题.一方面,KV存储系统利用预写日志机制来保证写入数据的原子性和安全性,以便在系统发生故障时进行恢复,造成了数据的写放大.同时,日志的频繁更新也引入了严重的元数据负载,导致了额外的性能开销.另一方面,KV存储系统通常利用通用文件系统存储数据,而通用文件系统中许多KV存储系统不需要的功能和属性也会造成一定的性能开销.为了减小这些开销、提升KV存储系统写入性能,提出了RocksFS,一个针对基于LSM树的KV存储系统优化的文件系统.针对KV存储系统的负载模式简化文件系统结构,去除通用文件系统引入的负载,同时优化预写日志的存储结构和更新流程以减小其更新负载,提升写入性能.最后在普通硬盘和固态硬盘上,基于流行的KV存储系统RocksDB验证了该方法的有效性,结果显示相对于通用文件系统,RocksFS能够将小块KV数据写入和更新性能提高约8倍. 展开更多
关键词 lsm 键值存储 文件系统 预写日志 写性能
在线阅读 下载PDF
Truster:面向高效查询的自动驾驶轨迹数据聚类存储方案
11
作者 王征权 彭智勇 《计算机科学》 北大核心 2025年第11期62-70,共9页
自动驾驶轨迹数据具有重要的研究与应用价值,其存储与查询技术得到了广泛的研究与关注。然而,现有轨迹数据管理方案主要针对一般轨迹数据设计,无法支持高频采样的自动驾驶轨迹数据的高效写入,且动态环境下高昂的索引维护开销使其难以满... 自动驾驶轨迹数据具有重要的研究与应用价值,其存储与查询技术得到了广泛的研究与关注。然而,现有轨迹数据管理方案主要针对一般轨迹数据设计,无法支持高频采样的自动驾驶轨迹数据的高效写入,且动态环境下高昂的索引维护开销使其难以满足动态更新与实时查询的需求。针对自动驾驶场景下高采样频率、高实时性的轨迹数据如何实现高频写入、动态更新、实时查询的问题,提出一种面向高效查询的自动驾驶轨迹数据聚类存储方案Truster。该方法设计了编码器和嵌入器,为原始轨迹生成空间感知键并提取特征向量;设计了基于日志结构合并树的存储结构CLSM树,以实现相似轨迹的集中存储;设计了LCC合并策略,在有序字符串表进行合并的同时,利用基于局部敏感哈希的分桶方法进行快速聚类;设计了轨迹查询算法,利用多粒度缓存和分桶映射快速筛选搜索空间。Truster不仅支持高频写入,还能适应动态工作负载的索引维护,且查询效率更高。在真实自动驾驶轨迹数据集Argoverse上进行的对比实验表明,与现有方法相比,Truster在写入操作上取得了20%~200%的加速,在查询操作上取得了20%~100%的加速。 展开更多
关键词 轨迹数据 轨迹存储 轨迹查询 日志结构合并树 局部敏感哈希
在线阅读 下载PDF
基于SSD-SMR混合存储的LSM树键值存储系统的性能优化 被引量:5
12
作者 王洋洋 韦皓诚 柴云鹏 《计算机科学》 CSCD 北大核心 2018年第7期61-65,89,共6页
大数据对存储系统的可扩展性、性能和成本等方面提出了更高的要求。瓦记录(Shingled Magnetic Recording,SMR)硬盘由于存储密度高、价格便宜,正逐步被广泛应用于大数据存储系统。但是,SMR硬盘的随机写性能较差,与快速的基于闪存的固态硬... 大数据对存储系统的可扩展性、性能和成本等方面提出了更高的要求。瓦记录(Shingled Magnetic Recording,SMR)硬盘由于存储密度高、价格便宜,正逐步被广泛应用于大数据存储系统。但是,SMR硬盘的随机写性能较差,与快速的基于闪存的固态硬盘(Solid State Drive,SSD)一起构成混合存储时可以显著提升性能。同时,基于写优化的日志结构合并(Log-Structured Merge,LSM)树的键值存储已被广泛应用于许多NoSQL系统,如BigTable,Cassandra和HBase等。因此,如何基于新型的SSD-SMR混合存储构建出高性能的LSM树键值存储系统是一个具有很大研究价值的问题。首先建立基于SSD-SMR混合存储的LSM树键值系统的性能模型,然后针对SSD和SMR的硬件特征以及LSM树键值存储的软件特点,设计了一套面向SSD-SMR混合存储进行性能优化的LSM树键值存储系统,并基于LevelDB实现了该系统。在仅仅使用0.4%~2%空间的SSD的情况下,所提方法可以使SSD-SMR混合存储方案比普通磁盘方案的随机写性能提高20%,随机读性能提高5倍。 展开更多
关键词 大数据 日志合并树 瓦记录磁盘 闪存 混合存储
在线阅读 下载PDF
基于LSM树的键值存储系统技术研究综述 被引量:2
13
作者 吕萌 华文镝 谢平 《计算机科学》 CSCD 北大核心 2023年第8期1-15,共15页
键值存储是数据库最简单的组织形式。在数据密集型的应用场景中,键值存储系统发挥着关键的作用。随着对及时数据分析需求的增加,良好的系统性能变得越来越重要。目前大多数键值存储系统的存储引擎都是日志结构合并树(Log-Structured Mer... 键值存储是数据库最简单的组织形式。在数据密集型的应用场景中,键值存储系统发挥着关键的作用。随着对及时数据分析需求的增加,良好的系统性能变得越来越重要。目前大多数键值存储系统的存储引擎都是日志结构合并树(Log-Structured Merge Tree, LSM树)。因具有卓越的写性能,LSM树被广泛应用于写密集型的场景和现代NoSQL系统的存储层。与传统的B树相比,LSM树采用顺序写入的访问模式,并使用内存缓冲区来批处理新的写入线程,因此LSM树具有更大的写优势。然而,数据的重复读写和不必要的压缩操作导致了LSM树的读写放大问题,从而严重影响了系统的性能,尤其在数据密集型的应用场景。如今,研究人员做了大量工作来缓解这些问题,文中研究了影响LSM树性能的各个因素,搜集了大量提升基于LSM树的键值系统性能的文献,并对其加以整理和分类,讨论它们的优势和权衡,使读者可以了解基于LSM树的存储技术及其优化策略,最后调查了几个具有代表性的基于LSM树的键值存储技术并讨论了潜在的未来研究方向。 展开更多
关键词 lsm NOSQL 存储管理 键值系统 数据检索
在线阅读 下载PDF
基于LSM树的云存储数据差异性存储节能优化算法 被引量:4
14
作者 梁少林 《吉林大学学报(信息科学版)》 CAS 2022年第2期282-287,共6页
为解决因大数据环境不断扩大而导致的信息储存高功耗、低效率问题,提出一种基于LSM(Log Structured Merge)树的数据云储存节能优化算法。根据数据存储的数量、大小、网络带宽及链路长度等信息差异性特点,建立数据分片储存判定模型,计算... 为解决因大数据环境不断扩大而导致的信息储存高功耗、低效率问题,提出一种基于LSM(Log Structured Merge)树的数据云储存节能优化算法。根据数据存储的数量、大小、网络带宽及链路长度等信息差异性特点,建立数据分片储存判定模型,计算数据在发送和接收时的时间延迟,对比既定参数判定是否需要分片储存。对需要分片储存的数据,通过时间延迟阈值明确在各个节点下所需的服务器功耗、静态功耗以及动态功耗,对平均功耗较大的数据实施分类传输,完成存储节能优化。仿真实验证明,采取所提方法后的云储存环境中冗余数据量明显减少,且处理稳定性较强,平均耗用低于设定阈值,整体算法性能较为优异。 展开更多
关键词 lsm 网络带宽 链路长度 静态功耗 冗余数据
在线阅读 下载PDF
面向空间数据的LSM树索引研究综述 被引量:1
15
作者 何军军 《无线通信技术》 2022年第1期42-47,共6页
空间数据在城市规划、天气预报、资产管理以及路线导航上有着广泛的应用。传统的关系型数据库不能满足空间数据高频存取的需求,面向空间数据的LSM树索引能够提高空间数据的写入和查询性能。但在索引设计中,需要面临索引结构设计、提升... 空间数据在城市规划、天气预报、资产管理以及路线导航上有着广泛的应用。传统的关系型数据库不能满足空间数据高频存取的需求,面向空间数据的LSM树索引能够提高空间数据的写入和查询性能。但在索引设计中,需要面临索引结构设计、提升查询性能和降低更新开销三方面问题。对此,本文分别对基于空间填充曲线的LSM树索引结构和基于树状结构的LSM树索引结构两方面的现有工作进行分析,比较其优缺点,并展望了该方向的机遇和挑战。 展开更多
关键词 空间数据 lsm树索引 空间填充曲线 树状结构 查询性能
原文传递
OceanBase分布式关系数据库架构与技术 被引量:4
16
作者 阳振坤 杨传辉 +3 位作者 韩富晟 王国平 杨志丰 成肖君 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期540-554,共15页
关系数据库是当今社会的关键信息基础设施,互联网和数字化带来了高并发和海量数据,传统关系数据库均为集中式架构,处理能力和存储容量都捉襟见肘.OceanBase分布式关系数据库基于通用PC服务器,不仅实现了在线水平伸缩,还实现了机房故障... 关系数据库是当今社会的关键信息基础设施,互联网和数字化带来了高并发和海量数据,传统关系数据库均为集中式架构,处理能力和存储容量都捉襟见肘.OceanBase分布式关系数据库基于通用PC服务器,不仅实现了在线水平伸缩,还实现了机房故障自动无损容灾以及高倍率数据压缩等,已经应用于金融、政务、通信和互联网等行业.介绍了OceanBase分布式关系数据库的系统架构和关键技术,包括分布式事务处理、基于LSM-tree的存储系统以及分布式SQL优化器.详细阐述了OceanBase数据库的高可用和数据一致性,包括RPO为0和RTO小于8 s.也介绍了OceanBase数据库多租户机制,即采用了集群内原生多租户设计,在集群内实现多个互相独立的数据库服务.基于Sysbench和TPC-H评测基准,对比实验结果表明:1)在单机模式下,OceanBase的性能是MySQL的1.27倍至2倍多;2)在单主模式下,OceanBase的性能是MySQL的1.25倍至近2倍;3)在多主模式下,OceanBase的性能是MySQL的1.09倍至3.1倍,对于OLAP的复杂查询,OceanBase的性能是MySQL的6倍到327倍. 展开更多
关键词 关系数据库 分布式事务 基于lsm-tree存储 分布式SQL优化器 多租户
在线阅读 下载PDF
MUSE:一种面向云存储系统的高性能元数据存储引擎 被引量:5
17
作者 段翰聪 向小可 吕鹏程 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第2期221-226,共6页
该文设计了一种高性能的面向云存储系统的元数据存储引擎(MUSE)。首先,其底层物理存储模块采用LSM-tree模型的高速key-value存储引擎Level DB方案,通过设计多缓存表和多线程紧凑机制对该方案进行优化,使其可以充分利用内存和多核CPU并... 该文设计了一种高性能的面向云存储系统的元数据存储引擎(MUSE)。首先,其底层物理存储模块采用LSM-tree模型的高速key-value存储引擎Level DB方案,通过设计多缓存表和多线程紧凑机制对该方案进行优化,使其可以充分利用内存和多核CPU并行能力;其次,提出了基于多I/O通道的元数据存取调度机制。通道之间读写操作隔离,聚合多个通道为上层提供高并发随机I/O读写能力;此外,针对上层目录命名空间管理,提出路径分割映射和全路径映射策略两种策略,可基于不同的应用场景在性能与可用性间进行折中选择。系统测试结果表明,MUSE能够很好地适应海量小文件存储场景,相对于其他元数据存储系统在性能上有显著的提升。 展开更多
关键词 I/O lsm-tree 海量 元数据 性能 小文件 存储引擎
在线阅读 下载PDF
高效Key-Value持久化缓存系统的实现 被引量:6
18
作者 罗军 陈席林 李文生 《计算机工程》 CAS CSCD 2014年第3期33-38,共6页
传统的缓存系统为了追求更高的性能大多是基于内存存储的,数据的持久化功能并不完善,因而系统会受到内存容量的限制,并且在系统宕机时会导致数据全部丢失,无法恢复。为此,在分析传统缓存系统的基础上,针对数据的持久化运用LSM-Tree理论... 传统的缓存系统为了追求更高的性能大多是基于内存存储的,数据的持久化功能并不完善,因而系统会受到内存容量的限制,并且在系统宕机时会导致数据全部丢失,无法恢复。为此,在分析传统缓存系统的基础上,针对数据的持久化运用LSM-Tree理论以及Merge-Dump存储引擎进行改进,并参考Google的单机持久化存储系统LevelDB,实现一个分布式的Key-Value持久化缓存系统SSDB,结合传统缓存系统的优点并利用一致性哈希、布隆过滤器等思想对SSDB进行一系列优化。对SSDB性能测试的结果表明,优化后的持久化缓存系统SSDB是纯内存存储的,能有效降低数据的存储成本,且在读写性能上只比Redis下降约600 QPS。 展开更多
关键词 lsm tree理论 Merge—Dump存储引擎 缓存系统 持久化存储 一致性哈希 布隆过滤器
在线阅读 下载PDF
基于日志结构合并树的轻量级分布式索引实现方法 被引量:2
19
作者 崔双双 王宏志 《计算机应用》 CSCD 北大核心 2021年第3期630-635,共6页
针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查... 针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法 SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查询效率;然后,提出了分布式索引构建算法以及基于等距取样的索引区间划分算法,从而保证了索引在系统中的均匀分布,并且优化了传统索引的查询算法,将索引文件看作特殊的数据文件分布式地存储在系统中,从而保证了系统的负载均衡和可扩展性;最后,将该方法与华为二级索引方案HIndex在HBase数据库上进行实验来比较二者的索引构建的时间和空间开销、索引的查询性能和系统的负载均衡等性能,验证得出所提出的方法使查询性能提升了50~200倍。 展开更多
关键词 日志结构合并树 分布式索引 HBASE 查询优化
在线阅读 下载PDF
近数据计算下键值存储中Compaction并行优化方法 被引量:1
20
作者 孙辉 娄本冬 +2 位作者 黄建忠 赵雨虹 符松 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期597-616,共20页
大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写... 大规模非结构化数据的爆炸式增长给传统关系型数据库带来了极大的挑战.基于日志结构合并树(log-structured merge tree,LSM-tree)的键值存储系统已被广泛应用,并起到重要的作用,原因在于基于LSM-tree的键值存储能够将随机写转化为顺序写,从而提升性能.然而,LSM-tree键值存储也存在一些性能问题.一方面,键值存储利用compaction操作更新数据,保持系统平衡,但造成严重的写放大问题.另一方面,以传统计算为中心的架构下,compaction操作带来大量的数据传输,影响了系统性能.以数据为中心的近数据计算模型(near-data processing,NDP)为基础,利用该模型下主机端与近数据计算使能设备端的并行资源,提出基于系统并行与流水线并行的compaction优化方法(collaborative parallel compaction optimization for LSM-tree key-value stores,CoPro).当处理compaction操作时,CoPro主机端与NDP设备端协同执行compaction卸载任务.此外,进一步提出基于决策组件的CoPro+,根据系统资源变化以及负载键值对中值大小的变化来动态调整并行度,使NDP架构中计算资源的使用更加高效.在搭建的硬件平台上验证了CoPro的有效性. 展开更多
关键词 日志归并树 键值存储 近数据计算 任务卸载 数据-流水线并行
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部