期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
对Cache命中率优化的探讨 被引量:1
1
作者 赵国栋 顾峰 《宁夏师范学院学报》 2007年第6期54-57,共4页
Cache命中率在现代处理器研究中越来越重要,本文以二维数组为例探讨存储结构Cache命中率的影响.并提出二维数组的以块为主序的存储结构,这种存储结构能较好地保持数据的空间局部性,从而减少了由于数据的空间局部性的破坏而引起的性能的... Cache命中率在现代处理器研究中越来越重要,本文以二维数组为例探讨存储结构Cache命中率的影响.并提出二维数组的以块为主序的存储结构,这种存储结构能较好地保持数据的空间局部性,从而减少了由于数据的空间局部性的破坏而引起的性能的损失. 展开更多
关键词 存储结构 高速缓存 空间局部性
在线阅读 下载PDF
众核处理器cache一致性研究综述
2
作者 韩立敏 安建峰 +2 位作者 高德远 樊晓桠 任向隆 《计算机应用研究》 CSCD 北大核心 2012年第11期4011-4016,共6页
以瓦片结构众核处理器一致性协议的设计为主线,综述了国内外近年来关于众核处理器cache一致性的相关研究;介绍了不同NUCA结构对一致性协议的影响;分析和对比了几种传统目录一致性协议的特性及其存在的问题;归纳了最新几个面向众核结构... 以瓦片结构众核处理器一致性协议的设计为主线,综述了国内外近年来关于众核处理器cache一致性的相关研究;介绍了不同NUCA结构对一致性协议的影响;分析和对比了几种传统目录一致性协议的特性及其存在的问题;归纳了最新几个面向众核结构一致性协议的设计思想和特性。最后为设计具备应用程序适应性和可扩展性的cache一致性协议指出了几个关键的设计方向。 展开更多
关键词 cache一致性协议 众核处理器 瓦片化结构 NUCA
在线阅读 下载PDF
面向机器学习的高性能SIMT处理器cache的设计与实现 被引量:3
3
作者 许晓燕 李涛 +1 位作者 孙哲 邢立冬 《计算机应用与软件》 北大核心 2019年第7期282-286,333,共6页
为了满足机器学习中大数据、并行计算及降低处理器与主存之间的差距等要求,设计基于自主研发的SIMT处理器的流水线cache结构。依据局部性原理与LRU替换算法相结合设计专用的伪LRU替换算法,与通用的轮询、LFU、LRU替换算法共同完成cache... 为了满足机器学习中大数据、并行计算及降低处理器与主存之间的差距等要求,设计基于自主研发的SIMT处理器的流水线cache结构。依据局部性原理与LRU替换算法相结合设计专用的伪LRU替换算法,与通用的轮询、LFU、LRU替换算法共同完成cache替换算法的可配置要求,实现处理器与主存之间的快速交互。采用Xilinx公司virtex ultrascale系列的xcvu440-flga2892-2-e FPGA芯片对设计进行综合。结果表明该结构指令cache最大时延为2.923 ns,数据cache最大时延为3.258 ns,满足SIMT处理器性能要求。 展开更多
关键词 SIMT处理器 流水线cache结构 替换算法
在线阅读 下载PDF
Cache-Conscious Index Mechanism for Main-Memory Databases 被引量:5
4
作者 SUN Li-mei SONG Bao-yan YU Ya-xin LI Fang-fang YU Ge 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期309-312,共4页
Recent studies have addressed that the cache be havior is important in the design of main memory index structures. Cache-conscious indices such as the CSB^+-tree are shown to outperform conventional main memory indic... Recent studies have addressed that the cache be havior is important in the design of main memory index structures. Cache-conscious indices such as the CSB^+-tree are shown to outperform conventional main memory indices such as the AVL-tree and the T-tree. This paper proposes a cacheconscious version of the T-tree, CST-tree, defined according to the cache-conscious definition. To separate the keys within a node into two parts, the CST-tree can gain higher cache hit ratio. 展开更多
关键词 index structure main memory database real time application cache-conscious T-tree indexing CST-tree indexing
在线阅读 下载PDF
基于Cache技术的新型存储体系结构
5
作者 张剑 蒋盛益 《衡阳师范学院学报》 2004年第3期67-70,共4页
本文根据目前微处理器制造工艺、性能、内部结构,以及PentiumIV中采用的内置方法、高级动态执行引擎和执行跟踪缓存,从Cache技术上进行了分折,最后提出新型存储体系结构高速缓存的发展趋势。
关键词 存储器 执行跟踪缓存 高速缓存 体系结构
在线阅读 下载PDF
EBCache:A Novel Cache-Based Mechanism for Mitigating the Spectre Attacks for RISC-V Processor
6
作者 Wu Dehua Xiao Wan’ang Gao Wanlin 《China Communications》 SCIE CSCD 2024年第12期166-185,共20页
The cache-based covert channel is one of the common vulnerabilities exploited in the Spectre attacks.Current mitigation strategies focus on blocking the eviction-based channel by using a random/encrypted mapping funct... The cache-based covert channel is one of the common vulnerabilities exploited in the Spectre attacks.Current mitigation strategies focus on blocking the eviction-based channel by using a random/encrypted mapping function to translate memory address to the cache address,while the updated-based channel is still vulnerable.In addition,some mitigation strategies are also costly as it needs software and hardware modifications.In this paper,our objective is to devise low-cost,comprehensive-protection techniques for mitigating the Spectre attacks.We proposed a novel cache structure,named EBCache,which focuses on the RISC-V processor and applies the address encryption and blacklist to resist the Spectre attacks.The addresses encryption mechanism increases the difficulty of pruning a minimal eviction set.The blacklist mechanism makes the updated cache lines loaded by the malicious updates invisible.Our experiments demonstrated that the EBCache can prevent malicious modifications.The EBCache,however,reduces the processor’s performance by about 23%but involves only a low-cost modification in the hardware. 展开更多
关键词 cache structure out-of-order execution side-channel attacks the Spectre attacks
在线阅读 下载PDF
R-DSP中二级Cache控制器的优化设计
7
作者 谭露露 谭勋琼 白创 《电子与封装》 2024年第7期63-68,共6页
针对二级Cache控制器(L2)对于提升R数字信号处理器(R-DSP)访存效率和整体性能的重要作用,结合L2中涉及的内存安全维护和多请求访存仲裁问题,在现有R-DSP中L2基础上实现优化。首先,采用多重分块的存储组织结构,提高访存效率;其次,并行处... 针对二级Cache控制器(L2)对于提升R数字信号处理器(R-DSP)访存效率和整体性能的重要作用,结合L2中涉及的内存安全维护和多请求访存仲裁问题,在现有R-DSP中L2基础上实现优化。首先,采用多重分块的存储组织结构,提高访存效率;其次,并行处理一级Cache控制器请求与外存请求,减小请求处理周期;最后,增加带宽管理与存储保护功能,合理仲裁访存请求并维护存储安全。实验结果表明,相较于传统设计,新设计在保护二级存储安全的同时实现带宽管理式访存仲裁。与现有R-DSP中的L2相比,新设计的存储体单拍最大可响应访存请求数量提升了1倍,一级请求和外存请求的平均处理时钟周期数分别降低了25%和19.6%。 展开更多
关键词 DSP 二级cache 存储结构 并行处理 存储保护 带宽管理
在线阅读 下载PDF
可重构阵列处理器中分布式Cache设计
8
作者 蒋林 刘阳 +2 位作者 山蕊 刘鹏 耿玉荣 《电子技术应用》 2018年第12期9-12,16,共5页
随着片上集成的处理器核数日益增多,可重构阵列处理器中的"存储墙"问题日益加剧,而传统采用多级共享Cache硬件设计复杂度高,并行访问度有限,难以满足可重构阵列处理器的访存需求。设计了一种本地优先、全局共享的"物理... 随着片上集成的处理器核数日益增多,可重构阵列处理器中的"存储墙"问题日益加剧,而传统采用多级共享Cache硬件设计复杂度高,并行访问度有限,难以满足可重构阵列处理器的访存需求。设计了一种本地优先、全局共享的"物理分布、逻辑统一"分布式Cache结构,该结构硬件开销小,并行访问性高。通过Xilinx公司的Virtex-6系列xc6vlx550T开发板对设计进行测试,实验结果表明,该结构相比于同类结构,平均延迟减少最高达30%,硬件开销仅为Cache容量的5%,最高可提供10.512 GB/s的访存带宽。 展开更多
关键词 阵列处理器 可重构 存储结构 分布式cache 并行访问
在线阅读 下载PDF
SMP体系结构中的一种Cache协议
9
作者 费如纯 刘永波 《辽宁科技学院学报》 1999年第3期18-19,25,共3页
讨论了SMP体系结构中Cache一致性问题,并在进一步分析的基础上提出了一种Cache协议算法。
关键词 SMP体系结构 cache一致性 写做废法 写更新法 cache协议
在线阅读 下载PDF
Cache一致性验证的结构化激励生成算法
10
作者 程开丰 罗汉青 梁利平 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第10期108-114,共7页
为解决Cache一致性验证中传统随机激励方法的冗余覆盖及覆盖死角等问题,提出了一种高层次结构化激励生成算法和相应的高层次功能覆盖率模型.首先根据实际多核应用场景将冲突访存操作分类成基本同步和复杂同步,并进一步抽象成有向二分图... 为解决Cache一致性验证中传统随机激励方法的冗余覆盖及覆盖死角等问题,提出了一种高层次结构化激励生成算法和相应的高层次功能覆盖率模型.首先根据实际多核应用场景将冲突访存操作分类成基本同步和复杂同步,并进一步抽象成有向二分图模型,由此提出一种通用的层次化输入空间等价类划分算法和对应的高层次HSPC(Host Slave Pair Coverage)功能覆盖率模型,最后基于树的搜索提出了结构化激励生成算法.上述方案成功应用于IME-Diamond SoC的Cache一致性的功能验证中,实际结果表明,相比传统基于代码的覆盖率,高层次HSPC功能覆盖率模型的揭示功能Bug能力更强,而且相对于传统的随机生成,结构化的激励能够将覆盖率收敛所需的激励数减少96.3%. 展开更多
关键词 cache一致性 有向二分图模型 等价类划分 高层次功能覆盖率模型 结构化激励生成
在线阅读 下载PDF
面向海量小对象的闪存键值缓存研究
11
作者 莫戈泉 吴晨涛 《小型微型计算机系统》 北大核心 2026年第1期157-164,共8页
闪存因其较低的比特成本、更高的数据密度和更高的能效,成为了键值缓存的高性价比解决方案.然而,闪存的写入寿命有限,许多基于闪存的键值缓存系统采用日志结构的追加写入方式以减少写放大,并依赖内存索引定位对象的最新数据.尽管如此,... 闪存因其较低的比特成本、更高的数据密度和更高的能效,成为了键值缓存的高性价比解决方案.然而,闪存的写入寿命有限,许多基于闪存的键值缓存系统采用日志结构的追加写入方式以减少写放大,并依赖内存索引定位对象的最新数据.尽管如此,管理数十亿个小对象的内存索引仍需要大量内存,削弱了闪存在成本方面的优势.为解决索引的内存占用问题,提出了闪存索引哈希表以减少内存元数据开销.此外,采用基于访问次数的淘汰算法,以更有效地驱逐冷门和无效对象,同时保留热门对象,提高缓存命中率,同时使用近似计数器以降低内存占用.实验表明,与现有最先进方案相比,闪存的写入量最高可减少96.53%,缓存命中率提升可高达13.2%. 展开更多
关键词 闪存 键值缓存 写放大 日志结构合并 哈希表
在线阅读 下载PDF
Prefetching J^+-Tree:A Cache-Optimized Main Memory Database Index Structure 被引量:3
12
作者 栾华 杜小勇 王珊 《Journal of Computer Science & Technology》 SCIE EI CSCD 2009年第4期687-707,共21页
As the speed gap between main memory and modern processors continues to widen, the cache behavior becomes more important for main memory database systems (MMDBs). Indexing technique is a key component of MMDBs. Unfo... As the speed gap between main memory and modern processors continues to widen, the cache behavior becomes more important for main memory database systems (MMDBs). Indexing technique is a key component of MMDBs. Unfortunately, the predominant indexes -B^+-trees and T-trees -- have been shown to utilize cache poorly, which triggers the development of many cache-conscious indexes, such as CSB^+-trees and pB^+-trees. Most of these cache-conscious indexes are variants of conventional B^+-trees, and have better cache performance than B^+-trees. In this paper, we develop a novel J^+-tree index, inspired by the Judy structure which is an associative array data structure, and propose a more cacheoptimized index -- Prefetching J^+-tree (pJ^+-tree), which applies prefetching to J^+-tree to accelerate range scan operations. The J^+-tree stores all the keys in its leaf nodes and keeps the reference values of leaf nodes in a Judy structure, which makes J^+-tree not only hold the advantages of Judy (such as fast single value search) but also outperform it in other aspects. For example, J^+-trees can achieve better performance on range queries than Judy. The pJ^+-tree index exploits prefetching techniques to further improve the cache behavior of J^+-trees and yields a speedup of 2.0 on range scans. Compared with B^+-trees, CSB^+-trees, pB^+-trees and T-trees, our extensive experimental Study shows that pJ^+-trees can provide better performance on both time (search, scan, update) and space aspects. 展开更多
关键词 index structure pJ^+-tree PREFETCHING cache conscious main memory database
原文传递
面向硬件缓存结构的数据布局优化研究综述
13
作者 张轶 张禹苓 杨学聪 《集成电路与嵌入式系统》 2025年第12期40-51,共12页
内存访问延迟仍然是现代处理器上大量应用的主要瓶颈。为了优化内存访问性能,利用程序在内存访问中的局部性非常重要。数据布局优化技术通过在数据结构上的合并、拆分、重组等操作可以显著改善内存访问的局部性。首先概述了布局优化技... 内存访问延迟仍然是现代处理器上大量应用的主要瓶颈。为了优化内存访问性能,利用程序在内存访问中的局部性非常重要。数据布局优化技术通过在数据结构上的合并、拆分、重组等操作可以显著改善内存访问的局部性。首先概述了布局优化技术所涉及的存储架构及数据组织的技术背景;之后介绍了数据编排技术所要解决的关键问题,编排技术所采用的核心思想及其实现所依赖的主要技术。由于各类数据在存储及访问方式上存在较大差异,根据数据类型的不同,重点对相关研究工作进行了系统性的归纳与总结,比较了不同工作的优势与不足,并分析了未来值得探索的研究方向。 展开更多
关键词 缓存 程序局部性 数据布局 数据编排
在线阅读 下载PDF
融合聚类和结构优化的属性访问控制策略评估
14
作者 夏桐 袁凌云 谢天玉 《计算机工程与科学》 北大核心 2025年第12期2169-2180,共12页
为加快用户请求资源的响应速度,提出一种融合聚类和结构优化的属性访问控制策略评估方法。首先,构建规则距离权重矩阵,以计算非数值型规则数据点间的实际距离;其次,基于CKmeans双阶段聚类方法处理大规模策略集,将其划分为若干个小规模... 为加快用户请求资源的响应速度,提出一种融合聚类和结构优化的属性访问控制策略评估方法。首先,构建规则距离权重矩阵,以计算非数值型规则数据点间的实际距离;其次,基于CKmeans双阶段聚类方法处理大规模策略集,将其划分为若干个小规模策略簇,缩小策略匹配范围;最后,基于规则结构优化整合方法,压缩簇中规则条目,减少访问请求与簇规则的比较次数,并同时加入哈希缓存表,加快重复请求的访问速度。使用现实系统中的多个XACML访问控制策略验证所提方法的有效性。实验结果表明,相比于现有的Sun’s XACML和Xengine评估引擎以及4类机器学习方法,所提方法在LMS,VMS和ASMS这3个策略集上的时间开销显著减少,至多降低了约3个数量级,极大提升了策略的评估效率。 展开更多
关键词 授权访问控制 策略评估 双阶段聚类 规则结构优化 哈希缓存
在线阅读 下载PDF
一种结构化P2P协议中的自适应负载均衡方法 被引量:20
15
作者 熊伟 谢冬青 +1 位作者 焦炳旺 刘洁 《软件学报》 EI CSCD 北大核心 2009年第3期660-670,共11页
提出一种自适应负载均衡方法,方法采用一种被动式结点负载统计方法生成局部负载视图;一种文件访问统计方法生成局部文件访问视图;当系统内结点负载存在差异时,重载结点把指向自身的逻辑链路迁移至指向局部负载视图中的轻载结点,通过减... 提出一种自适应负载均衡方法,方法采用一种被动式结点负载统计方法生成局部负载视图;一种文件访问统计方法生成局部文件访问视图;当系统内结点负载存在差异时,重载结点把指向自身的逻辑链路迁移至指向局部负载视图中的轻载结点,通过减小重载结点入度和增加轻载结点入度来减小结点间负载差异;当结点的请求负载较高时,通过局部文件访问视图计算需要缓存的热点文件及目标结点,降低承载热点文件的结点请求负载.实验结果表明,在用户查询服从Zipf分布的环境下,自适应负载均衡方法可使系统负载达到较好的均衡;缓存方法虽然在一定程度上增加了缓存和更新开销,但在一定条件下比查询消息命中缓存节省的网络开销要小,降低了系统的整体负载. 展开更多
关键词 P2P 负载均衡 结构化覆盖网 缓存 CHORD
在线阅读 下载PDF
实时视频处理系统中乒乓缓存的设计 被引量:19
16
作者 康艳霞 曹剑中 +2 位作者 田雁 车嵘 孙磊 《弹箭与制导学报》 CSCD 北大核心 2007年第4期218-221,共4页
实时视频处理系统中,采用乒乓缓存结构来为恒速的视频编解码与变速的DSP图像处理过程之间提供适应通道。文中比较了FIFO、双口RAM、乒乓缓存结构三种数据缓存电路的优缺点,讨论了乒乓缓冲控制器的结构和原理,并以高速、大容量的SRAM以及... 实时视频处理系统中,采用乒乓缓存结构来为恒速的视频编解码与变速的DSP图像处理过程之间提供适应通道。文中比较了FIFO、双口RAM、乒乓缓存结构三种数据缓存电路的优缺点,讨论了乒乓缓冲控制器的结构和原理,并以高速、大容量的SRAM以及FPGA器件为基础,设计了一种适应于高速DSP图像处理系统的乒乓缓存结构,其特点是速度快、所需器件少,易于与DSP器件接口。 展开更多
关键词 乒乓缓存 实时视频处理 FPGA DSP
在线阅读 下载PDF
Flash存储技术 被引量:86
17
作者 郑文静 李明强 舒继武 《计算机研究与发展》 EI CSCD 北大核心 2010年第4期716-726,共11页
Flash存储器具有非易失性、固态性、体积小、重量轻、抗震动、高性能、低能耗等特点.近年来,随着容量的提高和价格的降低,Flash存储器在通用计算环境中的应用技术迅速成为研究热点.研究的目的是对Flash存储技术研究现状进行分析、总结,... Flash存储器具有非易失性、固态性、体积小、重量轻、抗震动、高性能、低能耗等特点.近年来,随着容量的提高和价格的降低,Flash存储器在通用计算环境中的应用技术迅速成为研究热点.研究的目的是对Flash存储技术研究现状进行分析、总结,以期为进一步的研究工作提供启发.首先介绍了Flash的存储特性,探讨了其在存储体系结构中地位,并讨论了管理Flash存储器的两种软件体系结构.然后重点分析、总结了Flash存储的各项关键技术的研究现状,包括地址映射机制、垃圾回收机制、磨损均衡策略、基于Flash的buffercache管理策略、基于Flash的索引数据结构以及基于Flash的事务处理技术.最后对Flash存储技术的研究现状进行总结,提出可能的未来研究方向. 展开更多
关键词 闪存 存储管理 闪存转换层 缓存 索引数据结构 事务处理 垃圾回收
在线阅读 下载PDF
基于内存映射文件技术的海量影像数据快速读取方法 被引量:12
18
作者 胡伟忠 刘南 刘仁义 《计算机应用研究》 CSCD 北大核心 2005年第2期111-112,107,共3页
随着信息技术和传感器技术的飞速发展,使得遥感图像的数据量呈几何级数的递增,而传统的利用文件指针来读取文件的方法,只能正确读取2GB以下的数据。针对此种情况,提出了新方法,并分析了其关键技术,用VC++给出了实现的代码。
关键词 内存映射文件技术 金字塔结构 缓存技术 图像分块
在线阅读 下载PDF
基于DSP的红外标志点实时跟踪方法研究 被引量:10
19
作者 刘鑫 王涌天 刘越 《仪器仪表学报》 EI CAS CSCD 北大核心 2010年第12期2654-2660,共7页
提出了一种DSP实现的红外标志点实时跟踪方法。使用DSP的直接内存读取(DMA)传输方式后台传输图像数据,通过引入DSP片上乒乓缓存结构实现了对多个红外标志点的实时连通域标记、标志点识别和标志点跟踪等操作。实验结果表明,原始图像传输... 提出了一种DSP实现的红外标志点实时跟踪方法。使用DSP的直接内存读取(DMA)传输方式后台传输图像数据,通过引入DSP片上乒乓缓存结构实现了对多个红外标志点的实时连通域标记、标志点识别和标志点跟踪等操作。实验结果表明,原始图像传输结束时即可得到实时处理结果,消除了传统硬件和软件方法中的延时;红外标志点的连通域标记精度达到亚像素级。算法经优化后实际耗时为5.574ms,仅占CPU总时钟周期的16.72%,能够满足高速图像处理应用场合对实时性的要求。 展开更多
关键词 连通域标记 红外标志跟踪技术 射影变换 乒乓缓存结构
在线阅读 下载PDF
机群文件系统的缓存机制分析与研究 被引量:1
20
作者 王强 花嵘 安效国 《山东科技大学学报(自然科学版)》 CAS 2005年第3期75-77,共3页
针对传统的三层缓存体系结构中存在的问题,提出了协作缓存机制,使系统中各节点的缓存资源得到协调和充分的利用,进一步提高了文件访问的效率,解决了文件服务器容易成为系统的瓶颈而影响文件系统的效率问题;并对几个常见的协作缓存管理... 针对传统的三层缓存体系结构中存在的问题,提出了协作缓存机制,使系统中各节点的缓存资源得到协调和充分的利用,进一步提高了文件访问的效率,解决了文件服务器容易成为系统的瓶颈而影响文件系统的效率问题;并对几个常见的协作缓存管理算法进行简要的分析。 展开更多
关键词 三层缓存体系结构 协作式缓存 协作缓存管理 缓存容量 命中率 效率
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部