期刊文献+
共找到30,653篇文章
< 1 2 250 >
每页显示 20 50 100
基于开源处理器的间接访问数据预取器设计
1
作者 宗鹏陈 曲劭儒 +2 位作者 赵文哲 任鹏举 夏天 《集成电路与嵌入式系统》 2026年第1期47-53,共7页
间接内存访问在图计算、稀疏线性代数等数据密集型应用中广泛存在,其非规则访存模式因时空局部性差导致缓存性能显著下降。传统流式预取器难以有效捕获通过索引数组动态计算目标地址的访问模式(如x[a[i]])。文中提出动态多模式感知预取... 间接内存访问在图计算、稀疏线性代数等数据密集型应用中广泛存在,其非规则访存模式因时空局部性差导致缓存性能显著下降。传统流式预取器难以有效捕获通过索引数组动态计算目标地址的访问模式(如x[a[i]])。文中提出动态多模式感知预取器(DMP)来解决这一挑战:DMP采用轻量化移位差分匹配机制,比较索引数据序列与目标地址序列,完成间接访问模式的识别;基于开源玄铁C910 RISC V处理器的FPGA原型验证表明,DMP使稀疏矩阵向量乘(SpMV)的L1数据缓存缺失率降低了27.3%,算法运行时间加速了1.07~1.22倍。实验结果证明,DMP在提升间接访存性能的同时,保持了低硬件开销与高可移植性,为现代处理器非规则访存优化提供了实用解决方案。 展开更多
关键词 数据预取 间接内存访问 缓存优化 非连续访问 硬件高效性 非规则访存
在线阅读 下载PDF
岩土工程三维建模与可视化设计
2
作者 孙春雨 刘永振 《科学技术创新》 2026年第1期162-165,共4页
为了提升岩土工程勘察设计的可视化水平与决策效率,开展岩土工程三维建模与可视化设计研究。通过介绍三维建模与可视化设计方法,分析基坑开挖体建模、地质体集成及可视化分析的关键技术。研究提出基于钻孔数据的基坑三维建模流程,采用... 为了提升岩土工程勘察设计的可视化水平与决策效率,开展岩土工程三维建模与可视化设计研究。通过介绍三维建模与可视化设计方法,分析基坑开挖体建模、地质体集成及可视化分析的关键技术。研究提出基于钻孔数据的基坑三维建模流程,采用投影与三角剖分构建几何模型。通过布尔运算实现基坑与地质体的拓扑无缝集成,确保交界处的几何一致性。结合特征纹理映射与属性信息融合,增强模型表现力与数据分析能力。研究结果表明:三维可视化技术能够直观展现地层结构与工程空间关系,辅助基坑支护优化与施工模拟,有效支持土方量计算与碰撞检测,为复杂岩土工程的设计与施工提供科学依据,显著提高工程管理的精确性与效率。 展开更多
关键词 岩土 工程 三维 建模 可视化 特征纹理
在线阅读 下载PDF
A Subdomain-Based GPU Parallel Scheme for Accelerating Perdynamics Modeling with Reduced Graphics Memory
3
作者 Zuokun Yang Jun Li +1 位作者 Xin Lai Lisheng Liu 《Computer Modeling in Engineering & Sciences》 2026年第1期256-285,共30页
Peridynamics(PD)demonstrates unique advantages in addressing fracture problems,however,its nonlocality and meshfree discretization result in high computational and storage costs.Moreover,in its engineering application... Peridynamics(PD)demonstrates unique advantages in addressing fracture problems,however,its nonlocality and meshfree discretization result in high computational and storage costs.Moreover,in its engineering applications,the computational scale of classical GPU parallel schemes is often limited by the finite graphics memory of GPU devices.In the present study,we develop an efficient particle information management strategy based on the cell-linked list method and on this basis propose a subdomain-based GPU parallel scheme,which exhibits outstanding acceleration performance in specific compute kernels while significantly reducing graphics memory usage.Compared to the classical parallel scheme,the cell-linked list method facilitates efficient management of particle information within subdomains,enabling the proposed parallel scheme to effectively reduce graphics memory usage by optimizing the size and number of subdomains while significantly improving the speed of neighbor search.As demonstrated in PD examples,the proposed parallel scheme enhances the neighbor search efficiency dramatically and achieves a significant speedup relative to serial programs.For instance,without considering the time of data transmission,the proposed scheme achieves a remarkable speedup of nearly 1076.8×in one test case,due to its excellent computational efficiency in the neighbor search.Additionally,for 2D and 3D PD models with tens of millions of particles,the graphics memory usage can be reduced up to 83.6%and 85.9%,respectively.Therefore,this subdomain-based GPU parallel scheme effectively avoids graphics memory shortages while significantly improving the computational efficiency,providing new insights into studying more complex large-scale problems. 展开更多
关键词 PERIDYNAMICS GPU CUDA parallel computing cell-linked list
在线阅读 下载PDF
工业实时控制用容错双发射RISC-V处理器架构
4
作者 王诗怡 《无线互联科技》 2026年第1期1-6,共6页
为满足工业实时控制对高性能和高可靠性的需求,文章提出一款容错型双发射RISC-V处理器。其架构采用双发射乱序流水线与轻量级向量执行单元,提高控制算法执行效率;硬件级快速中断机制将响应降低至百纳秒级,增强系统确定性。针对工业环境... 为满足工业实时控制对高性能和高可靠性的需求,文章提出一款容错型双发射RISC-V处理器。其架构采用双发射乱序流水线与轻量级向量执行单元,提高控制算法执行效率;硬件级快速中断机制将响应降低至百纳秒级,增强系统确定性。针对工业环境软错误,文章设计轻量级双模冗余(Dual-Modular Redundancy, DMR)与局部检查点机制,实现低成本容错。外设互联和模拟前端采用紧耦合与抗干扰结构,以降低访问延迟并提升数据稳定性。基于40 nm工艺实现的处理器在800 MHz下功耗不足500 mW,表现出良好的工业应用潜力。 展开更多
关键词 RISC-V 工业控制处理器 软错误容错 DMR 外设互联架构
在线阅读 下载PDF
隼瞻科技ArchitStudio:用“软件定义硬件”引爆RISC-V DSA黄金时代
5
《计算机应用文摘》 2026年第3期249-251,254,共4页
时代背景:AI与RISC-V融合催生新需求。随着人工智能技术以前所未有的速度向千行百业加速渗透,端侧AI正逐渐成为推动各行业智能化变革的核心力量。在智能家居、智能穿戴、工业自动化、智能安防等领域,端侧设备需要具备本地实时处理数据... 时代背景:AI与RISC-V融合催生新需求。随着人工智能技术以前所未有的速度向千行百业加速渗透,端侧AI正逐渐成为推动各行业智能化变革的核心力量。在智能家居、智能穿戴、工业自动化、智能安防等领域,端侧设备需要具备本地实时处理数据的能力,以减少对云端计算的依赖,加快响应速度、保障数据安全并降低网络带宽成本。这一趋势催生了海量、多样且碎片化的算力需求,不同应用场景对算力的性能、功耗、成本等方面提出了各具特色的要求。 展开更多
关键词 智能家居 端侧AI 智能化变革 智能穿戴
在线阅读 下载PDF
搭载卷积神经网络加速模块的微处理器设计
6
作者 黄彦涵 《现代信息科技》 2026年第1期17-21,共5页
当前人工智能技术迅速发展,针对轻量化边缘侧AI计算的需求日益增长。文章提出一种基于ARM与FPGA协同的卷积神经网络(CNN)推理硬件加速方案。首先,在主机端使用PyTorch完成模型训练与量化,获得权重与偏置参数;随后在FPGA上并行实现卷积... 当前人工智能技术迅速发展,针对轻量化边缘侧AI计算的需求日益增长。文章提出一种基于ARM与FPGA协同的卷积神经网络(CNN)推理硬件加速方案。首先,在主机端使用PyTorch完成模型训练与量化,获得权重与偏置参数;随后在FPGA上并行实现卷积、池化及全连接运算,并通过AHB总线与CPU交互。最后,在PZ7020开发板上进行测试,实验结果表明,该处理器能够对输入图像进行准确识别与分析。该方案为资源受限场景下的边缘侧AI推理提供了高效可行的技术路径。 展开更多
关键词 PyTorch CNN FPGA 微处理器
在线阅读 下载PDF
兆芯开胜KH-50000服务器处理器荣登2025人民匠心产品
7
《中国集成电路》 2026年第1期71-71,共1页
近日,2025人民匠心品牌宣传展示活动案例名单正式公布。本次活动以“匠心铸魂质启新程”为主题,面向各行业、各领域征集质量过硬、优势突出的产品、技术、服务与品牌,经过多轮审核与遴选,最终形成人民匠心产品等四大类别优秀实践案例。
关键词 质启新程 人民匠心品牌 兆芯开胜KH-50000
在线阅读 下载PDF
一种基于申威处理器的全国产化模块设计
8
作者 赵锦阳 颜嘉元 沈秀风 《工业控制计算机》 2026年第2期32-33,96,共3页
随着日益严峻的国际形势,我国对电子信息基础设施领域自主可控的需求越来越迫切,针对申威新推出的SW831国产嵌入式桌面级处理器,根据COM Express V2.0标准设计了一款TYPE 6型全国化COMe功能模块。COMe模块结构紧凑灵活,内部集成有核心... 随着日益严峻的国际形势,我国对电子信息基础设施领域自主可控的需求越来越迫切,针对申威新推出的SW831国产嵌入式桌面级处理器,根据COM Express V2.0标准设计了一款TYPE 6型全国化COMe功能模块。COMe模块结构紧凑灵活,内部集成有核心处理器、内存、USB、SATA、PCIe以太网和视频等主流扩展外围接口,具有极强的扩展性,能够帮助申威处理器的开发者快速搭建应用环境,缩短项目开发周期,对助力国产处理器推广具有一定现实意义。 展开更多
关键词 COMe模块 SW831 国产化
在线阅读 下载PDF
基于CKS32F103CBT6的脱机烧录器设计
9
作者 王云飞 张弘 常浩 《工业控制计算机》 2026年第1期103-104,106,共3页
设计了一种基于串口在系统编程(In-System Programming,ISP)和串行口调试(Serial Wire Debug,SWD)技术的脱机烧录器,实现了对ARM微控制器的编程。结合客户需求及实际工作经验,给出一种脱机烧录器的设计方案,该方案以CKS32F103CBT6为主... 设计了一种基于串口在系统编程(In-System Programming,ISP)和串行口调试(Serial Wire Debug,SWD)技术的脱机烧录器,实现了对ARM微控制器的编程。结合客户需求及实际工作经验,给出一种脱机烧录器的设计方案,该方案以CKS32F103CBT6为主控芯片,采用了断点续传、数据加密、自动烧录等概念。介绍了烧录器的硬件框图及软件流程图。测试结果表明,该烧录器工作稳定、使用方便,能有效提高下载效率。 展开更多
关键词 烧录器 断点续传 微控制器
在线阅读 下载PDF
超导量子处理器芯片工艺线中金属污染问题的研究
10
作者 徐晓 张海斌 +9 位作者 宿非凡 严凯 荣皓 邓辉 杨新迎 马效腾 董学 王绮名 刘佳林 李满满 《物理学报》 北大核心 2026年第1期316-322,共7页
超导量子处理器芯片的制造工艺面临特殊的金属污染挑战,其材料体系和工艺特性与传统半导体芯片存在显著差异.本研究系统分析了量子芯片中金属污染的来源、扩散机制及防控策略,重点探讨了超导材料(如Ta,Nb,Al,TiN等)在蓝宝石和硅衬底上... 超导量子处理器芯片的制造工艺面临特殊的金属污染挑战,其材料体系和工艺特性与传统半导体芯片存在显著差异.本研究系统分析了量子芯片中金属污染的来源、扩散机制及防控策略,重点探讨了超导材料(如Ta,Nb,Al,TiN等)在蓝宝石和硅衬底上的体扩散与表面扩散行为.研究发现,蓝宝石衬底因其致密晶格结构表现出优异的抗扩散性能,而硅衬底需重点关注Au,In,Sn等易迁移金属的污染风险.通过实验验证,Ti/Au结构的凸点下金属化层在硅衬底上易发生Au穿透扩散,且增加Ti层厚度无法显著改善阻挡效果.量子芯片的低温工艺(<250℃)和超低温工作环境(mK级)有效抑制了金属扩散,但暴露的金属表面和材料多样性仍带来独特挑战.研究建议建立量子芯片专属的金属污染防控体系,并提出了后续在新型材料评估、表面态调控及长期可靠性研究等方向的发展路径.本文为超导量子芯片的工艺优化和性能提升提供了重要理论支撑和技术指导. 展开更多
关键词 超导量子处理器芯片 工艺线金属污染 体扩散 表面扩散
在线阅读 下载PDF
碳纤维增强树脂复合材料制孔技术研究进展
11
作者 袁艳萍 郭筱然 +2 位作者 王文博 陈磊 汪洋 《北京工业大学学报》 北大核心 2025年第7期835-850,共16页
碳纤维增强树脂复合材料是以碳纤维为增强体、树脂为基体的复合材料,因其质量轻、耐腐蚀、抗疲劳等优良特性,逐渐替代了许多传统金属材料,广泛应用于航空航天、车辆制造、船舶运输等领域。碳纤维增强树脂复合材料的各向异性及非均质特... 碳纤维增强树脂复合材料是以碳纤维为增强体、树脂为基体的复合材料,因其质量轻、耐腐蚀、抗疲劳等优良特性,逐渐替代了许多传统金属材料,广泛应用于航空航天、车辆制造、船舶运输等领域。碳纤维增强树脂复合材料的各向异性及非均质特性给加工带来了极大挑战和困难,尤其是大型复合材料的连接装配避免不了小孔结构的加工,但是孔周围产生的应力集中会显著降低连接件的抗疲劳性能。基于此,该文系统综述了碳纤维增强树脂复合材料的制孔方法及其特点。首先,阐述了不同加工工艺下碳纤维增强树脂复合材料制孔的研究进展,并分析了不同工艺下产生的主要缺陷,包括孔的表面形貌特征(如边沿毛刺、撕裂、热影响区、表面粗糙度等)和孔的侧壁形貌特征(如纤维分层、孔锥度、侧壁粗糙度等)。其次,针对复材层板的强度和破坏模式,综述了孔加工对复材层板性能的影响。最后,总结和讨论了碳纤维增强树脂复合材料制孔技术的发展趋势和前景。 展开更多
关键词 碳纤维增强树脂复合材料 孔加工 缺陷 工艺研究 开孔拉伸 数值模拟
在线阅读 下载PDF
基于多核DSP架构并行编程技术的研究
12
作者 吕大鹏 杨珂瑶 王宏伟 《信息技术与信息化》 2026年第2期67-71,共5页
为适配嵌入式系统中多核处理器的广泛应用需求,充分发挥多核架构优势以提升系统整体性能,并行编程技术已成为核心支撑手段。文章聚焦多核DSP架构,围绕OpenMP并行编程技术开展系统性研究。首先,系统阐述OpenMP并行编程模型的核心原理、... 为适配嵌入式系统中多核处理器的广泛应用需求,充分发挥多核架构优势以提升系统整体性能,并行编程技术已成为核心支撑手段。文章聚焦多核DSP架构,围绕OpenMP并行编程技术开展系统性研究。首先,系统阐述OpenMP并行编程模型的核心原理、编程规范及运行机制,明确其在多核平台上的并行调度逻辑;其次,结合编译器编译优化行为与OpenMP运行时库的工作机制,深入剖析该编程模型在多核DSP架构上的底层实现逻辑与适配特性,厘清软硬件协同工作的关键环节;最后,针对多核DSP核间数据隔离的固有特性,提出一种基于消息传递的OpenMP并行启动机制,有效解决核间协同启动的兼容性问题,为OpenMP技术在多核DSP平台的高效应用提供技术支撑。 展开更多
关键词 OPENMP 并行编程 多核DSP架构 消息传递 并行启动
在线阅读 下载PDF
洞察
13
作者 《科学画报》 2026年第1期19-19,共1页
NPU有望成为GPU的继任者在大模型的时代,图形处理单元(GPU)对绝大多数AI从业者来说是每天都会提及的一个关键概念。与擅长进行逻辑运算的中央处理单元(CPU)相比,GPU更适合处理大量且简单的矩阵计算任务。这也使GPU成为当下AI能力比拼的... NPU有望成为GPU的继任者在大模型的时代,图形处理单元(GPU)对绝大多数AI从业者来说是每天都会提及的一个关键概念。与擅长进行逻辑运算的中央处理单元(CPU)相比,GPU更适合处理大量且简单的矩阵计算任务。这也使GPU成为当下AI能力比拼的核心指标。然而,GPU的大规模计算能力让AI应用面临高投入和高能耗的挑战。为此,神经处理单元(NPU)基于GPU进行了针对AI计算任务的优化,如专门针对神经网络算法的优化、处理单元的小型化及更低的能耗等,有望成为一种更具性价比的替代。 展开更多
关键词 AI 图形处理单元 中央处理单元 GPU NPU
原文传递
RISC-V:开放指令集驱动人工智能与高性能计算革新
14
作者 孙冉 李成哲 +2 位作者 魏宏亮 吴震 刘超 《人工智能与机器人研究》 2026年第1期180-187,共8页
作为一种基于精简指令集计算(RISC)原则的开源指令集架构(ISA),RISC-V正深刻变革全球人工智能(AI)与高性能计算(HPC)的产业格局。其开放、模块化与可扩展性为处理器设计带来了前所未有的灵活性,成为应对AI、HPC等领域定制化需求的关键... 作为一种基于精简指令集计算(RISC)原则的开源指令集架构(ISA),RISC-V正深刻变革全球人工智能(AI)与高性能计算(HPC)的产业格局。其开放、模块化与可扩展性为处理器设计带来了前所未有的灵活性,成为应对AI、HPC等领域定制化需求的关键解决方案。本文系统梳理RISC-V的发展历程、技术特点与生态现状,结合典型案例深入探讨其在不同领域的应用实践,通过量化对比与规范引用强化论证,并对其未来发展面临的挑战和机遇进行展望。 展开更多
关键词 RISC-V 精简指令集 BSD 人工智能 高性能计算
在线阅读 下载PDF
基于双输出C单元的抗三节点翻转锁存器设计
15
作者 唐叶 《现代信息科技》 2026年第4期13-16,23,共5页
随着CMOS技术发展推动晶体管尺寸的缩小,由辐射引起的CMOS电路三节点翻转(Triple-Node Upset,TNU)已成为威胁存储器件可靠性的一个重要问题。为了缓解软错误对集成电路的影响,文章提出了一种能够容忍三节点翻转(TNUs)的低开销锁存器设计... 随着CMOS技术发展推动晶体管尺寸的缩小,由辐射引起的CMOS电路三节点翻转(Triple-Node Upset,TNU)已成为威胁存储器件可靠性的一个重要问题。为了缓解软错误对集成电路的影响,文章提出了一种能够容忍三节点翻转(TNUs)的低开销锁存器设计(LCDOCTL)。LCDOCTL锁存器主要由一个存储模块与一个拦截模块组成,并利用单元间的数据反馈有效实现TNU的容忍。HSPICE仿真结果表明,所提出的LCDOCTL锁存器与现存的三节点翻转容忍锁存器设计相比,平均可节省5.1%的面积、70.31%的传输延迟、44.12%的功耗以及84.66%的PDP。 展开更多
关键词 辐射 软错误 锁存器 三节点翻转(TNU) 容忍
在线阅读 下载PDF
深度学习技术下数字图像处理系统研究与设计
16
作者 姚瑶 《软件》 2025年第12期49-51,共3页
为了解决现有图像处理系统处理效果不理想的问题,本文对基于深度学习的数字图像处理系统进行设计。系统采用分层与模块化架构,集成基于卷积神经网络的图像超分辨率重建及基于生成对抗网络的图像修复功能,可通过多层次特征提取、多尺度... 为了解决现有图像处理系统处理效果不理想的问题,本文对基于深度学习的数字图像处理系统进行设计。系统采用分层与模块化架构,集成基于卷积神经网络的图像超分辨率重建及基于生成对抗网络的图像修复功能,可通过多层次特征提取、多尺度映射与对抗训练等显著提升图像处理质量及效率。实验结果显示,系统可通过超分辨率重建增强图像细节辨识度,同时,通过图像修复精准恢复纹理与语义内容,输出结果在视觉保真度和结构完整性方面均达到较高水平。 展开更多
关键词 数字图像处理 卷积神经网络 生成对抗网络 超分辨率重建 图像修复 深度学习
在线阅读 下载PDF
一种基于DVFS特性曲线的异构计算单元低功耗协同调度方法
17
作者 徐梦溪 刘姝怡 +2 位作者 刘梓莹 丁铄阳 刘姝悦 《软件工程与应用》 2025年第6期1219-1230,共12页
针对工业边缘计算环境中任务动态到达、实时性要求高、资源受限且能耗敏感的问题,本文提出一种基于DVFS特性曲线的异构计算单元低功耗协同调度方法(简称:CS-HCU-DVFS)。该方法融合任务调度与硬件功耗管理,实现调度决策与能效调控的协同... 针对工业边缘计算环境中任务动态到达、实时性要求高、资源受限且能耗敏感的问题,本文提出一种基于DVFS特性曲线的异构计算单元低功耗协同调度方法(简称:CS-HCU-DVFS)。该方法融合任务调度与硬件功耗管理,实现调度决策与能效调控的协同优化。框架由任务特征分析、能效感知调度引擎和DVFS协同调控模块组成:任务特征分析模块提取任务类型、数据量及截止时间;调度引擎结合异构单元的功耗–性能特性表(PPCT),以能效比最大化为目标,查表确定最优计算单元与运行频率;DVFS模块据此动态配置电压与时钟频率,并通过抑制频繁切换提升系统稳定性。执行完成后,计算单元反馈状态信息至调度引擎,形成闭环调控机制。实验结果表明,该方法在满足任务实时性约束的前提下,有效降低系统能耗,提升整体能效。该方法调度开销低,适用于资源受限的工业边缘计算场景。 展开更多
关键词 DVFS特性曲线 异构计算单元 能效感知调度 协同调控 边缘计算
在线阅读 下载PDF
一种基于VCD表示的CHI协议事务解析验证方法
18
作者 张剑锋 邵靖杰 +1 位作者 廖湘龙 曾聘 《集成电路与嵌入式系统》 2025年第12期66-75,共10页
传统硬件验证依赖人工分析波形信号,面临效率低、易出错、事务级行为难以追溯等问题,文中提出一种基于VCD数据和PyVCD库的多核处理器中CHI协议验证的辅助工具,可以提高事务波形分析的效率。VCD(Value Change Dump)是国际标准的Verilog... 传统硬件验证依赖人工分析波形信号,面临效率低、易出错、事务级行为难以追溯等问题,文中提出一种基于VCD数据和PyVCD库的多核处理器中CHI协议验证的辅助工具,可以提高事务波形分析的效率。VCD(Value Change Dump)是国际标准的Verilog波形数据文件格式,PyVCD是一个开源的纯Python代码库,用于解析VCD文件。通过tcl脚本从各种仿真工具中导出指定信号的波形数据,并将其转换为VCD格式。再使用PyVCD库对波形进行算法分析,实现波形结构化解析与事务重构算法,将分布的Flit数据聚合为完整事务对象序列。获取波形数据并将不同节点不同通道的离散Flit组合为完整的事务。在获得事务对象序列后,将事务对象转换为ASCII字符串,生成字符信号序列并生成VCD文件,用于在波形软件中查看事务级波形,解析协议中事务的性能参数,而且开发了Goldmemory工具,分析系统中多个节点的事务对象序列,自动判断数据错误等场景。基于该方法的平台已在多核处理器工程中部署,通过波形分析CHI事务,大幅提高了仿真验证的效率,同时能够快速定位架构设计的性能瓶颈以实现架构的快速迭代优化。 展开更多
关键词 集成验证 VCD文件 系统级芯片 多核处理器 仿真验证
在线阅读 下载PDF
高性能GPU计算集群应用体系建设 被引量:2
19
作者 杨敏 何芸 +1 位作者 许涛 景少军 《信息系统工程》 2025年第3期102-105,共4页
在长期分析研究高密度数据处理项目作业运行特点的基础上,归纳常规处理和偏移处理两大类应用下,不同处理方法实现模块的资源需求特点及处理员的作业模式,优化组合集群计算、存储、网络三元素技术发展路线及产品性能参数,搭建了硬件架构... 在长期分析研究高密度数据处理项目作业运行特点的基础上,归纳常规处理和偏移处理两大类应用下,不同处理方法实现模块的资源需求特点及处理员的作业模式,优化组合集群计算、存储、网络三元素技术发展路线及产品性能参数,搭建了硬件架构上适用于地震勘探处理应用的高性能GPU计算集群系统。综合应用镜像管理、多种子点分发等多种集群管理及作业调度技术,实现异构集群统一管理及监控,实现油田高性能计算资源共享,高效提升处理生产大规模计算能力,实现绿色高效体系建设。 展开更多
关键词 高性能计算 GPU XCAT 集群管理
在线阅读 下载PDF
NA-ROB:基于RISC-V超标量处理器的改进 被引量:2
20
作者 景超霞 刘杰 +1 位作者 李洪奎 刘红海 《计算机应用研究》 北大核心 2025年第2期519-522,共4页
重排序缓存(ROB)是超标量处理器中的重要模块,用于确保乱序执行的指令能够正确地完成和提交。然而,在大规模超标量处理器中,存在ROB阻塞以及ROB容量有限的问题。为了解决上述问题并提高处理器性能,提出了零寄存器分配策略,通过将没有目... 重排序缓存(ROB)是超标量处理器中的重要模块,用于确保乱序执行的指令能够正确地完成和提交。然而,在大规模超标量处理器中,存在ROB阻塞以及ROB容量有限的问题。为了解决上述问题并提高处理器性能,提出了零寄存器分配策略,通过将没有目的寄存器的指令单独存储来避免占用ROB表项。同时,引入容量可动态调整的缓存结构(AROB),将长延时指令与普通指令分别存储在ROB和AROB中,以降低长延时指令导致的阻塞。改进后的超标量处理器被命名为NA-ROB,经过SPEC 2006基准测试程序的实验评估,结果表明,NA-ROB超标量处理器相比于传统的ROB超标量处理器,平均IPC提升了66%,同时ROB的阻塞概率降低了48%。因此,所提出的改进方法显著提升了处理器的整体性能和效率。 展开更多
关键词 RISC-V指令集 超标量处理器 ROB AROB 零寄存器分配策略
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部