期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
微处理器性能分析与优化:基于SPEC CPU2017的对比研究
1
作者 徐晗 郭振江 肖俊华 《高技术通讯》 北大核心 2025年第3期241-249,共9页
运行标准测试程序是进行微处理器设计空间探索的基本手段。横向对比分析国内外主流处理器在标准测试程序场景下的各项性能指标,有助于识别国产处理器的性能瓶颈,为进一步的性能优化指明方向。本文基于SPEC CPU2017对3款微处理器进行同... 运行标准测试程序是进行微处理器设计空间探索的基本手段。横向对比分析国内外主流处理器在标准测试程序场景下的各项性能指标,有助于识别国产处理器的性能瓶颈,为进一步的性能优化指明方向。本文基于SPEC CPU2017对3款微处理器进行同频性能测试和对比分析,分别是龙芯LA464架构的3A5000微处理器、AMD ZEN1架构的R3-1200以及Intel Skylake架构的i3-9100f。根据测试结果,3A5000定点性能与R3-1200基本相同,比i3-9100f低10%左右;3A5000浮点性能相当于另2款微处理器的70%左右。本文从动态指令数和每周期指令数(instruction per cycle,IPC)2个角度对微处理器进行比较和分析。基于SPEC CPU2017的结果显示,3A5000定点动态指令数和浮点动态指令数分别比另2款微处理器多约10%和25%。在3A5000上使用激进的自动向量化编译优化策略、优化立即数乘法编译效率等手段可以将其性能提升10%左右。3A5000的定点IPC比另外2款微处理器高4%左右,浮点IPC低8%左右。发射宽度、执行单元数量、功能和延迟等微结构参数接近是3款微处理器IPC差别较小的主要原因。 展开更多
关键词 SPEC cpu2017 性能分析 龙芯3A5000 向量化 体系结构
在线阅读 下载PDF
Intel Cascade Lake架构CPU SPEC CPU2017评测 被引量:4
2
作者 杜琦 黄卉 +2 位作者 龚盛 刘新娃 黄春 《计算机工程与科学》 CSCD 北大核心 2021年第1期49-57,共9页
SPEC CPU2017基准包中包含SPEC的下一代行业标准,是目前CPU性能评测的客观和可信的基准程序之一。采用SPEC CPU2017对Intel Cascade Lake架构的Intel Xeon Gold 6252N型号CPU做了不同内存频率、不同副本数、打开/关闭Turbo的组合测试,... SPEC CPU2017基准包中包含SPEC的下一代行业标准,是目前CPU性能评测的客观和可信的基准程序之一。采用SPEC CPU2017对Intel Cascade Lake架构的Intel Xeon Gold 6252N型号CPU做了不同内存频率、不同副本数、打开/关闭Turbo的组合测试,总结了不同应用程序在不同配置组合中的性能表现。同时,还对比测试了Intel Ivy Bridge架构的Intel Xeon E5-2692 v2型号CPU和Intel Haswell架构的Intel Xeon E5-2620 v3型号CPU,通过引入计算访存跑分比PBR的概念,分析了3种架构的硬件功能部件的增加对应用程序的性能影响。 展开更多
关键词 SPEC cpu2017 Intel Cascade Lake Intel Ivy Bridge Intel Haswell 计算访存跑分比
在线阅读 下载PDF
基于SPEC CPU2017的CPU性能对比分析 被引量:3
3
作者 赵龙飞 李晓婷 +1 位作者 丁振兰 姚日煌 《电子产品可靠性与环境试验》 2021年第S01期55-59,共5页
通过对国产CPU进行了研究,介绍了目前国产CPU的发展情况。选取了基于ARM架构的某款国产CPU Hi1616,使用国际权威的CPU性能测试工具SPEC CPU2017对其和基于X86架构的Intel E5-2650v4做了比较,分别从不同线程数下的计算速度性能和不同任... 通过对国产CPU进行了研究,介绍了目前国产CPU的发展情况。选取了基于ARM架构的某款国产CPU Hi1616,使用国际权威的CPU性能测试工具SPEC CPU2017对其和基于X86架构的Intel E5-2650v4做了比较,分别从不同线程数下的计算速度性能和不同任务拷贝数下的吞吐量性能两个方面比较了两款CPU的性能,最后,验证了编译器GCC版本对测试结果的影响。结果显示,在多任务高并发计算场景下,Hi1616更具有性能优势,Intel E5-2609v4能够较好地满足单线程科学计算场景的要求。 展开更多
关键词 ARM 中央处理器 SPEC cpu2017 性能测试
在线阅读 下载PDF
CPUBench:一款开放的通用计算CPU性能基准工具 被引量:3
4
作者 逯海涛 任翔 +2 位作者 钟伟军 赵鑫 尹航 《微电子学与计算机》 2023年第5期75-83,共9页
计算产品性能基准工具是支撑计算产品性能迭代优化和牵引计算产业能力提升的重要保障.为弥补当前国内CPU性能评测基准工具的空白,开发了CPUBench,定位于对通用计算场景下的CPU、内存子系统以及所依赖的编译器进行综合计算能力评估.CPUBe... 计算产品性能基准工具是支撑计算产品性能迭代优化和牵引计算产业能力提升的重要保障.为弥补当前国内CPU性能评测基准工具的空白,开发了CPUBench,定位于对通用计算场景下的CPU、内存子系统以及所依赖的编译器进行综合计算能力评估.CPUBench测试框架采用Python语言开发,模块化设计,兼容x86_64、aarch64、ppc64le、sw_64和loongarch64等多种CPU架构.测试负载来源于各领域典型业务场景的计算密集型应用,具有良好的实际业务代表性,从指令比例、Top-down等架构相关或无关特征看,负载之间特征差异明显,整个测试套件的特征覆盖广,能够充分代表目前通用计算场景下的实际业务特征.同时通过PCA分析方法对比CPUBench和SPEC CPU2017在相同测试环境上的微架构特征,CPUBench基本覆盖SPEC CPU2017的特征类,并增加了大数据、数据库等新型应用的特征.此外,在14个不同的被测平台上对CPUBench和SPEC CPU2017两款工具进行了测试比较,测试分数曲线显示出良好的趋势一致性,间接证明CPUBench作为一款通用计算CPU性能评测基准工具的可用性与合理性.总体上,CPUBench在业务代表性、易用性、易维护性等方面具备一定的优势,可用于指导通用计算CPU、服务器等计算产品的设计优化、规格选型和市场采购等工作,对计算产业的发展具有重要的牵引意义. 展开更多
关键词 通用计算CPU 性能 基准工具 SPEC cpu2017
在线阅读 下载PDF
通用计算CPU性能基准现状及发展分析 被引量:2
5
作者 刘博文 刘立新 杨辉华 《信息技术与标准化》 2023年第1期37-41,53,共6页
针对国内外计算性能基准现状进行了分析,主要包括国际标准基准测试套件、整机性能基准测试、SPEC CPU2017、NAS并行基准测试、国际标准以及国内标准等现状,并对我国基准公平性、基准适用性、基准体系标准化等方面进行了详细的探讨,最后... 针对国内外计算性能基准现状进行了分析,主要包括国际标准基准测试套件、整机性能基准测试、SPEC CPU2017、NAS并行基准测试、国际标准以及国内标准等现状,并对我国基准公平性、基准适用性、基准体系标准化等方面进行了详细的探讨,最后对CPU性能基准测试的未来发展进行了展望。 展开更多
关键词 计算性能基准 SPEC cpu2017 公平性 基准适用性
在线阅读 下载PDF
基于GCC编译器向量化的数据结构布局优化研究
6
作者 朱广林 赖庆宽 +2 位作者 何先波 王博生 陈燕生 《绵阳师范学院学报》 2021年第5期85-89,共5页
有效利用单指令多数据(SIMD)技术能提高应用程序的性能,现代处理器和编译器都在不断地对SIMD技术进行扩展和改进,以生成向量化程度更高的代码.本文主要对现代x86多核处理器中,GCC编译器的数据结构布局进行优化,通过改善内存布局方式,提... 有效利用单指令多数据(SIMD)技术能提高应用程序的性能,现代处理器和编译器都在不断地对SIMD技术进行扩展和改进,以生成向量化程度更高的代码.本文主要对现代x86多核处理器中,GCC编译器的数据结构布局进行优化,通过改善内存布局方式,提高向量化优化能力.最后在AMD平台上采用SPEC CPU2017进行实验,验证了该方法在GCC编译器上的有效性. 展开更多
关键词 单指令多数据 x86多核处理器 数据结构布局 SPEC cpu2017 GCC编译器
在线阅读 下载PDF
Roofline Model-Guided Compilation Optimization Parameter Selection Method
7
作者 Qi Du Hui Huang Chun Huang 《国际计算机前沿大会会议论文集》 2020年第1期268-282,共15页
In this paper,the method of roofline model-guided compilation optimization parameter selection(RMOPS)is proposed based on Roofline model to maximize the performance of targets.Through the orthogonal test design compil... In this paper,the method of roofline model-guided compilation optimization parameter selection(RMOPS)is proposed based on Roofline model to maximize the performance of targets.Through the orthogonal test design compiler,the problem of optimization parameter selection in complex dependencies was solved.The performance data generated by empirical roofline tool(ERT)were used to implement the optimization parameter selection decision.RMOPS method was evaluated on ARMv8 platform,and the feasibility of RMOPS method was verified by using SPEC CPU2017 and NPB.Experimental results show that the program performance obtained by using the optimal optimization parameters of RMOPS search is generally improved by 5%–33%compared with that achieved by-O3 optimization parameter setting. 展开更多
关键词 Roofline RMOPS ERT NPB SPEC cpu2017
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部