期刊文献+
共找到15,865篇文章
< 1 2 250 >
每页显示 20 50 100
Effect of Tooth Geometry on Multi-cycle Meshing Temperature of POM Worm Gears:Parametric Study via an Adaptive Iteration Algorithm
1
作者 Kaixing Li Wujiao Xu +1 位作者 Yonggang Liu Datong Qin 《Chinese Journal of Mechanical Engineering》 2025年第2期427-439,共13页
Meshing temperature analyses of polymer gears reported in the literature mainly concern the effects of various material combinations and loading conditions,as their impacts could be seen in the first few meshing cycle... Meshing temperature analyses of polymer gears reported in the literature mainly concern the effects of various material combinations and loading conditions,as their impacts could be seen in the first few meshing cycles.However,the effects of tooth geometry parameters could manifest as the meshing cycles increase.This study investigated the effects of tooth geometry parameters on the multi-cycle meshing temperature of polyoxymethylene(POM)worm gears,aiming to control the meshing temperature elevation by tuning the tooth geometry.Firstly,a finite element(FE)model capable of separately calculating the heat generation and simulating the heat propagation was established.Moreover,an adaptive iteration algorithm was proposed within the FE framework to capture the influence of the heat generation variation from cycle to cycle.This algorithm proved to be feasible and highly efficient compared with experimental results from the literature and simulated results via the full-iteration algorithm.Multi-cycle meshing temperature analyses were conducted on a series of POM worm gears with different tooth geometry parameters.The results reveal that,within the range of 14.5°to 25°,a pressure angle of 25°is favorable for reducing the peak surface temperature and overall body temperature of POM worm gears,which influence flank wear and load-carrying capability,respectively.However,addendum modification should be weighed because it helps with load bearing but increases the risk of severe flank wear.This paper proposes an efficient iteration algorithm for multi-cycle meshing temperature analysis of polymer gears and proves the feasibility of controlling the meshing temperature elevation during multiple cycles by tuning tooth geometry. 展开更多
关键词 POM worm gears multi-cycle meshing temperature Adaptive iteration algorithm Tooth geometry parameters Parametric study
在线阅读 下载PDF
基于CPU余热的膜蒸馏海水淡化系统的实验研究
2
作者 陈佳炜 胡箫 +2 位作者 梁辉舜 刘忠辉 杨智澄 《浙江理工大学学报(自然科学版)》 2026年第1期84-92,共9页
为系统探究CPU余热驱动膜蒸馏海水淡化系统的可行性及关键影响因素,搭建了一套基于CPU余热的膜蒸馏海水淡化实验系统,研究了CPU功率、进料温度、渗透侧流量及盐质量分数对系统散热效果、膜通量、热效率及等效节电量的影响。结果表明:系... 为系统探究CPU余热驱动膜蒸馏海水淡化系统的可行性及关键影响因素,搭建了一套基于CPU余热的膜蒸馏海水淡化实验系统,研究了CPU功率、进料温度、渗透侧流量及盐质量分数对系统散热效果、膜通量、热效率及等效节电量的影响。结果表明:系统在240 W以上CPU余热驱动下运行稳定可行,当CPU功率为360 W、进料温度55℃时,膜通量为12.4 kg/(m^(2)·h),热效率为35.2%,散热效果为46.8%,等效节电量为0.09 kW·h。随着CPU功率增大,膜通量和等效节电量增加;进料温度升高使膜通量和热效率提高,但散热效果和等效节电量降低;渗透侧流量增加可提高膜通量、降低热效率;盐质量分数增大则抑制膜通量和热效率。系统性能受热力学驱动力主导,其中CPU功率与进料温度影响最为显著,盐质量分数次之,渗透侧流量相对较弱。研究结果可为数据中心“余热-水”耦合系统的开发提供实验依据与理论支撑。 展开更多
关键词 cpu余热 膜蒸馏 膜通量 热效率 散热效果
原文传递
CPU散热器导热粘接胶设计选型研究
3
作者 韩松健 沈晗 +1 位作者 闫继豪 徐小飞 《粘接》 2026年第1期48-50,共3页
针对电子设备中CPU芯片与散热器间导热粘接胶的选型问题,以3种典型导热粘接胶为研究对象,通过系统化的实验方法对其综合性能进行对比验证,评估其物理与电气特性,包括可操作性、温度循环可靠性、剪切强度、实际散热温升表现以及长期老化... 针对电子设备中CPU芯片与散热器间导热粘接胶的选型问题,以3种典型导热粘接胶为研究对象,通过系统化的实验方法对其综合性能进行对比验证,评估其物理与电气特性,包括可操作性、温度循环可靠性、剪切强度、实际散热温升表现以及长期老化稳定性。结果表明,所选出的最优胶粘剂型号在热阻、粘接强度及环境耐受性方面均表现优异,能有效降低CPU工作温度,提升系统可靠性。研究为高功率CPU散热器组装中的导热胶选用提供了直接的数据支持和优选方案,也为同类型电子组件界面材料的性能评价与选型提供了可借鉴的实验方法与理论参考。 展开更多
关键词 电子设备 cpu芯片 散热器 导热粘接胶
在线阅读 下载PDF
CPU与GPU平台下遥感影像JPEG2000解压缩效率提升研究
4
作者 马若琳 李帅 +1 位作者 赵可 公雪霜 《信息技术与信息化》 2026年第1期190-194,共5页
针对JPEG2000因计算复杂度高而制约遥感影像实时解压缩的问题,文章分别在CPU与GPU平台开展解压缩效率优化工作。研究构建了串行、CPU包内并行、CPU组合并行、GPU流水线批处理并行四类实验方案,选取不同数据量、压缩比、分辨率的遥感影... 针对JPEG2000因计算复杂度高而制约遥感影像实时解压缩的问题,文章分别在CPU与GPU平台开展解压缩效率优化工作。研究构建了串行、CPU包内并行、CPU组合并行、GPU流水线批处理并行四类实验方案,选取不同数据量、压缩比、分辨率的遥感影像作为实验对象,从解压缩时间、处理速度、加速比三个维度开展量化评估,以此明确CPU与GPU平台的性能边界。实验结果表明,并行度的深化可显著提升解压缩效率,其中CPU组合并行与GPU流水线批处理两种方案的处理速度均可突破400 Mbit/s。二者效能受数据规模与硬件参数约束,场景差异明显:小数据量时CPU包内并行平衡开销与效率,高计算量任务需CPU组合并行与GPU协同突破瓶颈,I/O占比高的轻量任务更适配CPU优化资源利用,所提出的场景化并行策略,为相关并行方案选型提供参考。 展开更多
关键词 遥感影像 JPEG2000 cpu并行优化 GPU批处理
在线阅读 下载PDF
关键核心技术国产替代的创新模式研究——基于CPU技术头部企业的双案例分析 被引量:7
5
作者 王砚羽 卢婷 刘汝芳 《科学学研究》 北大核心 2025年第4期712-722,750,共12页
关键核心技术是国之重器。本研究以龙芯中科和天津飞腾两家CPU技术头部企业为案例,探讨关键核心技术国产替代的创新模式。得出如下结论:(1)识别出关键核心技术国产替代的两种路径,龙芯中科采用“技术引进+学习导向的消化吸收”路径,最... 关键核心技术是国之重器。本研究以龙芯中科和天津飞腾两家CPU技术头部企业为案例,探讨关键核心技术国产替代的创新模式。得出如下结论:(1)识别出关键核心技术国产替代的两种路径,龙芯中科采用“技术引进+学习导向的消化吸收”路径,最终实现了核心技术自主可控;而天津飞腾采用“技术引进+应用导向的消化吸收”路径,存在卡脖子风险。(2)不同的国产替代创新模式塑造了不同的企业技术能力和生态能力。本研究为理解技术限制背景下的技术主权提供了新的视角,为政策制定者和行业利益相关者提供管理启示。 展开更多
关键词 关键核心技术 国产替代 创新模式 案例研究 cpu芯片
原文传递
面向特定应用的可配置CPU性能分析方法
6
作者 邓全 林荣臻 +2 位作者 罗莉 鲁建壮 王永文 《计算机工程与科学》 北大核心 2025年第11期1901-1911,共11页
随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系... 随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系结构工程师,缺乏一套科学方法进行指导,因此,提出了一种面向特定应用的可配置CPU性能分析方法。在软件层面,利用Perf工具快速定位应用程序在硬件执行时的热点代码块;在硬件层面,通过分析框架的2种计数模式(时钟周期计数与slots计数),锁定各个执行部件的热点执行情况,以便设计人员快速定位硬件执行的热点行为。对支持RISCV指令集的可配置DMR架构在流体力学典型程序NPB上进行了敏捷设计。实验结果表明,迭代后可配置CPU单核性能提升了13.2%,面积开销增加了12.2%。 展开更多
关键词 性能分析 可配置cpu PMU NPB 测试
在线阅读 下载PDF
CPU+GPU并行加速的星链信号实时高精度频率估计算法
7
作者 代传金 秦培杰 +1 位作者 李林 臧博 《航空学报》 北大核心 2025年第24期215-228,共14页
星链下行信号实时高精度频率估计算法设计与实现是LEO卫星动态机会导航工程应用的关键技术。针对传统极大似然估计、频域滑窗估计及卡尔曼滤波等算法在低信噪比星链信号捕获中鲁棒性差、实时性不足的问题,提出多子载波联合频偏估计(MC-J... 星链下行信号实时高精度频率估计算法设计与实现是LEO卫星动态机会导航工程应用的关键技术。针对传统极大似然估计、频域滑窗估计及卡尔曼滤波等算法在低信噪比星链信号捕获中鲁棒性差、实时性不足的问题,提出多子载波联合频偏估计(MC-JFE)算法,通过深度挖掘信号多子载波结构特征,联合优化载波频率与频率间隔参数,提升频率估计精度与实时性。为突破MC-JFE算法工程应用中密集计算瓶颈,创新构建了一种CPU+GPU异构并行的加速处理架构,通过协同调度CPU逻辑控制与GPU大规模并行计算能力,算法执行效率实现超一个数量级提升。为验证设计算法的理论与技术实现有效性,基于半实物仿真平台生成的星链下行信标数据,开展了5978颗星链卫星信号实时频率估计试验,并结合我国边境地区实测信号进行多普勒估计算法对比研究。结果表明:所提出的MC-JFE算法在−10~10 dB全信噪比范围内保持最低估计误差边界,估计精度提升50%以上(0 dB);通过相位信息融合机制,在部分子载波中断时维持稳定输出;基于CUDA最优线程块配置的CPU+GPU异构架构,加速比峰值达47倍,较传统CPU方案提升2.8倍,且精度与加速比呈正相关特性,为LEO卫星动态机会导航提供了高可靠、强实时的频率估计技术支撑,具有重要工程应用价值。 展开更多
关键词 星链下行信号 高精度频率估计 cpu+GPU异构 并行加速 多线程处理
原文传递
基于CPU-GPU的超音速流场N-S方程数值模拟
8
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
基于CPU-FPGA的SoC实验系统设计
9
作者 王丽杰 钱俊宏 +4 位作者 何俊峰 王蕊 贺媛 刘凤敏 张彤 《吉林大学学报(信息科学版)》 2025年第3期518-523,共6页
针对现有微电子与集成电路专业课程大多以理论为主,缺少仿真实验,FPGA(Field Progra mmable Gate Array)实操类实验项目严重不足的问题,设计了一套基于CPU(Central Processing Unit)-FPGA的SoC(System on Chip)实验系统。利用ModelSim... 针对现有微电子与集成电路专业课程大多以理论为主,缺少仿真实验,FPGA(Field Progra mmable Gate Array)实操类实验项目严重不足的问题,设计了一套基于CPU(Central Processing Unit)-FPGA的SoC(System on Chip)实验系统。利用ModelSim等仿真工具,以FPGA为开发平台实现CPU系统功能。以RISC-V(Reduced Instruction Set Computer)精简指令集为该CPU的指令集,以模块化为设计思想,从微处理器的局部到总体设计5级流水线CPU。系统融合了软硬件开发,能激发学生的学习兴趣。搭建的实验平台逐步实现CPU的配置与指令集至整个CPU的架构、编程、仿真、下载与调试,使学生对FPGA实现集成电路系统设计有深入理解,有助于专业理论课程的学习。通过将OBE(Outcomes-Based Education)教学理论应用于集成电路EDA(Electronic Design Automation)课程的仿真实验结果表明,这种设计方法与内容适用于产学研相结合,并能提高学生创新创业能力。 展开更多
关键词 中央处理器 现场可编程门阵列 实验系统 流水线技术
在线阅读 下载PDF
Change of phase state during multi-cycle injection and production process of condensate gas reservoir based underground gas storage 被引量:5
10
作者 TANG Yong LONG Keji +5 位作者 WANG Jieming XU Hongcheng WANG Yong HE Youwei SHI Lei ZHU Huayin 《Petroleum Exploration and Development》 CSCD 2021年第2期395-406,共12页
Based on the differences in production mode and operation process between gas storage and gas reservoir,we established a phase balance test procedure and a theoretical simulation model of phase balance during multi-cy... Based on the differences in production mode and operation process between gas storage and gas reservoir,we established a phase balance test procedure and a theoretical simulation model of phase balance during multi-cycles of injection and production of underground gas storage(UGS)rebuilt from condensate gas reservoir to study the phase characteristics of produced and remaining fluids during multi-cycles of injection and production.Take condensate reservoir gas storage as example,the composition of produced fluid and remaining fluid,phase state of remaining fluid,retrograde condensate saturation and condensate recovery degree in the process of multi-cycles of injection-production were studied through multi-cycle injection-production experiment and phase equilibrium theory simulation.The injected gas could greatly improve the recovery of condensate oil in the gas reservoir,and the condensate oil recovery increased by 42% after 5 cycles of injection and production;the injected gas had significant evaporative and extraction effects on the condensate,especially during the first two cycles;the condensate oil saturation of the formation decreased with the increase of injection-production cycles,and the condensate oil saturation after multi-cycles of injection-production was almost 0;the storage capacity increased by about 7.5% after multi-cycles of injection and production,and the cumulative gas injection volume in the 5 th cycle increased by about 25%compared with that in the 1 st cycle. 展开更多
关键词 condensate gas reservoir gas storage phase characteristics multi-cycles of injection-production EOR
在线阅读 下载PDF
基于多核CPU的雷达导引头数字化实时仿真研究 被引量:2
11
作者 苏灏杨 夏伟杰 +1 位作者 吴雪 王宇 《遥测遥控》 2025年第2期92-99,共8页
雷达导引头仿真系统在导引头精确打击目标的过程中起着重要的作用。随着仿真系统的复杂度不断提升以及数据处理需求的日益增长,传统的串行计算仿真技术已难以满足雷达导引头数字仿真系统对实时性的严格要求。针对现有雷达导引头仿真过... 雷达导引头仿真系统在导引头精确打击目标的过程中起着重要的作用。随着仿真系统的复杂度不断提升以及数据处理需求的日益增长,传统的串行计算仿真技术已难以满足雷达导引头数字仿真系统对实时性的严格要求。针对现有雷达导引头仿真过程中耗时过长的问题,本文提出了一种全流程的数字化实时仿真方法。首先,将传统全流程仿真架构的核心部分——接收控制系统指令、接收回波仿真数据、SAR(Synthetic aperture Radar,合成孔径雷达)成像处理、成像结果上传与界面动态更新进行流水并行化。其次,利用OpenMP(开放式多处理)多核并行模型,对SAR成像算法主要步骤进行多核CPU(Central Processing Unit,中央处理器)并行处理。然后,引入高性能数学计算库FFTW3(西方最快傅里叶变换第3版)快速实现成像算法的傅里叶变换,加快SAR成像算法处理速度。最后仿真结果表明:该全流程的设计方法相较于传统的串行仿真,加速比达到100倍左右,同时加速前后的SAR图像相似度接近于1。在处理精度和效果一致的前提下,该方法能够完成雷达导引头系统的全流程实时仿真,具有较好的工程应用前景。 展开更多
关键词 雷达导引头 SAR仿真 多核cpu 并行计算 实时仿真
在线阅读 下载PDF
Evaluation of multi-cycle performance of chemical looping dry reforming using CO_2 as an oxidant with Fe–Ni bimetallic oxides 被引量:7
12
作者 Zhen Huang Huanqi Jiang +7 位作者 Fang He Dezhen Chen Guoqiang Wei Kun Zhao Anqing Zheng Yipeng Feng Zengli Zhao Haibin Li 《Journal of Energy Chemistry》 SCIE EI CAS CSCD 2016年第1期62-70,共9页
Chemical looping dry reforming(CLDR) is an innovative technology for CO2 utilization using the chemical looping principle.The CLDR process consists of three stages,i.e.CH4 reduction,CO2 reforming,and air oxidation.S... Chemical looping dry reforming(CLDR) is an innovative technology for CO2 utilization using the chemical looping principle.The CLDR process consists of three stages,i.e.CH4 reduction,CO2 reforming,and air oxidation.Spinel nickel ferrite(NiFe2O4) was prepared and its multi-cycle performance as an oxygen carrier for CLDR was experimentally investigated.X-ray diffraction(XRD) and Laser Raman spectroscopy showed that a pure spinel crystalline phase(NiFe2O4) was obtained by a parallel flow co-precipitating method.NiFe2O4was reduced into Fe-Ni alloy and wustite(FexO) during the CH4 reduction process.Subsequent oxidation of the reduced oxygen carrier was performed with CO2 as an oxidant to form an intermediate state:a mixture of spinel Ni(1-x)Fe(2+x)O4,Fe(2+y)O4 and metallic Ni.And CO was generated in parallel during this stage.Approximate 185 mL of CO was generated for 1 g spinel NiFe2O4 in a single cycle.The intermediate oxygen carrier was fully oxidized in the air oxidation stage to form a mixture of Ni(1+x)Fe(2-x)O4 and Fe2O3.Although the original state of oxygen carrier(NiFe2O4) was not fully regenerated and agglomeration was observed,a good recyclability was shown in 10 successive redox cycles. 展开更多
关键词 Chemical looping Oxygen carrier Nickel ferrite CO2 utilization multi-cycle performance
在线阅读 下载PDF
Establishment of a multi-cycle generalized Weng model and its application in forecasts of global oil supply 被引量:1
13
作者 Yi Jin Xu Tang +2 位作者 Cui-Yang Feng Jian-Liang Wang Bao-Sheng Zhang 《Petroleum Science》 SCIE CAS CSCD 2017年第3期616-621,共6页
Low oil prices under the influence of economic structure transformation and slow economic growth have hit the existing markets of traditional big oil suppliers and upgraded the conflict of oil production capacity and ... Low oil prices under the influence of economic structure transformation and slow economic growth have hit the existing markets of traditional big oil suppliers and upgraded the conflict of oil production capacity and interest between OPEC producers and other big oil supplier countries such as the USA and Russia. Forecasting global oil production is significant for all countries for energy strategy planning, although many past forecasts have later been proved to be very seriously incorrect. In this paper,the original generalized Weng model is expanded to a multi-cycle generalized Weng model to better reflect the multi-cycle phenomena caused by political, economic and technological factors. This is used to forecast global oil production based on parameter selection from a large sample, depletion rate of remaining resources, constraints on oil reserves and cycle number determination. This research suggests that the world will reach its peak oil production in 2022, at about 4340×10~6 tonnes. China needs to plan for oil import diversity, a domestic oil production structure based on the supply pattern of large oil suppliers worldwide and the oil demand for China's own development. 展开更多
关键词 Oil production multi-cycle Generalized Weng model Energy strategy
原文传递
Stress sensitivity of formation during multi-cycle gas injection and production in an underground gas storage rebuilt from gas reservoirs 被引量:1
14
作者 LI Jiqiang ZHAO Guanqun +5 位作者 QI Zhilin YIN Bingyi XU Xun FANG Feifei YANG Shenyao QI Guixue 《Petroleum Exploration and Development》 CSCD 2021年第4期968-977,共10页
Permeability sensitivity to stress experiments were conducted on standard core samples taken from Wen 23 Gas Storage at multi-cycle injection and production conditions of the gas storage to study the change pattern of... Permeability sensitivity to stress experiments were conducted on standard core samples taken from Wen 23 Gas Storage at multi-cycle injection and production conditions of the gas storage to study the change pattern of stress sensitivity of permeability.A method for calculating permeability under overburden pressure in the multi-cycle injection and production process was proposed,and the effect of stress sensitivity of reservoir permeability on gas well injectivity and productivity in UGS was analyzed.Retention rate of permeability decreased sharply first and then slowly with the increase of the UGS cycles.The stress sensitivity index of permeability decreased with the increase of cycle number of net stress variations in the increase process of net stress.The stress sensitivity index of permeability hardly changed with the increase of cycle number of net stress variations in the decrease process of net stress.With the increase of cycle number of net stress variation,the stress sensitivity index of permeability in the increase process of net stress approached that in the decrease process of net stress.The lower the reservoir permeability,the greater the irreversible permeability loss rate,the stronger the cyclic stress sensitivity,and the higher the stress sensitivity index of the reservoir,the stronger the reservoir stress sensitivity.The gas zones with permeability lower than 0.3’10-3 mm2 are not suitable as gas storage regions.Stress sensitivity of reservoir permeability has strong impact on gas well injectivity and productivity and mainly in the first few cycles. 展开更多
关键词 gas storage rebuilt from gas reservoirs multi-cycle injection and production reservoir stress sensitivity injection and production capacity gas storage layer selection
在线阅读 下载PDF
Extreme Ultraviolet Sources Generation by Using the Two-Color Multi-Cycle Weak Inhomogeneous Field
15
作者 冯立强 李文亮 《Communications in Theoretical Physics》 SCIE CAS CSCD 2015年第1期86-90,共5页
An efficient method for attosecond extreme ultraviolet source generation under the two-color multi-cycle weak pulse has been theoretically presented by using the concept of the plasmonic field enhancement in the vicin... An efficient method for attosecond extreme ultraviolet source generation under the two-color multi-cycle weak pulse has been theoretically presented by using the concept of the plasmonic field enhancement in the vicinity of metallic nanostructures. The results show that by properly choosing the inhomogeneity of the two-color multi-cycle(20 fs) weak pulse(1013W/cm2), not only the harmonic cutoff has been extended, resulting in a broadband XUV continuum, but also the single short quantum path has been selected to contribute to the harmonic. As a result, two isolated XUV pulses with durations of 68 as and 66 as can be obtained. 展开更多
关键词 high-order harmonic generation attosecond pulse multi-cycle pulse plasmonic field enhancement
原文传递
利用CPU和GPU混合并行方法快速构建海洋扰动重力梯度基准图
16
作者 黄炎 李姗姗 +3 位作者 吕明昊 范雕 谭勖立 冯进凯 《武汉大学学报(信息科学版)》 北大核心 2025年第3期515-527,共13页
高精度、高分辨率的海洋扰动重力梯度基准图是将水下扰动重力梯度辅助惯性导航付诸于实践的关键技术之一,可依据边值问题理论,基于移去-恢复技术计算求得。基于传统串行算法存在计算效率低、耗时长等问题,为满足大范围乃至全球海洋扰动... 高精度、高分辨率的海洋扰动重力梯度基准图是将水下扰动重力梯度辅助惯性导航付诸于实践的关键技术之一,可依据边值问题理论,基于移去-恢复技术计算求得。基于传统串行算法存在计算效率低、耗时长等问题,为满足大范围乃至全球海洋扰动重力梯度基准图的快速构建需求,利用中央处理器(central processing unit,CPU)与图形处理器(graph processing unit,GPU)混合并行(CPU+GPU)编程平台,设计了一种高效的混合并行计算方案。首先,利用数组收缩膨胀方法,有效解决了CPU进行勒让德函数递推计算过程中内存读写冲突问题;然后,引入Hilbert空间填充曲线,将二维格网重力异常数据降维成为具有高度聚簇性的一维数组,通过其在GPU显存中的快速索引,实现了Stokes积分的高效计算。在CPU型号为Intel Xeon(R)Gold 6130、GPU型号为Tesla V100的计算机上进行实验,利用该混合并行方案计算6°×6°范围、1′分辨率的全张量海洋扰动重力梯度基准图仅需15.84 s,而传统串行方法需要35 min以上;计算2°×2°范围、30″分辨率基准图仅需22.7 s,串行方法则需要52 min;计算2°×2°范围、10″分辨率基准图需要26.7 min,串行方法则需要两天以上。在保证并行计算绝对误差小于等于1×10^(-6) E、T_(xx)+T_(yy)+T_(zz)绝对值的最大值小于0.1 E、均方根误差小于0.01 E的前提下,实现了全球全张量海洋扰动重力梯度基准图模型的快速构建。 展开更多
关键词 扰动重力梯度 边值问题 cpu GPU 混合并行
原文传递
基于强化学习的负载感知CPU资源分配和管理方法
17
作者 许荣飞 苏志远 +1 位作者 麻付强 吴保锡 《计算机技术与发展》 2025年第10期81-88,共8页
随着CPU核的数量增多,合理分配CPU核对于降低系统功耗具有重要意义,如何根据系统运行时的负载情况进行精准的CPU资源分配和管理是一个关键的问题。现在处理器设计提供了很多对功耗优化的机制(比如动态电压频率调整DVFS),但是要让这些机... 随着CPU核的数量增多,合理分配CPU核对于降低系统功耗具有重要意义,如何根据系统运行时的负载情况进行精准的CPU资源分配和管理是一个关键的问题。现在处理器设计提供了很多对功耗优化的机制(比如动态电压频率调整DVFS),但是要让这些机制发挥作用,只有芯片的支持是不够的,还需要软硬协同设计。当前缺乏基于软件来最大化利用这些硬件机制的手段。近年来,机器学习在各个领域展现出巨大的潜力,很多基于机器学习的研究工作应运而生。其中,强化学习具有较强的自适应性,适用于动态感知系统环境并进行资源管理。因此,该文提出了一种基于强化学习的负载感知CPU资源分配和管理方法——RLWAM。该方法提出基于最小原则根据系统中运行时的任务负载进行CPU资源分配和管理,基于强化学习提出了面向上述场景的Q-Learning算法,包括面向任务和系统的状态建模方式、面向绑核、调频和资源整合的动作空间和激励函数,从而帮助系统进一步降低功耗。最后,通过在真实平台上从单类型任务上的绑核调频和多类型任务上的资源整合两个场景对该方法进行实验验证,结果表明该方法具有显著的有效性和可扩展性。 展开更多
关键词 负载感知 强化学习 多核系统 cpu资源分配管理 绑核调频
在线阅读 下载PDF
微处理器性能分析与优化:基于SPEC CPU2017的对比研究
18
作者 徐晗 郭振江 肖俊华 《高技术通讯》 北大核心 2025年第3期241-249,共9页
运行标准测试程序是进行微处理器设计空间探索的基本手段。横向对比分析国内外主流处理器在标准测试程序场景下的各项性能指标,有助于识别国产处理器的性能瓶颈,为进一步的性能优化指明方向。本文基于SPEC CPU2017对3款微处理器进行同... 运行标准测试程序是进行微处理器设计空间探索的基本手段。横向对比分析国内外主流处理器在标准测试程序场景下的各项性能指标,有助于识别国产处理器的性能瓶颈,为进一步的性能优化指明方向。本文基于SPEC CPU2017对3款微处理器进行同频性能测试和对比分析,分别是龙芯LA464架构的3A5000微处理器、AMD ZEN1架构的R3-1200以及Intel Skylake架构的i3-9100f。根据测试结果,3A5000定点性能与R3-1200基本相同,比i3-9100f低10%左右;3A5000浮点性能相当于另2款微处理器的70%左右。本文从动态指令数和每周期指令数(instruction per cycle,IPC)2个角度对微处理器进行比较和分析。基于SPEC CPU2017的结果显示,3A5000定点动态指令数和浮点动态指令数分别比另2款微处理器多约10%和25%。在3A5000上使用激进的自动向量化编译优化策略、优化立即数乘法编译效率等手段可以将其性能提升10%左右。3A5000的定点IPC比另外2款微处理器高4%左右,浮点IPC低8%左右。发射宽度、执行单元数量、功能和延迟等微结构参数接近是3款微处理器IPC差别较小的主要原因。 展开更多
关键词 SPEC cpu2017 性能分析 龙芯3A5000 向量化 体系结构
在线阅读 下载PDF
基于云平台CPU与GPU协同处理的光学卫星遥感影像正射融合方法
19
作者 于潇 张一 +2 位作者 吕丽红 张强 王得成 《空间科学学报》 北大核心 2025年第5期1416-1424,共9页
系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号... 系统探讨了基于国产云平台调度下自主可控CPU和GPU协同处理的光学卫星遥感影像正射融合方法执行效率问题,通过数据流配置、中间数据存储访问优化等手段进一步提高了该方法执行效率.在云平台调度下,使用飞腾S2500和英伟达A100对高分二号卫星多光谱影像进行正射融合的试验,结果表明,该方法可很大程度提高光学卫星遥感影像正射融合效率,与传统X86架构CPU与GPU协同的正射融合算法相比,加速比为14.3倍以上,数据处理时间压缩至8.4 s内,其中GPU运算耗时仅1 s,可满足并优化大数据量的光学卫星遥感影像快速正射融合的要求. 展开更多
关键词 正射融合 国产云平台 cpu和GPU协同处理 数据流配置 存储访问优化
在线阅读 下载PDF
浅议基于多核CPU的实时信号处理 被引量:1
20
作者 董华玉 《科技与创新》 2025年第8期127-130,共4页
通过对实时信号处理与实时内核之间的关系进行分析,探讨了应用于多核CPU实时信号处理的多线程并行处理、线程池模型、数据流驱动机制、RapidIO总线、RDMA技术、加速计算函数库等技术,将使得基于多核CPU的实时信号处理技术不断创新和完善... 通过对实时信号处理与实时内核之间的关系进行分析,探讨了应用于多核CPU实时信号处理的多线程并行处理、线程池模型、数据流驱动机制、RapidIO总线、RDMA技术、加速计算函数库等技术,将使得基于多核CPU的实时信号处理技术不断创新和完善,以适应更加复杂和多样化的应用场景。 展开更多
关键词 多核cpu 实时信号处理 实时内核 并行计算
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部