期刊文献+
共找到75篇文章
< 1 2 4 >
每页显示 20 50 100
基于CPU-GPU的超音速流场N-S方程数值模拟
1
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
基于CPU-FPGA的SoC实验系统设计
2
作者 王丽杰 钱俊宏 +4 位作者 何俊峰 王蕊 贺媛 刘凤敏 张彤 《吉林大学学报(信息科学版)》 2025年第3期518-523,共6页
针对现有微电子与集成电路专业课程大多以理论为主,缺少仿真实验,FPGA(Field Progra mmable Gate Array)实操类实验项目严重不足的问题,设计了一套基于CPU(Central Processing Unit)-FPGA的SoC(System on Chip)实验系统。利用ModelSim... 针对现有微电子与集成电路专业课程大多以理论为主,缺少仿真实验,FPGA(Field Progra mmable Gate Array)实操类实验项目严重不足的问题,设计了一套基于CPU(Central Processing Unit)-FPGA的SoC(System on Chip)实验系统。利用ModelSim等仿真工具,以FPGA为开发平台实现CPU系统功能。以RISC-V(Reduced Instruction Set Computer)精简指令集为该CPU的指令集,以模块化为设计思想,从微处理器的局部到总体设计5级流水线CPU。系统融合了软硬件开发,能激发学生的学习兴趣。搭建的实验平台逐步实现CPU的配置与指令集至整个CPU的架构、编程、仿真、下载与调试,使学生对FPGA实现集成电路系统设计有深入理解,有助于专业理论课程的学习。通过将OBE(Outcomes-Based Education)教学理论应用于集成电路EDA(Electronic Design Automation)课程的仿真实验结果表明,这种设计方法与内容适用于产学研相结合,并能提高学生创新创业能力。 展开更多
关键词 中央处理器 现场可编程门阵列 实验系统 流水线技术
在线阅读 下载PDF
面向特定应用的可配置CPU性能分析方法
3
作者 邓全 林荣臻 +2 位作者 罗莉 鲁建壮 王永文 《计算机工程与科学》 北大核心 2025年第11期1901-1911,共11页
随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系... 随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系结构工程师,缺乏一套科学方法进行指导,因此,提出了一种面向特定应用的可配置CPU性能分析方法。在软件层面,利用Perf工具快速定位应用程序在硬件执行时的热点代码块;在硬件层面,通过分析框架的2种计数模式(时钟周期计数与slots计数),锁定各个执行部件的热点执行情况,以便设计人员快速定位硬件执行的热点行为。对支持RISCV指令集的可配置DMR架构在流体力学典型程序NPB上进行了敏捷设计。实验结果表明,迭代后可配置CPU单核性能提升了13.2%,面积开销增加了12.2%。 展开更多
关键词 性能分析 可配置cpu PMU NPB 测试
在线阅读 下载PDF
地震叠前逆时偏移算法的CPU/GPU实施对策 被引量:83
4
作者 李博 刘红伟 +4 位作者 刘国峰 佟小龙 刘洪 郭建 裴江云 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2010年第12期2938-2943,共6页
相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O... 相较于单程波偏移算法而言,逆时偏移成像方法以其物理基础为依托优势,几十年来一直备受国内外地球物理学家的青睐.目前的逆时偏移(RTM)若直接采用双程波动方程进行延拓,尽管可以回避上下行波的分离处理,然就已有算法而言,其计算量和I/O(输入/输出)量却是最大的.针对此问题,本文在分析现行逆时偏移的多种算法基础上,提出利用CPU/GPU(中央处理器/图形处理器)作为数值计算核心,建立随机边界模型,从而克服存储I/O难题和提高计算效率.在实际的数据测试中,本文的方法可以大幅度的提高计算效率和减少存储单元,从而促使其高效地应用于生产实际. 展开更多
关键词 逆时偏移 波动方程 随机边界 中央处理器 图形处理器
在线阅读 下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:5
5
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
在线阅读 下载PDF
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 被引量:3
6
作者 王维平 余文广 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第11期2366-2373,共8页
多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CP... 多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 负载均衡
在线阅读 下载PDF
独立翅片式液体自循环CPU散热器 被引量:2
7
作者 马国远 刘思光 彭珑 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第11期1203-1206,共4页
通过试验,分析了一种独立翅片式液体自循环CPU散热器分别使用不同工质时的散热性能以及充灌率等因素对其散热性能的影响,结果表明,该散热器具有良好的散热性能,CPU表面温度平稳,不出现大幅波动,在R123、R11、R113这3种载热介质中,R123... 通过试验,分析了一种独立翅片式液体自循环CPU散热器分别使用不同工质时的散热性能以及充灌率等因素对其散热性能的影响,结果表明,该散热器具有良好的散热性能,CPU表面温度平稳,不出现大幅波动,在R123、R11、R113这3种载热介质中,R123的散热性能最好且最佳充液率为80%~100%。 展开更多
关键词 散热器 液体自循环冷却 计算机中央处理器(cpu)
在线阅读 下载PDF
基于CPU-GPU协同并行内点算法求解结构化非线性规划 被引量:2
8
作者 杨林峰 胡桂莉 +1 位作者 张晨 张振荣 《电子学报》 EI CAS CSCD 北大核心 2019年第2期382-389,共8页
大量工程应用问题可建模为结构化非线性规划,且这类问题的系数矩阵可分为稀疏型和稠密型两种类型.利用原始-对偶内点法(primal dual interior point method,PD-IPM),并结合分布式并行技术可高效求解此类问题.经典工程问题-机组组合(unit... 大量工程应用问题可建模为结构化非线性规划,且这类问题的系数矩阵可分为稀疏型和稠密型两种类型.利用原始-对偶内点法(primal dual interior point method,PD-IPM),并结合分布式并行技术可高效求解此类问题.经典工程问题-机组组合(unit commitment,UC)为稀疏系数矩阵的结构化非线性规划,本文根据PD-IPM原理,对UC模型进行连续松弛预处理,结合快速解耦技术解耦牛顿修正方程并设计CPU-GPU协同并行算法求解子问题,最后将结果与带稠密型子问题的结构化非线性规划的求解结果进行比较和分析.实验结果显示,本文所设计的算法对于两种不同类型的结构化非线性规划求解均能获得较好的加速比. 展开更多
关键词 非线性规划 内点法 机组组合 cpu-GPU协同 并行计算
在线阅读 下载PDF
基于FPGA技术的CPU模型机的设计与实现 被引量:16
9
作者 周宁宁 刘胜 《南京邮电学院学报(自然科学版)》 2003年第1期77-80,共4页
主要介绍了在EDA多功能实验台上,利用FPGA技术实现一个典型的微程序控制器。利用可编程逻辑器件(PLD),借助计算机组成原理的相关知识,在现有的实验平台上构筑一个简单的CPU模型机。这是对CPU的一些基础理论知识的应用实现,也是对现场可... 主要介绍了在EDA多功能实验台上,利用FPGA技术实现一个典型的微程序控制器。利用可编程逻辑器件(PLD),借助计算机组成原理的相关知识,在现有的实验平台上构筑一个简单的CPU模型机。这是对CPU的一些基础理论知识的应用实现,也是对现场可编程技术(FPGA和CPLD)的应用。 展开更多
关键词 cpu模型机 现场可编程 电子设计自动化 FPGA CPLD 微处理器
在线阅读 下载PDF
机械手在CPU散热片冷锻成形过程中的应用 被引量:4
10
作者 王蕾 苏娟华 胡道春 《锻压技术》 CAS CSCD 北大核心 2006年第5期71-74,共4页
针对CPU散热片现存生产方式的局限性,确定新的工艺方案,并开发出一套利用机械手送料的新型模具。介绍了机械手在CPU散热片冷锻成形过程中的应用,机械手的结构和动作原理,以及与模具、冲床精确配合的设计过程,从而顺利完成整个生产过程,... 针对CPU散热片现存生产方式的局限性,确定新的工艺方案,并开发出一套利用机械手送料的新型模具。介绍了机械手在CPU散热片冷锻成形过程中的应用,机械手的结构和动作原理,以及与模具、冲床精确配合的设计过程,从而顺利完成整个生产过程,实现了机电一体化。这种结构设计集中了连续模高速以及工程模材料利用率高的的优点,提高了速度,节约了成本,对相关产品的设计有一定的借鉴作用。 展开更多
关键词 cpu散热片 冷锻 连续模 机械手
在线阅读 下载PDF
CPU散热片冲孔复合模具设计中的废屑处理 被引量:2
11
作者 王蕾 苏娟华 +1 位作者 禹兴胜 陈钢 《锻压技术》 CAS CSCD 北大核心 2006年第4期55-56,共2页
在CPU散热片冷冲压成形中,为节省材料,提高效率,设计了用机械手传送零件的连续模,取代了传统方法的连续模。在提高经济效益的同时也带来了一些问题,其中冲孔落料工序中的废屑处理尤为显著。本文探讨了冲孔落料模具的设计方法,有效解决... 在CPU散热片冷冲压成形中,为节省材料,提高效率,设计了用机械手传送零件的连续模,取代了传统方法的连续模。在提高经济效益的同时也带来了一些问题,其中冲孔落料工序中的废屑处理尤为显著。本文探讨了冲孔落料模具的设计方法,有效解决了废屑处理的问题。不仅使成形可以顺利进行,还实现了省时节约的目的,对业内设计人员有一定的借鉴作用。 展开更多
关键词 cpu散热片 机械手 连续模 废屑处理
在线阅读 下载PDF
智能温室环境测控系统专用CPU设计 被引量:1
12
作者 田祎 颜军 《现代电子技术》 2012年第16期160-163,共4页
智能温室是近年逐步发展起来的一种资源节约型高效农业发展技术,目前国内大多以单片机、通用计算机作为温室系统处理器,由于基于单因子和成本问题,其智能化和效率有待提高。在此通过对目前智能温室控制器的分析研究,提出并设计了一款16... 智能温室是近年逐步发展起来的一种资源节约型高效农业发展技术,目前国内大多以单片机、通用计算机作为温室系统处理器,由于基于单因子和成本问题,其智能化和效率有待提高。在此通过对目前智能温室控制器的分析研究,提出并设计了一款16位的的单总线专用CPU,且专门针对于智能温室测控系统设计了一个浮点运算器和n个Comparray比较器,并使用VHDL语言在QuartusⅡ6.0中进行设计与仿真。所以,该CPU不但具有通用CPU的基本特性,而且更具有在农业温室控制系统领域的特殊性。 展开更多
关键词 测控系统 专用cpu Comparvay比较器 VHDL语言
在线阅读 下载PDF
基于双CPU模式RTU遥测单元的设计与实现
13
作者 倪云峰 《工矿自动化》 北大核心 2004年第2期22-24,共3页
综述了已应用于某煤矿企业配电站"综自"控制的遥测单元的设计与实现过程。首先介绍了基于双CPU模式RTU遥测单元的设计思想,通过详实资料描述了该系统硬件组成与软件设计特点。重点分析了双端存储器在多CPU数据采集处理系统中... 综述了已应用于某煤矿企业配电站"综自"控制的遥测单元的设计与实现过程。首先介绍了基于双CPU模式RTU遥测单元的设计思想,通过详实资料描述了该系统硬件组成与软件设计特点。重点分析了双端存储器在多CPU数据采集处理系统中的数据锁配合问题。提出了一种解决双CPU运行配合的新策略,并进行了调试和分析,实验结果表明在数据采集处理系统中采用双CPU模式可以有效地提高RTU单元的处理速度,节约传输时间。 展开更多
关键词 煤矿 双端存储器 遥测单元 RTU cpu
在线阅读 下载PDF
激光基准信标仪中CPU及其控制原理的分析与设计 被引量:2
14
作者 季长路 张家钰 《安徽机电学院学报》 2000年第2期35-40,共6页
对所研制的激光基准信标仪中的CPU进行了剖析 ,给出了片内总体结构框图 ,对其工作原理及主要引脚给出了详细的说明 ,并对信号输入、输出电路 ,中断、复位控制电路及上。
关键词 驱动电路 激光基准信标仪 cpu 控制原理
在线阅读 下载PDF
多核CPU和GPU加速分子动力学模拟 被引量:6
15
作者 林江宏 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了... 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。 展开更多
关键词 分子动力学 图形处理器 多核中央处理器 AMBER力场 计算统一设备架构 OPENMP
在线阅读 下载PDF
机车制动控制单元的双CPU控制板冗余设计
16
作者 刘豫湘 刘剑锋 《电力机车与城轨车辆》 2013年第5期1-4,共4页
制动控制单元BCU的正常运行对机车安全行驶具有重大的作用。文章基于冗余控制思想,提出了双CPU冗余控制热备份方案,设计实现了基于热备份技术的双CPU冗余控制,详细叙述了BCU的CPU控制板和双PC104控制板冗余控制的系统组成和软硬件设计,... 制动控制单元BCU的正常运行对机车安全行驶具有重大的作用。文章基于冗余控制思想,提出了双CPU冗余控制热备份方案,设计实现了基于热备份技术的双CPU冗余控制,详细叙述了BCU的CPU控制板和双PC104控制板冗余控制的系统组成和软硬件设计,并分析了双CPU冗余控制的可靠性。该技术可有效地增强BCU工作的可靠性,提高了机车的制动性能,保障了长区间机车运行的安全性。 展开更多
关键词 制动控制单元 cpu切换 冗余控制 热备份
在线阅读 下载PDF
基于RFID技术的CPU卡在医疗应急分队救治流转平台中的设计与应用
17
作者 杨新光 蒋昆 +2 位作者 冯娟 石秀兵 安书杰 《中国医疗设备》 2017年第7期110-112,133,共4页
目的利用RFID射频技术的CPU卡,实现野外医疗救治数据的全程记录。方法救治流转平台基于B/S架构开发,软件采用JAVA J2EE与FLEX程序编写,以Oracle 11G为后台数据库支持。平台利用RFID技术收集救治医疗流程数据,以CPU卡为承载介质。结果平... 目的利用RFID射频技术的CPU卡,实现野外医疗救治数据的全程记录。方法救治流转平台基于B/S架构开发,软件采用JAVA J2EE与FLEX程序编写,以Oracle 11G为后台数据库支持。平台利用RFID技术收集救治医疗流程数据,以CPU卡为承载介质。结果平台流转的数据格式符合国家及军队的相应标准,此CPU卡已在多次大规模演练中使用,通过实战化检验,获得多方面的肯定。结论 CPU卡易部署、可扩展性强,已形成了完整的伤员救治信息链,使医疗数据得以及时搜集利用,从而提高了医疗应急分队的救治保障能力。 展开更多
关键词 射频技术 医疗应急分队 医疗救治动态管理 cpu
在线阅读 下载PDF
自主CPU发展道路及在航天领域应用 被引量:20
18
作者 胡伟武 《上海航天》 CSCD 2019年第1期1-9,共9页
目前,我国中央处理器(CPU)的发展主要有自主研发和引进技术两条路线。自主研发的CPU在性能和软件生态上能否赶超引进技术的CPU成为争论的焦点。首先论述了我国CPU发展不能仅着眼于单项技术瓶颈的突破和产品市场占有率的提高,还必须建立... 目前,我国中央处理器(CPU)的发展主要有自主研发和引进技术两条路线。自主研发的CPU在性能和软件生态上能否赶超引进技术的CPU成为争论的焦点。首先论述了我国CPU发展不能仅着眼于单项技术瓶颈的突破和产品市场占有率的提高,还必须建立起自主可控的信息技术与产业生态体系;然后结合龙芯CPU研发和产业化的实践,论述了只要结合应用需求进行持续改进,自主研发的CPU在性能和软件生态上就能赶超引进技术的CPU,满足我国自主信息化应用的需求;最后论述了自主抗辐照CPU的发展及在航天领域应用情况。 展开更多
关键词 中央处理器 软件生态 抗辐照 自主可控
在线阅读 下载PDF
高性能CPU电源Droop检测优化设计实现 被引量:1
19
作者 杨丽琼 章隆兵 +1 位作者 肖俊华 王剑 《高技术通讯》 CAS 2022年第9期894-902,共9页
高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本... 高性能中央处理器(CPU)进入到纳米工艺设计时代,集成度和性能大幅度提高的同时,功耗和时钟之间的平衡优化已经成为当前面临的主要问题。物理供电寄生阻抗增加明显,功耗急速增加过程导致电源网络动态压降明显,抑制了主频进一步提高。本文提出了一种基于全数字快速高精度Droop Sensor的供电监测优化方法。该方法采用易于集成于处理器核数字域内的单数字供电Droop Sensor进行本地供电实时监测。当Droop Sensor检测到电压快速垂降时,实时指导所在处理器核的时钟域进行时钟降频,帮助处理器度过低压危险时期,待垂降结束后再恢复正常的时钟频率。实现了局部压降的针对性时钟优化,避免了整体功耗性能损失。本文采用12 nm数字工艺实现了Droop Sensor设计。仿真结果表明,该传感器可在100 ps内进行一阶Droop的快速响应,帮助CPU度过瞬间大幅度的压降期;高阶Droop响应的阈值调节精度可达3%,支持CPU的供电水平多阈值控制。 展开更多
关键词 高性能中央处理器(cpu) 供电检测 Droop Sensor
在线阅读 下载PDF
基于嵌入式CPU-GPU的高清鱼眼视频实时校正系统 被引量:4
20
作者 公维理 《计算机工程与应用》 CSCD 北大核心 2016年第14期172-179,201,共9页
在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问... 在安防监控领域,需要鱼眼实时监控系统实现360°×180°大范围高质量无死角全景实时监控,现有的鱼眼校正系统存在成本较高,灵活性差,特别是清晰度不高和实时性差等方面的问题。针对如何提高全景高清鱼眼视频校正的实时性问题,提出了基于嵌入式平台STi H418的CPU-GPU高速通信协议和基于可编程着色器的嵌入式CPU-GPU内存共享方法,并利用GPU的纹理映射技术实现了全景高清鱼眼视频实时校正系统。实验结果表明,与相关校正系统相比,该系统很好地兼顾到算法效率、图像校正效果和完整性,可以完全满足360°×180°的全景高清(400万像素,2 048×2 048p30)鱼眼视频实时监控,而且与使用PC服务器相比嵌入式系统降低了系统整体成本,ARM CPU软件生成更新校正算法和可事时实时和事后的虚拟PTZ提高系统灵活性和稳定性,因此该系统具有很高的实用价值。 展开更多
关键词 全景高清鱼眼视频实时校正 嵌入式中央处理器-图形处理器(cpu-GPU) 线性等距球面透视投影 纹理映射
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部