期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
Implementing Delay Multiply and Sum Beamformer on a Hybrid CPU-GPU Platform for Medical Ultrasound Imaging Using Open MP and CUDA 被引量:2
1
作者 Ke Song Paul Liu Dongquan Liu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2021年第9期1133-1150,共18页
Anovel beamforming algorithmnamed Delay Multiply and Sum(DMAS),which excels at enhancing the resolution and contrast of ultrasonic image,has recently been proposed.However,there are nested loops in this algorithm,so t... Anovel beamforming algorithmnamed Delay Multiply and Sum(DMAS),which excels at enhancing the resolution and contrast of ultrasonic image,has recently been proposed.However,there are nested loops in this algorithm,so the calculation complexity is higher compared to the Delay and Sum(DAS)beamformer which is widely used in industry.Thus,we proposed a simple vector-based method to lower its complexity.The key point is to transform the nested loops into several vector operations,which can be efficiently implemented on many parallel platforms,such as Graphics Processing Units(GPUs),and multi-core Central Processing Units(CPUs).Consequently,we considered to implement this algorithm on such a platform.In order to maximize the use of computing power,we use the GPUs andmulti-core CPUs inmixture.The platform used in our test is a low cost Personal Computer(PC),where a GPU and a multi-core CPU are installed.The results show that the hybrid use of a CPU and a GPU can get a significant performance improvement in comparison with using a GPU or using amulti-core CPU alone.The performance of the hybrid system is increased by about 47%–63%compared to a single GPU.When 32 elements are used in receiving,the fame rate basically can reach 30 fps.In the best case,the frame rate can be increased to 40 fps. 展开更多
关键词 BEAMFORMING delay multiply and sum graphics processing unit multi-core central processing unit
在线阅读 下载PDF
基于CPU-GPU的超音速流场N-S方程数值模拟
2
作者 卢志伟 张皓茹 +3 位作者 刘锡尧 王亚东 张卓凯 张君安 《中国机械工程》 北大核心 2025年第9期1942-1950,共9页
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并... 为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。 展开更多
关键词 超音速流场 中央处理器-图形处理器 异构计算 有限差分
在线阅读 下载PDF
基于真实场景数据的天基雷达非均匀杂波快速仿真方法
3
作者 沈皓 谢锴欣 舒汀 《现代雷达》 北大核心 2025年第6期8-13,共6页
现有的基于地理信息的非均匀杂波仿真方法通常是先使用网格映像法划分地理信息,再遍历每个网格内的散射单元来计算网格的散射系数。此类方法不利于多源地理信息的统一使用,并且其中网格的划分和散射单元的遍历降低了仿真的实时性。针对... 现有的基于地理信息的非均匀杂波仿真方法通常是先使用网格映像法划分地理信息,再遍历每个网格内的散射单元来计算网格的散射系数。此类方法不利于多源地理信息的统一使用,并且其中网格的划分和散射单元的遍历降低了仿真的实时性。针对上述问题,文中提出了一种面向仿真应用的对多源地理信息根据距离―方位进行重采样预处理的非均匀杂波快速仿真方法,来避免实时计算阶段划分网格单元以及遍历网格单元的内部散射体,并为此设计了一种基于图形处理单元的天基雷达非均匀杂波快速仿真框架。实验结果表明,文中的方法在较高的仿真模型精度条件下,可有效提高非均匀杂波仿真的速度,具有较好的工程应用价值。 展开更多
关键词 天基雷达 非均匀杂波 多源先验信息 图形处理单元 快速仿真
原文传递
车-车通信系统中安全控制执行结果设计 被引量:1
4
作者 陈景柱 张文辉 周公建 《铁路通信信号工程技术》 2025年第6期91-97,共7页
为提高列车自动监控系统中安全相关控制命令执行结果的可靠性和安全性,满足基于车-车通信的列车自主运行系统项目安全需求,设计一种基于中央处理单元(CPU)和图形处理单元(GPU)双链计算和显示的安全控制执行结果显示方法。操作终端的C P ... 为提高列车自动监控系统中安全相关控制命令执行结果的可靠性和安全性,满足基于车-车通信的列车自主运行系统项目安全需求,设计一种基于中央处理单元(CPU)和图形处理单元(GPU)双链计算和显示的安全控制执行结果显示方法。操作终端的C P U计算的执行结果以字符串格式输出到指定位置显示,操作终端的GPU计算的执行结果以图元格式输出到标题栏位置显示。同时采用不同编码方法、相异的算法等方式,避免同一硬件设备在编码语言、算法和硬件平台的共模失效。 展开更多
关键词 车-车通信系统 安全显示 执行结果 共模失效 中央处理单元 图形处理单元
在线阅读 下载PDF
基于异构计算的大规模风电场精细化高效仿真技术
5
作者 李冰 赵浩然 +3 位作者 江艺宝 孟铃涵 魏小钊 Kai STRUNZ 《电力系统自动化》 北大核心 2025年第24期138-149,共12页
考虑“风能-机械能-电能”全过程耦合的风电场精细化高效仿真将面临仿真对象多、仿真规模大、仿真步长小的挑战。为此,基于中央处理器(CPU)、图形处理器(GPU)、现场可编程门阵列(FPGA)异构计算芯片设计仿真平台架构,以实现仿真对象与硬... 考虑“风能-机械能-电能”全过程耦合的风电场精细化高效仿真将面临仿真对象多、仿真规模大、仿真步长小的挑战。为此,基于中央处理器(CPU)、图形处理器(GPU)、现场可编程门阵列(FPGA)异构计算芯片设计仿真平台架构,以实现仿真对象与硬件特性的匹配;其次,在操作系统底层对基于CPU的仿真设备进行实时性改进,以兼顾大规模和小步长仿真需求;最后,针对高效离线仿真需求,基于并行计算技术,设计了高效仿真计算内核和引导式仿真建模软件。基于含40台机组的风电场仿真算例对所提出的仿真技术进行测试。结果表明,所提出的仿真技术在计算效率和实时性方面均能够满足风电场精细化高效仿真需求。 展开更多
关键词 风电场 实时仿真 精细化仿真 异构计算 可编程门阵列(FPGA) 图形处理器(GPU)
在线阅读 下载PDF
基于GP-GPU技术应用的导引头信号处理模块架构设计
6
作者 马啸龙 许新鹏 +2 位作者 任书磊 李晨 崔闪 《空天防御》 2025年第2期84-92,共9页
针对目前主动导引头信号级建模仿真效率不高、实时性不强的问题,提出了一种基于图形处理器通用计算(General-Purpose Computing on Graphics Processing Units,GP-GPU)并行加速技术的导引头信号处理模块架构方法。采用CUDA编程形式对信... 针对目前主动导引头信号级建模仿真效率不高、实时性不强的问题,提出了一种基于图形处理器通用计算(General-Purpose Computing on Graphics Processing Units,GP-GPU)并行加速技术的导引头信号处理模块架构方法。采用CUDA编程形式对信号处理模块整体及其子模块进行基于GPU加速的架构搭建和接口设计,并对所构建的并行化模块架构进行仿真,对比全CPU状态下的耗时,以验证架构的可靠性与加速性能。仿真结果表明,基于GPU的并行化模块构架的时间速率是全CPU构架时间速率的12.67倍,初步验证了所搭建架构的可行性和加速效率。 展开更多
关键词 导引头仿真系统 图形处理器 异构并行 信号处理
在线阅读 下载PDF
GPU通用计算平台上中心差分格式显式有限元并行计算 被引量:11
7
作者 蔡勇 李光耀 王琥 《计算机研究与发展》 EI CSCD 北大核心 2013年第2期412-419,共8页
显式有限元是解决平面非线性动态问题的有效方法.由于显式有限元算法的条件稳定性,对于大规模的有限元问题的求解需要很长的计算时间.图形处理器(GPU)作为一种高度并行化的通用计算处理器,可以很好解决大规模科学计算的速度问题.统一计... 显式有限元是解决平面非线性动态问题的有效方法.由于显式有限元算法的条件稳定性,对于大规模的有限元问题的求解需要很长的计算时间.图形处理器(GPU)作为一种高度并行化的通用计算处理器,可以很好解决大规模科学计算的速度问题.统一计算架构(CUDA)为实现GPU通用计算提供了高效、简便的方法.因此,建立了基于GPU通用计算平台的中心差分格式的显式有限元并行计算方法.该方法针对GPU计算的特点,对串行算法的流程进行了优化和调整,通过采用线程与单元或节点的一一映射策略,实现了迭代过程的完全并行化.通过数值算例表明,在保证计算精度一致的前提下,采用NVIDIA GTX460显卡,该方法能够大幅度提高计算效率,是求解平面非线性动态问题的一种高效简便的数值计算方法. 展开更多
关键词 图形处理器 CUDA 中心差分法 显式有限元 并行计算
在线阅读 下载PDF
基于多核CPU-GPU异构平台的并行Agent仿真 被引量:5
8
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第8期1716-1722,共7页
多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,... 多核中央处理器(central processing units,CPU)-图形处理器(graphics processing units,GPU)异构平台为提高并行Agent仿真(parallel Agent-based simulation,PABS)在单机上的运行性能提供了一个更高效的硬件基础,但在当前相关研究中,还缺乏一般性的理论方法来指导并行Agent仿真将多核CPU和GPU的计算资源充分利用起来。通过分析多核CPU-GPU异构并行架构的特点,在方法论层面上建立了并行Agent仿真在多核CPU-GPU异构平台下的多层负载分配模型,并根据基于Agent的仿真的执行结构,提出了对基于Agent的仿真的计算结构、数据结构进行重构的方法,以适应异构的硬件架构。最后对基于多核CPU-GPU的并行Agent仿真性能进行了实验分析。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 异构平台
在线阅读 下载PDF
基于YARN集群的计算加速部件扩展支持 被引量:6
9
作者 李钦 朱延超 +1 位作者 刘轶 钱德沛 《计算机研究与发展》 EI CSCD 北大核心 2016年第6期1263-1270,共8页
以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU... 以GPU和Intel MIC为代表的计算加速部件已在科学计算、图形图像处理等领域得到了广泛的应用,其在基于云平台的高性能计算及大数据处理等方向也具有广泛的应用前景.YARN是新一代Hadoop分布式计算框架,其对计算资源的分配调度主要针对CPU,缺少对计算加速部件的支持.在YARN中添加计算加速部件需要解决多个难点,分别是计算加速部件资源如何调度以及异构节点间如何共享问题、多个任务同时调用计算加速部件而引起的资源争用问题和集群中对计算加速部件的状态监控与管理问题.为了解决这些问题,提出了动态节点捆绑策略、流水线式的计算加速部件任务调度等,实现了YARN对计算加速部件的支持,并通过实验验证了其有效性. 展开更多
关键词 分布式系统 YARN 计算加速部件 混合异构节点 图形图像处理器 节点捆绑 任务调度
在线阅读 下载PDF
面向异构并行计算系统的流水线式压缩检查点 被引量:3
10
作者 刘勇鹏 王锋 +1 位作者 卢凯 刘勇燕 《电子学报》 EI CAS CSCD 北大核心 2012年第2期223-229,共7页
在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带... 在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带来额外的压缩计算开销.本文针对异构并行计算系统,提出流水线式并行压缩检查点技术,采用一系列优化技术来降低压缩引入的计算延时,包括:流水线式双重写缓存队列、文件写操作的合并、GPU加速的流水压缩算法和GPU资源的多进程调度,等等.本文介绍了该技术在天河一号系统中的实现,并对所实现的检查点系统进行综合评测.实验数据表明该方法在大规模异构并行计算系统中是可行、高效、实用的. 展开更多
关键词 异构并行体系结构 检查点 数据压缩 软流水线 图形处理器
在线阅读 下载PDF
异构平台上性能自适应FFT框架 被引量:9
11
作者 李焱 张云泉 《计算机研究与发展》 EI CSCD 北大核心 2014年第3期637-649,共13页
快速傅里叶变换(fast Fourier transform,FFT)在科学和工程界中具有着广泛的应用,尤其是在信号处理、图像处理以及求解偏微分方程领域.基于图形处理器(graphic processing unit,GPU)和加速处理器(accelerated processing unit,APU)的异... 快速傅里叶变换(fast Fourier transform,FFT)在科学和工程界中具有着广泛的应用,尤其是在信号处理、图像处理以及求解偏微分方程领域.基于图形处理器(graphic processing unit,GPU)和加速处理器(accelerated processing unit,APU)的异构平台,提出了自适应性能优化的大规模并行FFT(massively parallel FFT,MPFFT)框架.MPFFT框架采用了安装时和运行时2层自适应策略.安装时借助代码产生器可以生成被GPU程序内核(kernel)调用的任意长度的代码模板库(codelet);运行时根据自动调优技术使代码产生器生成高度优化的GPU计算代码.实验结果表明:MPFFT在APU平台上,一维、二维以及三维FFT相对于AMD clAmdFft 1.6取得的平均加速比分别为3.45,15.20以及4.47,在AMD HD7970GPU上平均加速比分别为1.75,3.01和1.69.在NVIDIA Tesla C2050GPU上取得的整体性能都达到了CUFFT 4.1的93%,最大加速比能够达到1.28. 展开更多
关键词 快速傅里叶变换 自适应性能优化 加速处理器 图形处理器 异构
在线阅读 下载PDF
多核CPU-GPU异构平台下并行Agent仿真负载均衡方法 被引量:3
12
作者 王维平 余文广 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第11期2366-2373,共8页
多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CP... 多核中央处理器(central processing unit,CPU)-图形处理器(graphic processing unit,GPU)异构平台为并行Agent仿真提供了一个新的硬件执行平台,而负载均衡方法是充分利用硬件计算资源、提高并行仿真运行性能的一个有效途径。针对多核CPU-GPU异构平台下并行Agent仿真的负载均衡问题,建立了面向多核CPU-GPU的并行Agent仿真多层负载分配模型,提出了基于带约束的k-means空间聚类算法的并行Agent仿真静态负载划分方法和动态负载均衡策略,并给出了划分子集间的可交互性判定,以过滤掉大量不会发生交互关系的Agent之间的交互判定计算。最后通过实验验证了本文提出方法的有效性。 展开更多
关键词 并行Agent仿真 多核中央处理器 图形处理器 负载均衡
在线阅读 下载PDF
异构计算平台上列存储系统的并行连接优化策略 被引量:4
13
作者 丁祥武 陈金鑫 王梅 《计算机工程与应用》 CSCD 北大核心 2017年第5期73-80,共8页
GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进... GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进行连接的数据划分策略——ICMD(Improved CMD),利用GPU流处理器并行处理各个子空间上的连接,然后利用任务评估分配模型实现查询负载的动态分配,使得查询操作能在多核CPU、GPU上高效并行执行。同时利用片上全局同步机制、局部内存重用技术优化ICMD连接算法。最后采用SSB基准测试集测试,结果表明:Intel~?HD Graphics 4600平台上并行连接查询相比于CPU版本获得了35%的性能提升,较GPU查询引擎的Ocelot性能上提升了18%。 展开更多
关键词 多核中央处理器-图形处理器(CPU-GPU) 流处理器 异构编程 列存储 改进协调模块分布(ICMD) 任务动态评估分配
在线阅读 下载PDF
基于数据-模型混合驱动的电力系统机电暂态快速仿真方法 被引量:6
14
作者 王鑫 杨珂 +3 位作者 黄文琦 马云飞 耿光超 江全元 《中国电机工程学报》 EI CSCD 北大核心 2024年第8期2955-2964,I0002,共11页
数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-T... 数据驱动建模方法改变了发电机传统的建模范式,导致传统的机电暂态时域仿真方法无法直接应用于新范式下的电力系统。为此,该文提出一种基于数据-模型混合驱动的机电暂态时域仿真(data and physics driven time domain simulation,DPD-TDS)算法。算法中发电机状态变量与节点注入电流通过数据驱动模型推理计算,并通过网络方程完成节点电压计算,两者交替求解完成仿真。算法提出一种混合驱动范式下的网络代数方程组预处理方法,用以改善仿真的收敛性;算法设计一种中央处理器单元-神经网络处理器单元(central processing unit-neural network processing unit,CPU-NPU)异构计算框架以加速仿真,CPU进行机理模型的微分代数方程求解;NPU作协处理器完成数据驱动模型的前向推理。最后在IEEE-39和Polish-2383系统中将部分或全部发电机替换为数据驱动模型进行验证,仿真结果表明,所提出的仿真算法收敛性好,计算速度快,结果准确。 展开更多
关键词 机电暂态 时域仿真 数据-模型混合驱动 收敛性 CPU-NPU异构运算
原文传递
基于GPU的并行植物模拟生长算法 被引量:6
15
作者 杨磊 龚学余 《计算机工程与设计》 北大核心 2016年第12期3271-3279,共9页
为提高植物模拟生长算法求解性能,基于GPU SIMT执行模型对算法步骤进行详细并行化设计并绘制算法流程图。算法代码利用C++和CUDA实现,能够在CPU+GPU混合架构平台上运行;在此基础上,利用7个不同类型的基准测试函数对算法进行测试,与串行... 为提高植物模拟生长算法求解性能,基于GPU SIMT执行模型对算法步骤进行详细并行化设计并绘制算法流程图。算法代码利用C++和CUDA实现,能够在CPU+GPU混合架构平台上运行;在此基础上,利用7个不同类型的基准测试函数对算法进行测试,与串行算法代码进行对比。分析结果表明,在保证求解质量的前提下,相比串行算法,该并行算法将目标函数复杂的大规模问题的求解效率提升了十几倍到几百倍,其加速比较好,不同变量维数下的求解时间增加不明显,验证了当前工作的可行性和有效性。 展开更多
关键词 植物模拟生长算法 并行化 图形处理器 统一计算设备架构 混合架构平台
在线阅读 下载PDF
基于物联网的医疗应急分队救治流转平台的开发与应用 被引量:10
16
作者 杨新光 蒋昆 +2 位作者 冯娟 安书杰 石秀兵 《中国医疗设备》 2017年第1期108-111,共4页
目的建立医疗应急分队救治流转平台,实现平时、战时对医疗救治工作的动态管理。方法通过对医疗应急分队平时、战时运行管理模式的研究,选择CPU卡作为介质,使用射频技术(RFID)采集救治过程数据,通过与动态物资管理系统集成,实现救治伤员... 目的建立医疗应急分队救治流转平台,实现平时、战时对医疗救治工作的动态管理。方法通过对医疗应急分队平时、战时运行管理模式的研究,选择CPU卡作为介质,使用射频技术(RFID)采集救治过程数据,通过与动态物资管理系统集成,实现救治伤员过程中对药品、耗材、用血进行动态管理。同时改进现有摄影方式,实现对伤员救治图文资料的后数字化采集和共享。结果医疗应急分队救治流转平台具有规范化、智能化、移动化、使用便捷等特点,并支持单机和网络双模式运行。结论平台为快速实施医疗救治提供了准确的信息技术支持,对总结分析战时救治方案、提高卫勤保障能力具有重要意义。 展开更多
关键词 医疗应急分队 救治流转平台 物联网 伤员电子档案 CPU卡 RFID技术 心电图诊断
在线阅读 下载PDF
“天河一号”系列超级计算机系统气象领域适用性分析 被引量:5
17
作者 魏敏 王彬 +2 位作者 孙婧 谷军霞 洪文董 《气象科技进展》 2012年第1期31-35,共5页
世界已经进入千万亿次高性能计算时代。中国国防科技大学研制的"天河一号A"(Tianhe-1A)在2010年11月14日第36届全球超级计算机TOP500排行榜上排名第一,引起了国际关注。Tianhe-1A采用CPU+GPU混合架构,峰值性能达4.701千万亿次... 世界已经进入千万亿次高性能计算时代。中国国防科技大学研制的"天河一号A"(Tianhe-1A)在2010年11月14日第36届全球超级计算机TOP500排行榜上排名第一,引起了国际关注。Tianhe-1A采用CPU+GPU混合架构,峰值性能达4.701千万亿次,Linpack性能达到2.507千万亿次。介绍了"天河一号A"超级计算机系统的系统结构、性能指标和软件系统,并结合气象应用的特点,对该系统在气象领域的适用性进行了初步探讨。 展开更多
关键词 天河一号 GPU 高性能计算 异构计算环境
在线阅读 下载PDF
时域有限元运算提速的一种新方法 被引量:1
18
作者 刘昆 杜国宏 廖成 《微波学报》 CSCD 北大核心 2010年第5期50-52,67,共4页
提出一种全新的时域有限元运算加速方法——应用图形处理器(GPU)实现对时域有限元运算的提速。在GPU上通过OpenGL编程完成时域有限元运算,从而利用GPU的并行处理功能达到提高运算速度的目的。文中介绍了编程实现过程,并分析讨论了GPU提... 提出一种全新的时域有限元运算加速方法——应用图形处理器(GPU)实现对时域有限元运算的提速。在GPU上通过OpenGL编程完成时域有限元运算,从而利用GPU的并行处理功能达到提高运算速度的目的。文中介绍了编程实现过程,并分析讨论了GPU提速过程中处理数据量不同具有不同表现的现象,进而得出随着处理数据量的增加,GPU相对于CPU的处理速度将会更快。文中以时域有限元的辐射算例验证了该算法的正确性和有效性,为时域有限元运算提速提供了一条有效途径。 展开更多
关键词 时域有限元(TD-FEM) 图形处理器(GPU) 中心处理器(CPU)
原文传递
基于龙芯2F的国产处理器平台在路由器中的设计实现 被引量:3
19
作者 刘素桃 高飞 《无线电通信技术》 2015年第6期84-87,共4页
高性能处理器(CPU)作为路由器设备的核心部件之一,主要用于实现路由器设备的控制及协议处理功能。对核心部件CPU采用了国产的龙芯2F处理器及与之相适配的中标麒麟操作系统,构建了国产处理器平台,应用到路由器设备中,解决了长期以来路由... 高性能处理器(CPU)作为路由器设备的核心部件之一,主要用于实现路由器设备的控制及协议处理功能。对核心部件CPU采用了国产的龙芯2F处理器及与之相适配的中标麒麟操作系统,构建了国产处理器平台,应用到路由器设备中,解决了长期以来路由器设备对国外处理器的依赖,提高了路由器设备的安全可靠性,实现了路由器设备在硬件、软件的自主可控。对国产处理器平台进行了简要介绍,并结合实例验证了国产处理器平台在路由器设备中的设计方案正确可行,能够满足路由器的需要,可以进行推广应用。 展开更多
关键词 龙芯2F处理器 LINUX 公共嵌入式平台 CPU
在线阅读 下载PDF
FinFET/GAAFET纳电子学与人工智能芯片的新进展 被引量:3
20
作者 赵正平 《微纳电子技术》 CAS 北大核心 2022年第3期195-209,共15页
集成电路在后摩尔时代的发展呈现出多模式创新的特点。综述了后摩尔时代中两大创新发展热点,即鳍式场效应晶体管/环绕栅场效应晶体管(FinFET/GAAFET)纳电子学和基于深度学习新算法的人工智能(AI)芯片,并介绍了其发展历程和近两年的最新... 集成电路在后摩尔时代的发展呈现出多模式创新的特点。综述了后摩尔时代中两大创新发展热点,即鳍式场效应晶体管/环绕栅场效应晶体管(FinFET/GAAFET)纳电子学和基于深度学习新算法的人工智能(AI)芯片,并介绍了其发展历程和近两年的最新进展。在FinFET/GAAFET纳电子学领域,综述并分析了当今Si基CMOS集成电路的发展现状,包含Intel的IDM模式、三星和台积电的代工模式3种技术路线,及其覆盖了22、14、10、7和5 nm集成电路纳电子学的5代技术各自的创新特点,以及未来3和2 nm技术节点GAAFET的各种创新结构的前瞻性技术研究。摩尔定律的继续发展将以Si基FinFET和GAAFET的技术发展为主。在AI芯片领域,综述并分析了数字AI芯片和模拟AI芯片的发展现状,包含神经网络云端和边缘计算应用的处理器(图像处理器(GPU)、张量处理器(TPU)和中央处理器(CPU))、加速器和神经网络处理器(NPU)等的计算架构的创新,各种神经网络算法和计算架构结合的创新,以及基于存储中计算新模式的静态随机存取存储器(SRAM)和电阻式随机存取存储器(RARAM)的创新。人工智能芯片的创新发展可弥补后摩尔时代集成电路随晶体管密度上升而计算能力增长缓慢的不足。 展开更多
关键词 鳍式场效应晶体管(FinFET) 环绕栅场效应晶体管(GAAFET) 互补场效应晶体管(CFET) 人工智能(AI)芯片 图像处理器(GPU) 张量处理器(TPU) 神经网络处理器(NPU) 存储中计算 静态随机存取存储器(SRAM) 电阻式随机存取存储器(RARAM)
原文传递
上一页 1 2 4 下一页 到第
使用帮助 返回顶部