期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
PVM环境下SPMD程序模式探讨
1
作者 冯百明 况正谦 +1 位作者 肖骊 康继昌 《西北工业大学学报》 EI CAS CSCD 北大核心 1999年第2期269-273,共5页
介绍PVM环境下的SPMD程序模式,并结合程序自动并行化模型APM,提出了克服SPMD不足之处的思想,描述了改进后的SPMD程序模式——aSPMD程序模式。该模式既有SPMD模式的特点,又有Master-Slave模... 介绍PVM环境下的SPMD程序模式,并结合程序自动并行化模型APM,提出了克服SPMD不足之处的思想,描述了改进后的SPMD程序模式——aSPMD程序模式。该模式既有SPMD模式的特点,又有Master-Slave模式的特点。文中还给出了一个用APM模型生成的aSPMD模式并行程序的实际运行效率以及aSPMD模式并行程序与SPMD模式并行程序运行时间。 展开更多
关键词 并行计算 PVM spmd 程序模式 aspmd模式
在线阅读 下载PDF
针对共享内存SPMD程序的通信流依赖分析方法
2
作者 王骞 刘晓洁 梁刚 《计算机应用》 CSCD 北大核心 2010年第3期596-599,共4页
传统数据流依赖分析方法在处理共享内存单指令多数据(SPMD)程序时,不能识别共享数据访问语句所属的处理节点,也不能消除执行顺序不定的控制流对共享数据流依赖造成的影响,从而在分析共享数据依赖时产生精度较低的结果。根据共享内存SPM... 传统数据流依赖分析方法在处理共享内存单指令多数据(SPMD)程序时,不能识别共享数据访问语句所属的处理节点,也不能消除执行顺序不定的控制流对共享数据流依赖造成的影响,从而在分析共享数据依赖时产生精度较低的结果。根据共享内存SPMD程序的共享数据别名特性,提出了一种可扩展的共享数据通信流依赖分析方法,并将其应用于一个编译后端分析器原型中。实验表明,该方法较传统分析方法可发现更多精确的共享数据通信流依赖。 展开更多
关键词 共享内存 单指令多数据 通信流依赖分析 别名分析 控制流分析
在线阅读 下载PDF
FBS-uBlock:灵活的uBlock算法比特切片优化方法
3
作者 龚子睿 郭华 +3 位作者 陈晨 张宇轩 陈俊鑫 关振宇 《软件学报》 北大核心 2025年第10期4827-4845,共19页
uBlock算法在算法设计、侧信道防护、物联网应用、密码分析领域得到了广泛应用.虽然uBlock算法适合高速实现,但目前该算法公开的实现速率远不如AES、SM4等算法.比特切片是优化分组密码的常用方法,但在采用比特切片优化uBlock算法时,面... uBlock算法在算法设计、侧信道防护、物联网应用、密码分析领域得到了广泛应用.虽然uBlock算法适合高速实现,但目前该算法公开的实现速率远不如AES、SM4等算法.比特切片是优化分组密码的常用方法,但在采用比特切片优化uBlock算法时,面临着因寄存器资源不足而导致的巨大访存开销问题.为uBlock算法设计了一种灵活的比特切片优化方法FBS-uBlock(flexible bit slicing uBlock),降低算法在比特切片下占用的寄存器数量,进而降低访存开销,提升速率.经过测试,该优化方法最多能够让uBlock-128/128、uBlock-128/256和uBlock-256/256算法的访存指令分别降低71%、71%和72%,加密速率最高能够分别达到12758 Mb/s、8944 Mb/s和8984 Mb/s,比设计文档中的实现速率分别提升了3.9、4.2和3.4倍. 展开更多
关键词 分组密码 uBlock算法 软件优化 比特切片 单指令多数据
在线阅读 下载PDF
一种多元信息流异常数据聚类修正方法与仿真
4
作者 颜清 李金讯 陈诗 《计算机仿真》 2025年第1期258-262,共5页
多元信息流涵盖多种类型、不同维度的数据,存在异构性和不确定性,以大规模和高速度连续产生,难以从中提取异常数据分布的特征,使得算法对异常数据的检测陷入局部最优解,出现局部收敛和早熟现象,进而影响异常数据修正。对此,引入混合蛙... 多元信息流涵盖多种类型、不同维度的数据,存在异构性和不确定性,以大规模和高速度连续产生,难以从中提取异常数据分布的特征,使得算法对异常数据的检测陷入局部最优解,出现局部收敛和早熟现象,进而影响异常数据修正。对此,引入混合蛙跳算法,对多元信息流异常数据展开修正。标准化处理多元信息流数据,建立预选特征子集,采用混合蛙跳算法-人工鱼群算法和混合蛙跳算法-模糊C-均值聚类算法,在搜索过程中利用了两种算法的优势,在多个搜索空间中找到最优数据特征,更准确地划分聚类簇,获取最优的数据特征并实施聚类处理,得到异常数据集合。基于单层前馈神经网络,构建异常数据修正模型,通过更新参数,由输出层输出异常数据的修正结果。仿真测试结果显示:混合蛙跳算法能够加强融合对象的优势,检测异常数据集占比高达99.72%,精准完成异常数据检测任务;修正误差最大仅为1.119,可以满足精准性需求。 展开更多
关键词 多元信息流 混合蛙跳算法 人工鱼群算法 模糊均值聚类算法 单层前馈神经网络 异常数据修正
在线阅读 下载PDF
基于多实体的矢量数据压缩改进算法 被引量:6
5
作者 陈飞翔 李华 于文洋 《计算机工程与应用》 CSCD 北大核心 2008年第19期200-202,共3页
矢量数据压缩在地形环境仿真、制图综合、GIS等研究中具有重要作用,对增加移动设备的存储能力和提高矢量数据的网络传输效率来说是一项很重要的工作。根据动态规划算法理论、Douglas-Peucker算法和矢量数据的特点,提出了基于动态规划算... 矢量数据压缩在地形环境仿真、制图综合、GIS等研究中具有重要作用,对增加移动设备的存储能力和提高矢量数据的网络传输效率来说是一项很重要的工作。根据动态规划算法理论、Douglas-Peucker算法和矢量数据的特点,提出了基于动态规划算法的矢量数据压缩的模型和改进方法,通过一条参考路径构造一条带形成最小误差搜索范围,同时条带宽度可自适应调整。并将单一实体的优化压缩算法扩展为基于多实体的压缩算法,解决了图层压缩的全局优化问题。实验结果表明,该方法具有较高的效率,能够得到较小的压缩误差。 展开更多
关键词 矢量数据压缩 动态规划算法 多实体压缩
在线阅读 下载PDF
面向单目标优化的集成粒子群算法 被引量:8
6
作者 何莉 王淼 李博 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2017年第4期527-534,共8页
串行粒子群算法广泛应用于多个领域,出现了多个变种,但解决不同种类的优化问题时性能有差异。为提高串行粒子群算法对各种优化问题的适应能力,提出一种集成粒子群优化算法。新算法使用Matlab的单程序多数据并行结构发挥单节点多核计算能... 串行粒子群算法广泛应用于多个领域,出现了多个变种,但解决不同种类的优化问题时性能有差异。为提高串行粒子群算法对各种优化问题的适应能力,提出一种集成粒子群优化算法。新算法使用Matlab的单程序多数据并行结构发挥单节点多核计算能力,通过设置外部档案分享不同粒子群的全局最佳位置,促进不同串行粒子群算法之间的信息交流,综合利用不同串行粒子群算法在解决不同类型优化问题的优势。在广泛使用的测试函数集上开展仿真实验,结果验证了新算法的有效性,与多个知名的串行粒子群算法相比,新算法在寻优性能上优势明显。新算法不仅能够提高粒子群算法的适应能力,而且,所采用的算法框架也适应于其他群智能算法,改善了算法的性能。 展开更多
关键词 单程序多数据 集成粒子群算法 全局数值优化 粒子群优化 并行计算
在线阅读 下载PDF
并行实时测控数据存储系统设计与实现 被引量:6
7
作者 何锋 曾文 王秉钧 《计算机工程与应用》 CSCD 北大核心 2020年第23期253-258,共6页
随着测控设备数量增加、数据码率的不断提高,传统的测控中心实时存储系统采用的串行化处理逻辑已经难以适应高负载的测控任务需要。采用SPMD(Single Program Multiple Data)思想,基于OpenMP和Qt设计并实现了一套并行实时测控数据存储系... 随着测控设备数量增加、数据码率的不断提高,传统的测控中心实时存储系统采用的串行化处理逻辑已经难以适应高负载的测控任务需要。采用SPMD(Single Program Multiple Data)思想,基于OpenMP和Qt设计并实现了一套并行实时测控数据存储系统框架。该系统通过引入M/M/1模型的排队系统,设计了一种适合并行实时测控数据存储系统的静态负载均衡算法,基于互斥锁完成了线程间的细粒度通信同步机制,借助于事件循环机制将Qt的信号与槽特性成功地嵌入OpenMP线程,保留了Qt图形界面良好的人机交互性能。实验结果表明该系统在高负载的情况下,相比串行测控数据存储系统而言具有更好的扩展性和实时性,能更好地利用现行单机多核系统的计算资源,获得更好的实时性能。 展开更多
关键词 单程序多数据(spmd) 并行测控数据实时存储系统 负载均衡 互斥锁
在线阅读 下载PDF
一个新的线索KD树并行算法 被引量:2
8
作者 焦良葆 陈瑞 张健 《工程图学学报》 CSCD 北大核心 2011年第5期46-50,共5页
KD树是三维场景渲染中常用的空间加速算法。由于SIMD计算平台不支持递归操作,导致KD树在GPU上的应用受到限制,因此提出了一个新的基于SIMD架构的并行KD树算法。通过创建时对KD树线索化,不仅省去堆栈使用,且因无需回溯到根节点而减少大... KD树是三维场景渲染中常用的空间加速算法。由于SIMD计算平台不支持递归操作,导致KD树在GPU上的应用受到限制,因此提出了一个新的基于SIMD架构的并行KD树算法。通过创建时对KD树线索化,不仅省去堆栈使用,且因无需回溯到根节点而减少大量无效遍历操作,实现了基于GPU的高效并行加速。实验结果表明,线索KD树算法每秒计算的光线数与传统算法相比,提高3~8倍不等,最终显著提高光线跟踪渲染速度。 展开更多
关键词 三维场景渲染 线索KD树 并行算法 SIMD平台
在线阅读 下载PDF
面向国产高性能众核处理器的编程模型 被引量:1
9
作者 陈虎 周鹏灵 《计算机应用》 CSCD 北大核心 2023年第11期3517-3526,共10页
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一... 在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。 展开更多
关键词 国产众核处理器 单指令多数据流 并行编程模型 SW26010 消息队列模型
在线阅读 下载PDF
椭圆曲线密码ML算法电路实现的功耗攻击
10
作者 韩煜 邹雪城 +1 位作者 刘政林 但永平 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第2期21-24,共4页
针对有限域GF(2163)上椭圆曲线密码(ECC)的ML算法电路,实现了一种简单有效的差分功耗分析(DPA)方法.该方法结合单密钥多数据攻击,按密钥比特对功耗轨迹分段差分运算.基于功耗仿真的实验结果表明:仅对单条功耗曲线进行差分分析就能够以... 针对有限域GF(2163)上椭圆曲线密码(ECC)的ML算法电路,实现了一种简单有效的差分功耗分析(DPA)方法.该方法结合单密钥多数据攻击,按密钥比特对功耗轨迹分段差分运算.基于功耗仿真的实验结果表明:仅对单条功耗曲线进行差分分析就能够以极短的时间恢复出密钥比特,从而证明ECC的ML算法实现只具备抗时间攻击和抗简单功耗分析攻击效果,却不能对抗DPA攻击. 展开更多
关键词 椭圆曲线密码 ML算法 功耗攻击 差分功耗分析 单密钥多数据
原文传递
集装箱港口装卸同步作业模式下的协调调度研究
11
作者 杨磊 张旭之 何山 《物流技术》 北大核心 2013年第12期110-113,共4页
研究如何在单船舶多桥吊的条件下实现集装箱港口装卸同步作业,通过二阶段建模,引入混合车间调度模型,并采用多层编码遗传算法与0-1整数规划模型求解,最后用实例验证其可行性,得到装卸同步作业进出口集装箱装卸序列以及设备调度优化方案... 研究如何在单船舶多桥吊的条件下实现集装箱港口装卸同步作业,通过二阶段建模,引入混合车间调度模型,并采用多层编码遗传算法与0-1整数规划模型求解,最后用实例验证其可行性,得到装卸同步作业进出口集装箱装卸序列以及设备调度优化方案。结果证明,在此作业模式下作业时间减少17%,桥吊和集卡在一定程度上实现了"满去满回"状态,降低了设备空载率,提高了作业效率,缩短了船舶在港停留时间。 展开更多
关键词 集装箱港口 单船舶多桥吊 装卸同步 遗传算法 0-1整数规划
在线阅读 下载PDF
锥束CT仿真投影快速计算
12
作者 朱妮 《科学技术与工程》 北大核心 2013年第14期4057-4060,4065,共5页
针对离散体素模型仿真投影数据计算,提出了一种快速并行计算方法。首先从射线的对称性分析了投影数据的并行计算,然后通过Siddon算法来进行射线与体素的求交;结合SIMD技术实现了离散体素模型投影数据的快速并行计算。实验结果表明,在保... 针对离散体素模型仿真投影数据计算,提出了一种快速并行计算方法。首先从射线的对称性分析了投影数据的并行计算,然后通过Siddon算法来进行射线与体素的求交;结合SIMD技术实现了离散体素模型投影数据的快速并行计算。实验结果表明,在保持投影数据精度的同时,较之Siddon方法能够取得约1.9倍的加速比。 展开更多
关键词 锥束CT 仿真投影 Siddon算法 SIMD
在线阅读 下载PDF
区域优化分割的数学模型及其算法
13
作者 张莉 彭云飞 《贵州科学》 2010年第3期20-22,50,共4页
针对一些实际问题提出区域优化分割问题并建立数学模型,综合应用数据分类法、多目标非线性规划理论等数学理论和方法,获得了区域优化分割模型的近似最优解及算法。
关键词 区域优化 多目标规划 离散度 数据分类法 近似最优解 算法
在线阅读 下载PDF
媒体处理器视频哈夫曼解码快速算法 被引量:2
14
作者 倪昕 王维东 +1 位作者 刘鹏 张贻雄 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第12期2036-2039,共4页
为了提高视频处理中哈夫曼解码的性能,从减少比特操作、提高处理器内存利用率的角度出发,设计了2种不同的数据结构进行哈夫曼码表的组织,提出了一种新的并行分步查表算法,对Ishii的并行查表法进行了改进.实验结果表明,采用新算法及其内... 为了提高视频处理中哈夫曼解码的性能,从减少比特操作、提高处理器内存利用率的角度出发,设计了2种不同的数据结构进行哈夫曼码表的组织,提出了一种新的并行分步查表算法,对Ishii的并行查表法进行了改进.实验结果表明,采用新算法及其内存优化策略,以哈夫曼解码性能较少下降的代价,内存开销得到大幅降低.新算法比常用的分步查表算法的解码效率有较大提升,对MPEG系列、H.26X系列等视频压缩标准具有普适性. 展开更多
关键词 媒体处理器 哈夫曼解码 单指令多数据流 分步查表法
在线阅读 下载PDF
共享指令缓存XOR散列索引的研究与设计 被引量:2
15
作者 刘骁 唐勇 +1 位作者 郑方 丁亚军 《计算机学报》 EI CSCD 北大核心 2019年第11期2499-2511,共13页
SPMD(Single Program Multiple Data)是高性能领域的主要工作模式之一,该模式下邻近核心执行相同的程序块,但根据处理数据或控制流的差异,临近核心的指令流并不完全相同.L1 ICache(Instruction Cache)共享技术通过将邻近核心的L1 ICach... SPMD(Single Program Multiple Data)是高性能领域的主要工作模式之一,该模式下邻近核心执行相同的程序块,但根据处理数据或控制流的差异,临近核心的指令流并不完全相同.L1 ICache(Instruction Cache)共享技术通过将邻近核心的L1 ICache共享,能有效利用众核处理器SPMD工作模式的特点,同时能缓解片上资源紧张的问题.但共享结构会带来访问冲突,对性能有不利影响.本文基于排队网络对共享ICache的访问冲突进行了理论分析,该理论分析依据核心对共享ICache体的访问特性进行建模,避免了直接抽象物理节点导致的模型访存特性模糊问题.根据理论推导的指令缓存性能损失原因,本文设计了面向共享L1 ICache的低访问冲突XOR散列函数.函数的设计综合考虑搜索了代价和工程实现复杂性,在保证散列线性空间随机散列能力的前提下,对附加延迟、功耗开销进行控制.该散列函数基于异或操作,通过调整ICache排队网络模型的节点转换概率,降低了共享L1 ICache的访问冲突.实验结果表明,在指令缓存总容量为32 KB的四核心簇上,使用XOR散列的共享L1 ICache结构较私有L1 ICache结构性能平均优化11%,较使用低位交错策略的共享L1 ICache结构性能平均优化8%,较使用面向跨步访存散列策略的共享L1 ICache结构性能平均优化3.2%. 展开更多
关键词 单程序多数据流模型 指令缓存 众核处理器 排队网络模型 XOR散列函数
在线阅读 下载PDF
面向神威高性能多核处理器的并行编译优化方法 被引量:3
16
作者 周雍浩 徐金龙 +2 位作者 李斌 钱宏 聂凯 《计算机工程》 CAS CSCD 北大核心 2022年第9期130-138,共9页
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行... 在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。 展开更多
关键词 神威高性能多核处理器 OpenMP编程 并行域重构 fork-join模型 单程序多数据模型
在线阅读 下载PDF
单程序多数据并行程序优化规律分析 被引量:1
17
作者 胡悦 童维勤 《计算机应用》 CSCD 北大核心 2014年第A01期103-106,共4页
在并行程序开发过程中,对并行程序的有效优化能够充分发挥软硬件的执行效率。在进一步探讨Amdahl定律的基础上,针对数据密集型问题的单程序多数据(SPMD)并行计算,分析并行程序被有效优化后其计算时间及并行效率的变化规律,并给出了公式... 在并行程序开发过程中,对并行程序的有效优化能够充分发挥软硬件的执行效率。在进一步探讨Amdahl定律的基础上,针对数据密集型问题的单程序多数据(SPMD)并行计算,分析并行程序被有效优化后其计算时间及并行效率的变化规律,并给出了公式证明,有利于充分利用Amdahl定律指导并行程序的优化。实验结果表明了论证的有效性。 展开更多
关键词 数据密集型 单程序多数据 优化 并行计算时间 并行效率
在线阅读 下载PDF
MPEG-2音频解码算法优化 被引量:1
18
作者 赵永刚 唐昆 +2 位作者 崔慧娟 杜文 杨铭 《电声技术》 北大核心 2003年第12期10-12,22,共4页
以PC机为硬件平台对MPEG-2的音频解码算法进行优化,实现MPEG-2全软件的系统、视频、音频3个部分实时解码。在IDCT和IMDCT中应用了新的快速算法;结合PC机本身的特点及解码过程中有大量的乘加运算采用SIMD(single-instructionmultiple-da... 以PC机为硬件平台对MPEG-2的音频解码算法进行优化,实现MPEG-2全软件的系统、视频、音频3个部分实时解码。在IDCT和IMDCT中应用了新的快速算法;结合PC机本身的特点及解码过程中有大量的乘加运算采用SIMD(single-instructionmultiple-data)来对程序优化,并在实际运算中也对数据结构进行了优化。通过以上的优化使MPEG-2层II解码的运算量减少了40%以上,在奔腾3/450计算机上只占用不到5%的系统资源。这些优化算法已经应用于奔腾3/800为硬件平台的MPEG-2实时解码器中。 展开更多
关键词 MPEG-2 音频解码 SIMD 离散余弦反变换 修正离散余弦反变换 单指令多数据
在线阅读 下载PDF
基于多核CPU的脑网络拓扑属性并行分析方法
19
作者 杨灿 郭浩 陈俊杰 《计算机工程与设计》 北大核心 2016年第12期3400-3404,共5页
针对脑网络研究中需计算的网络数目过多造成执行时间过长的问题,提出一种基于多核CPU(central processing unit)的并行计算方法。通过SPMD(single program multiple data)机制利用CPU的多核同时执行,实现并行计算多个网络的属性,利用循... 针对脑网络研究中需计算的网络数目过多造成执行时间过长的问题,提出一种基于多核CPU(central processing unit)的并行计算方法。通过SPMD(single program multiple data)机制利用CPU的多核同时执行,实现并行计算多个网络的属性,利用循环打包方法降低SPMD机制中循环控制的时间,得到并行计算多个网络指标的时间,同串行计算时间相比,可得到此方法的并行计算效果。与传统并行单个算法的策略相比,该方法利用不同脑网络之间计算的独立性,采取同时计算多个网络的策略。在一台多核CPU的主机上,分析CPU核数、网络节点规模这两个因素对网络指标计算并行效果影响。在利用12个CPU核并行计算网络节点规模为3000的指标时,加速比均达到2以上,其中效果最好的是网络同配系数的计算,加速比达到6倍以上。实验结果表明,基于SPMD机制和循环打包方法的并行计算架构对脑网络指标计算的并行效果显著,加速比随着CPU核数、网络节点规模的增长呈上升趋势。 展开更多
关键词 功能脑网络 拓扑属性 并行计算 多核中央处理器 单程序多数据机制
在线阅读 下载PDF
面向嵌入式应用的数据并行语言设计
20
作者 史英超 张发存 段敬红 《计算机工程与应用》 CSCD 北大核心 2011年第4期61-63,67,共4页
根据基于PIM(Processor-In-Memory)技术的数据并行计算机体系结构的特点和面向多媒体计算的应用需求,提出了面向嵌入式SIMD(Single Instruction Multiple Data)计算的数据并行语言PIMC。简单讨论了PIMC语言的形式化定义,并以数据并行图... 根据基于PIM(Processor-In-Memory)技术的数据并行计算机体系结构的特点和面向多媒体计算的应用需求,提出了面向嵌入式SIMD(Single Instruction Multiple Data)计算的数据并行语言PIMC。简单讨论了PIMC语言的形式化定义,并以数据并行图像处理的均值滤波算法为例对语言的使用作了说明。结合其他大量的数据并行编程实例,说明了该语言能够在基于PIM技术的SIMD并行计算机上正确描述基本多媒体处理算法的数据并行实现。 展开更多
关键词 数据并行语言 存储器中的处理器(PIM) 多指令单数据(SIMD)计算 可重构 语法规则
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部