期刊文献+
共找到75篇文章
< 1 2 4 >
每页显示 20 50 100
MPSOC中的ISS与SYSTEMC模型集成
1
作者 何亚军 张多利 沈斌 《中国集成电路》 2007年第6期28-31,共4页
目前在SOC设计中基于C/C++的硬件设计方法已经比较普遍,特别是使用SYSTEMC作为硬件建模语言,指令集仿真器(ISS)作为处理器模型的方式,对SOC的开发非常有效。但随着应用程序规模的增加,我们需要在系统中嵌入多个核,构成多核系统(MPSOC),... 目前在SOC设计中基于C/C++的硬件设计方法已经比较普遍,特别是使用SYSTEMC作为硬件建模语言,指令集仿真器(ISS)作为处理器模型的方式,对SOC的开发非常有效。但随着应用程序规模的增加,我们需要在系统中嵌入多个核,构成多核系统(MPSOC),以满足性能的要求。本文首先对单核系统中的ISS和硬件模块的集成方法进行分析,然后将其引入到MPSOC的开发平台的设计中,并对其效果进行验证。 展开更多
关键词 mpsoc ISS systemC
在线阅读 下载PDF
主动声呐实时信号处理算法的MPSoC优化实现
2
作者 邹佳运 师英杰 +2 位作者 吴永清 郝程鹏 王东辉 《系统工程与电子技术》 北大核心 2025年第10期3137-3147,共11页
针对水下无人航行器(underwater unmanned vehicle,UUV)主动声呐系统对信号处理实时性、能效比及集成度的需求,采用模块化设计以及软硬件协同设计思想,提出一种基于异构多处理器片上系统(multi-processor system on chip,MPSoC)的主动... 针对水下无人航行器(underwater unmanned vehicle,UUV)主动声呐系统对信号处理实时性、能效比及集成度的需求,采用模块化设计以及软硬件协同设计思想,提出一种基于异构多处理器片上系统(multi-processor system on chip,MPSoC)的主动声呐实时信号处理算法的加速方案。首先研究适合边缘端部署的声呐信号处理算法;然后设计基于MPSoC的加速计算结构,将数字下变频、逆/快速傅里叶变换、波束形成等具有高计算复杂性的处理步骤移植到可编程逻辑端,实现显著加速;最后将目标检测等复杂度较低的步骤部署在处理器系统端,实现更高的灵活性。仿真及湖上试验结果表明,提出的方案可在数据更新周期的41%时间内完成1帧回波数据的实时处理,并可在复杂水下环境下实时有效探测运动目标。该方案在水下UUV主动声呐探测领域具有广阔的应用前景。 展开更多
关键词 水下无人航行器 主动声呐 多处理器片上系统 实时信号处理 硬件加速
在线阅读 下载PDF
面向MPSoC系统多特征的模糊动态调度算法 被引量:2
3
作者 李达 侯义斌 +1 位作者 黄樟钦 肖春华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2011年第8期1447-1454,共8页
针对MPSoC系统中的不确定多特征,提出基于模糊集理论的多核系统动态启发式调度算法.利用模糊集描述系统的多种不确定特征,根据模糊隶属度计算确定任务和资源的调度优先级,以提高任务调度的可并发执行能力;综合资源的最早可用时间和利用... 针对MPSoC系统中的不确定多特征,提出基于模糊集理论的多核系统动态启发式调度算法.利用模糊集描述系统的多种不确定特征,根据模糊隶属度计算确定任务和资源的调度优先级,以提高任务调度的可并发执行能力;综合资源的最早可用时间和利用率,适当选取最接近处理器评估函数均值的处理器,以提高处理器利用率和均衡处理器负载.仿真模拟结果表明,该算法的系统综合性能好于近视算法、节约算法和分组适度算法,更能适用于多样特征的复杂MPSoC系统任务调度. 展开更多
关键词 mpsoc系统 动态调度 多特征 优先级 模糊集
在线阅读 下载PDF
访存与用户行为敏感的MPSoC应用映射 被引量:3
4
作者 王一拙 左琦 +2 位作者 计卫星 王小军 石峰 《电子学报》 EI CAS CSCD 北大核心 2015年第4期631-638,共8页
应用映射是MPSo C设计中的关键问题,针对多应用负载的MPSo C,提出一种访存与用户行为敏感的动态映射策略,该策略根据应用的数据访问特征区分热点与非热点应用,并对用户行为进行建模,根据用户行为模型,进一步在运行时区分关键与非关键应... 应用映射是MPSo C设计中的关键问题,针对多应用负载的MPSo C,提出一种访存与用户行为敏感的动态映射策略,该策略根据应用的数据访问特征区分热点与非热点应用,并对用户行为进行建模,根据用户行为模型,进一步在运行时区分关键与非关键应用.对每个进入系统的应用,按照应用的热点及关键性分类动态选择在线映射算法,让热点应用围绕存储器布局,非热点应用尽量避免占用存储器附近的资源;对关键应用,最小化应用内通信开销和链路竞争,对非关键应用,最小化应用间通信开销和链路竞争.实验表明,与单纯考虑访存或用户行为的映射策略相比,本文策略能够降低系统整体的通信能耗. 展开更多
关键词 多处理器片上系统 片上网络 应用映射 任务映射
在线阅读 下载PDF
基于ZYNQ MPSOC的以太网PHY芯片功能测试方法 被引量:2
5
作者 李睿 万旺 +4 位作者 焦美荣 张大宇 张松 王贺 梁培哲 《微电子学与计算机》 2024年第5期127-133,共7页
随着以太网技术和集成电路技术的发展,以太网物理层(Physical Layer,PHY)芯片的速率和性能都得到了极大提升,电路复杂度更是几何级增长,以至于常规的自动测试设备(Automatic Test Equipment,ATE)测试很难充分验证其功能,所以亟需开展相... 随着以太网技术和集成电路技术的发展,以太网物理层(Physical Layer,PHY)芯片的速率和性能都得到了极大提升,电路复杂度更是几何级增长,以至于常规的自动测试设备(Automatic Test Equipment,ATE)测试很难充分验证其功能,所以亟需开展相应测试方法研究。提出了一种高效的基于ZYNQ MPSOC的以太网PHY芯片功能测试方法。该方法以ZYNQ MPSOC为核心,设计了一种直达应用层面的系统级测试装置,从而减少了与物理层直接交互的行为,有效降低了测试装置及程序开发难度。经试验验证,提出的基于ZYNQ MPSOC的以太网PHY芯片功能测试方法能够用于以太网PHY芯片测试。 展开更多
关键词 以太网 PHY芯片 ZYNQ mpsoc 系统级测试装置 PHY芯片测试
在线阅读 下载PDF
面向MPSoC多核AMP架构的运行方案研究 被引量:1
6
作者 龚行梁 孙浩 +2 位作者 周强 王浩 刘伟 《单片机与嵌入式系统应用》 2022年第2期32-35,40,共5页
本文针对Zynq UltraScale+MPSoC硬件平台,通过分析对比现有的非对称多处理架构方案,提出一种简洁的AMP运行方案,实现1个Cortex-A53核运行Linux系统,其他3个Cortex-A53核运行裸核系统功能。本文从分析多核启动机制入手,实现一种Linux用... 本文针对Zynq UltraScale+MPSoC硬件平台,通过分析对比现有的非对称多处理架构方案,提出一种简洁的AMP运行方案,实现1个Cortex-A53核运行Linux系统,其他3个Cortex-A53核运行裸核系统功能。本文从分析多核启动机制入手,实现一种Linux用户态动态加载启动多核方案,设计多核监督模块解决多核异常问题,提高系统应用稳定性。测试结果表明,本方案实现的多核动态加载启动功能运行可靠,能够满足电力二次设备性能、实时控制的应用需求,有效提升系统设计的灵活性,具有较好的工程应用价值。 展开更多
关键词 mpsoc AMP LINUX 裸核系统 Cortex-A53
在线阅读 下载PDF
基于MPSoC的遥感图像目标检测算法硬件加速研究 被引量:9
7
作者 李强 武文波 何明一 《航天返回与遥感》 CSCD 北大核心 2022年第1期58-68,共11页
遥感图像目标实时检测是遥感应用领域的关键技术问题之一。深度神经网络遥感图像目标检测准确率高,但此类网络通常结构复杂、参数多、计算量大,对计算资源和存储的需求较高,设计轻量化软硬件系统实现星载边缘端部署较为困难。针对上述问... 遥感图像目标实时检测是遥感应用领域的关键技术问题之一。深度神经网络遥感图像目标检测准确率高,但此类网络通常结构复杂、参数多、计算量大,对计算资源和存储的需求较高,设计轻量化软硬件系统实现星载边缘端部署较为困难。针对上述问题,文章提出了一种基于多处理器片上系统(MPSoC)现场可编程门阵列(FPGA)的遥感图像目标检测算法硬件加速方案。首先研究了适合星载边缘端部署的目标检测算法;然后设计了深度卷积神经网络并行加速计算结构和引擎,采用有限精度运算实现网络参数,使其数字量减少了75%,显著降低了计算和存储开销;最后基于MPSoC FPGA处理器实现了飞机目标检测的原型演示验证系统。实验结果表明,文章提出的遥感图像目标检测系统方案的目标检测精度可达92%以上;与基于嵌入式CPU、CPU、GPU的方案相比,单帧图像推理时间从100s、1000ms、100ms缩短至10ms级,可以满足遥感图像目标检测实时处理要求,具有一定的工程应用价值。 展开更多
关键词 目标检测 多处理器片上系统 现场可编程门阵列 深度卷积神经网络 嵌入式 硬件 加速 遥感应用
在线阅读 下载PDF
利用冗余核的MPSoC故障检测方法 被引量:2
8
作者 唐柳 黄樟钦 +2 位作者 侯义斌 方凤才 张会兵 《计算机应用》 CSCD 北大核心 2014年第1期41-45,共5页
在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计... 在处理器可靠性研究中,为在容错机制部署与容错开销之间达到较好的平衡,提出一个利用冗余核进行检测代码计算任务的多处理器片上系统(MPSoC)故障检测方法。该方法利用多核系统天然的冗余特性,将用于进行故障检测的冗余代码中的大部分计算任务转移到冗余核中进行,检测软件控制流的正确性和数据的一致性,实现MPSoC的故障检测。所提方法无需添加额外硬件,通过指令级的冗余进行故障检测,可满足系统可靠性需求,同时又能减少面积开销,在性能方面和花销上做到有效的权衡。在一个MPSoC上对所提方法进行验证实验,通过故障注入,运行多个基准程序进行有效性验证,并将所提方法与几种具有代表性的软件检测硬件故障方法故障检测能力、面积、内存以及性能花销等方面进行比较,实验结果证明所提方法有效且能够在性能和花销之间取得较好的权衡。 展开更多
关键词 多处理器片上系统 可靠性 故障检测 冗余核 检测代码
在线阅读 下载PDF
基于FPGA面向多媒体处理的MPSoC 被引量:1
9
作者 李晶皎 陆振林 +1 位作者 王爱侠 王骄 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第4期486-490,共5页
针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共... 针对嵌入式单核处理器处理速度慢及主频提升受限等问题,提出了嵌入式双核处理器(two-cores embedded processor,TEP)模型.针对处理器运行时对存储器的依赖和分配问题,提出了基于非统一存储结构模拟分布式存储结构的方案;针对多核间对共享数据存储器的访存问题,给出了从属单元的仲裁机制,实现了共享资源的访问;针对面向多媒体应用的多核处理器间传输数据量大及通讯开销高的问题,提出了基于消息数据分离的传输方案.系统在FPGA平台进行了实现和验证,测试结果表明,TEP系统以较少的资源消耗和通讯开销获得了大加速比的性能. 展开更多
关键词 片上多处理器 嵌入式双核处理器 非统一存储结构 FPGA 消息数据分离
在线阅读 下载PDF
面向MPSoC性能评估的高速缓存建模技术
10
作者 修思文 李彦哲 +3 位作者 黄凯 马德 晏荣杰 严晓浪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第7期1367-1375,共9页
分析现有的面向MPSoC性能评估的高速缓存建模技术的缺点,提出用于本机模拟的静态分析和动态标注相结合的缓存建模技术.该技术采用GCC剖析,避免了命中判断时标签比较,扩展了缓存更新的粒度.建立准确的指令和各类型变量在目标平台的地址... 分析现有的面向MPSoC性能评估的高速缓存建模技术的缺点,提出用于本机模拟的静态分析和动态标注相结合的缓存建模技术.该技术采用GCC剖析,避免了命中判断时标签比较,扩展了缓存更新的粒度.建立准确的指令和各类型变量在目标平台的地址映射表,提高了仿真速度和评估的准确性.该技术支持对多级缓存的建模,扩展了对多处理器平台的支持.实验结果表明,该技术的评估速度和准确性均优于现有技术. 展开更多
关键词 mpsoc性能评估 高速缓存建模 本机模拟 GCC剖析 静态分析 动态标注 多级缓存
在线阅读 下载PDF
访存敏感的增量式MPSoC应用映射 被引量:1
11
作者 王一拙 左琦 +2 位作者 计卫星 王小军 石峰 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1198-1209,共12页
现代多处理器片上系统(multiprocessor system-on-chip,MPSoC)通常采用片上网络(networkon-chip,NoC)作为其基本互连结构,应用映射是基于片上网络互连的MPSoC设计中的关键问题,应用映射决定应用划分成的各个任务到片上网络节点的分配.... 现代多处理器片上系统(multiprocessor system-on-chip,MPSoC)通常采用片上网络(networkon-chip,NoC)作为其基本互连结构,应用映射是基于片上网络互连的MPSoC设计中的关键问题,应用映射决定应用划分成的各个任务到片上网络节点的分配.许多基于片上网络互连的MPSoC系统将共享存储作为网络中的独立节点,针对这类MPSoC系统,提出一种访存敏感的增量式动态映射策略.该策略离线分析获取应用的访存特征,运行中当应用到达系统时,根据其访存特征选择不同的映射算法,将热点应用围绕共享存储器布局,非热点应用远离共享存储器布局,并最小化应用间以及应用所含任务间的通信链路竞争.模拟实验表明:与贪恋区域选择加随机节点映射的策略相比较,提出的策略对系统整体通信功耗平均节约34.6%,性能提升可达36.3%,并能适应不同片上网络规模. 展开更多
关键词 多处理器片上系统 片上网络 应用映射 任务映射 访存敏感
在线阅读 下载PDF
负载自适应的异构MPSoC任务调度算法研究
12
作者 谢盈 吴尽昭 +1 位作者 熊菊霞 张晖 《工程科学与技术》 EI CAS CSCD 北大核心 2017年第2期190-195,共6页
在异构MPSoC中,并行任务通过调度算法被分配到各个处理器核上运行,因而任务调度算法的优劣将直接影响异构MPSoC的应用性能。根据处理器核类型和任务间依赖关系,以减小任务间通信开销为目标,提出一种具备负载自适应能力的异构MPSoC任务... 在异构MPSoC中,并行任务通过调度算法被分配到各个处理器核上运行,因而任务调度算法的优劣将直接影响异构MPSoC的应用性能。根据处理器核类型和任务间依赖关系,以减小任务间通信开销为目标,提出一种具备负载自适应能力的异构MPSoC任务调度算法。首先,将待调度任务集划分为多个并行任务子集;其次,在考虑处理器核负载的基础上,根据并行任务子集集合、处理器核集合及任务子集在各个核上的执行效率生成赋权二部图;最后,利用赋权二部图最大权匹配方法,将并行任务子集合理地调度到负载适应的处理器核上运行,以降低任务集的平均调度长度,并提高处理器核利用率,从而实现异构MPSoC应用性能的提升。仿真实验在不同的任务总数、任务最大前驱数、核类型、核数量的应用场景下,通过任务集平均调度长度、处理器核利用率两项指标对提出算法进行了定量分析。结果表明,提出算法能有效降低任务集平均调度长度,在实现负载自适应的同时提高异构MPSoC处理器核的利用率。 展开更多
关键词 异构mpsoc 负载自适应 任务划分 任务调度
在线阅读 下载PDF
一种负载感知的异构MPSoC任务调度算法
13
作者 谢盈 吴尽昭 +1 位作者 丁旭阳 张晖 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第6期890-895,共6页
处理器核的异构性、运行时负载和任务间依赖关系,是影响异构MPSoC任务调度算法性能的关键因素。该文提出了一种负载感知的异构MPSoC任务调度算法,在满足任务间依赖关系的前提下,根据计算开销和通信负载将待调度任务集划分为任务子集。... 处理器核的异构性、运行时负载和任务间依赖关系,是影响异构MPSoC任务调度算法性能的关键因素。该文提出了一种负载感知的异构MPSoC任务调度算法,在满足任务间依赖关系的前提下,根据计算开销和通信负载将待调度任务集划分为任务子集。在考虑处理器核负载状态的基础上,通过赋权二部图最大权匹配,将任务子集调度到适载的处理器核上运行,提高了待调度任务集总执行效率。仿真实验结果表明,该算法有效降低了任务集的调度长度,提高了处理器核的利用率。 展开更多
关键词 异构mpsoc 负载感知 任务调度 任务划分
在线阅读 下载PDF
一种基于MPSoC的网络处理器模型及其应用
14
作者 张晓明 孙志刚 张民选 《国防科技大学学报》 EI CAS CSCD 北大核心 2005年第5期39-43,共5页
从MPSoC系统设计角度出发提出了网络处理器的参数化分析模型,称为NePlat。该模型采用数据流进程网络(DPN,Dataflow Process Network)描述网络应用,构造参数化异构硬件资源,并将应用模型映射到体系结构资源上评价网络处理器性能。
关键词 mpsoc 网络处理器 NePlat
在线阅读 下载PDF
基于Bus-NoC的3D MPSoC的总线仲裁
15
作者 姚放吾 高明姬 《计算机技术与发展》 2009年第7期91-94,共4页
3D集成芯片与二维传统芯片相比能够提供更好的性能和组装密度,另一方面,在单个芯片上集成多个处理器(MPSoC)以提高芯片的整体性能已成为下一代集成电路设计趋势。MPSoC的总线和片上网络两种通讯架构各有利弊,如何将3D芯片设计和MPSoC的... 3D集成芯片与二维传统芯片相比能够提供更好的性能和组装密度,另一方面,在单个芯片上集成多个处理器(MPSoC)以提高芯片的整体性能已成为下一代集成电路设计趋势。MPSoC的总线和片上网络两种通讯架构各有利弊,如何将3D芯片设计和MPSoC的架构相结合,对Bus-NoC混合的3D MPSoC结构进行研究,提出了改善的总线仲裁算法dTDMA+。原有的dTDMA有着很好的带宽利用率但在实时性要求方面欠佳,实验结果表明,dTDMA+在一定程度上满足了系统的强实时要求。 展开更多
关键词 3D mpsoc 仲裁算法 dTDMA+ 总线 片上网络
在线阅读 下载PDF
基于MPSOC和HLS的图像处理算法验证系统研究
16
作者 申俊星 褚立柱 《商丘职业技术学院学报》 2024年第1期82-86,共5页
图像处理算法的动态验证是图像处理算法开发过程中的关键.为了提高验证时效性,基于MPSOC和HLS设计了一种图像处理算法动态实时验证系统,利用HLS技术高效完成图像处理算法的硬件实现以实现图像处理算法硬件加速,同时基于LVDS设计了板间... 图像处理算法的动态验证是图像处理算法开发过程中的关键.为了提高验证时效性,基于MPSOC和HLS设计了一种图像处理算法动态实时验证系统,利用HLS技术高效完成图像处理算法的硬件实现以实现图像处理算法硬件加速,同时基于LVDS设计了板间图像传输接口,通过FPGA级联为后续实现大型复杂图像处理算法的验证提供了充足的扩展空间.测试结果表明该图像处理算法验证系统可以较好支持图像算法验证,并对图像处理算法有良好的硬件加速效果,同时验证了LVDS板间传输接口满足后续验证系统扩展的带宽要求. 展开更多
关键词 mpsoc HLS 图像处理算法
在线阅读 下载PDF
基于MPSOC的航空图像目标检测系统设计 被引量:7
17
作者 任彬 王宇庆 +2 位作者 丛振 聂海涛 杨航 《液晶与显示》 CAS CSCD 北大核心 2021年第7期1006-1017,共12页
近年来,航空光学成像技术快速发展,机载图像处理系统对于目标检测精度和检测速度的要求越来越高,传统的目标检测算法已经无法满足要求。与此同时,基于深度学习的目标检测算法凭借更优的性能表现得到了学术界的广泛关注。但这类算法往往... 近年来,航空光学成像技术快速发展,机载图像处理系统对于目标检测精度和检测速度的要求越来越高,传统的目标检测算法已经无法满足要求。与此同时,基于深度学习的目标检测算法凭借更优的性能表现得到了学术界的广泛关注。但这类算法往往参数较多,时间复杂度高且移动端移植困难。针对上述问题,本文提出了一种基于Yolo V3算法的MPSOC平台实现方案。利用改进的k均值聚类算法获取新的初始锚框,之后通过改变特征图的大小提高算法对小目标的检测精度,通过基于敏感度的剪枝方法压缩算法大小,最后利用VISDRONE数据集在MPSOC平台进行了验证。实验结果表明改善的Yolo算法的MAP提高了1.3%,误检率也得到了极大降低。算法经过压缩后,检测速度提高了1倍,体积仅为原来的37%,基本满足了对航空图像目标检测的设计要求,同时为深度学习算法在MPSOC中实现提供了可行的解决方案。 展开更多
关键词 航空图像 目标检测 模型压缩 mpsoc
在线阅读 下载PDF
基于MPSoC的Sub-6 GHz频段SDR测试系统设计与实现 被引量:3
18
作者 黄继业 谢辉 董哲康 《实验室研究与探索》 CAS 北大核心 2022年第8期14-18,76,共6页
为实现5G高带宽信号的快速测试和复杂通信算法的快速验证,提出了一种基于MPSoC的Sub-6 GHz频段软件无线电(SDR)测试实验平台。平台采用Xilinx ZYNQ UltraScale~+MPSoC和射频收发器ADRV9009搭建,两者通过JESD204B高速串行接口进行数据流... 为实现5G高带宽信号的快速测试和复杂通信算法的快速验证,提出了一种基于MPSoC的Sub-6 GHz频段软件无线电(SDR)测试实验平台。平台采用Xilinx ZYNQ UltraScale~+MPSoC和射频收发器ADRV9009搭建,两者通过JESD204B高速串行接口进行数据流传输。采用软硬件协同设计思想,具备高可重构性和移植性,其中,硬件/PL逻辑部分负责射频信号到基带信号的转换与信号处理;软件部分依托Petalinux和Libiio的加持,可对测试系统进行全局控制。此外,该系统还拥有超宽调谐范围、可配置MIMO等优势,可作为5G SDR实验平台使用。经高带宽信号收发实验验证,该测试系统满足5G Sub-6 GHz信号收发链路要求,信道可靠性较高,在5G信号测试和算法原型验证方面,具有一定的应用价值。 展开更多
关键词 通信测试 单芯片集成多处理器片上系统 第五代移动通信技术 宽带收发器 软件无线电实验平台
在线阅读 下载PDF
基于MPSoC并行调度的矩阵乘法加速算法研究 被引量:4
19
作者 杨飞 马昱春 +1 位作者 侯金 徐宁 《计算机科学》 CSCD 北大核心 2017年第8期36-41,共6页
矩阵乘法是数值分析以及图形图像处理算法的基础,通用的矩阵乘法加速器设计一直是嵌入式系统设计的研究热点。但矩阵乘法由于计算复杂度高,处理效率低,常常成为嵌入式系统运算速度的瓶颈。为了在嵌入式领域更好地使用矩阵乘法,提出了基... 矩阵乘法是数值分析以及图形图像处理算法的基础,通用的矩阵乘法加速器设计一直是嵌入式系统设计的研究热点。但矩阵乘法由于计算复杂度高,处理效率低,常常成为嵌入式系统运算速度的瓶颈。为了在嵌入式领域更好地使用矩阵乘法,提出了基于MPSoC(MultiProcessor System-on-Chip)的软硬件协同加速的架构。在MPSoC的架构下,一方面,设计了面向硬件约束的矩阵分块方法,从而实现了通用的矩阵乘法加速器系统;另一方面,通过利用MPSoC下的多核架构,提出了相应的任务划分和负载平衡调度算法,提高了并行效率和整体系统加速比。实验结果表明,所提架构及算法实现了通用的矩阵乘法计算,并且通过软硬件协同设计实现的多核并行调度算法与传统单核设计相比在计算效率方面得到了显著的提高。 展开更多
关键词 矩阵乘法 mpsoc 并行计算 负载平衡
在线阅读 下载PDF
PCI Express技术在嵌入式MPSoC中的应用
20
作者 尹亚明 刘秋丽 陈书明 《计算机工程与科学》 CSCD 北大核心 2013年第1期41-46,共6页
PCI Express作为第三代高性能I/O互连技术具有很多技术优势,如基于报文交换、点对点连接、LVDS高速串行互连、高带宽等。但是,PCI Express技术更多地应用于通用高性能计算机领域,鲜有将其应用于嵌入式系统设计中的实例。本文基于自行研... PCI Express作为第三代高性能I/O互连技术具有很多技术优势,如基于报文交换、点对点连接、LVDS高速串行互连、高带宽等。但是,PCI Express技术更多地应用于通用高性能计算机领域,鲜有将其应用于嵌入式系统设计中的实例。本文基于自行研制的一款嵌入式多核SoC系统YHFT-QDSP,根据系统设计需求,结合PCI Express技术特点,采用基于IP裁剪的快速设计方法将PCI Express技术应用于系统片间互连模块的设计中,缩短了设计周期并获得了良好的设计效果。采用0.13μm工艺单元库实现,PCI Express片间互连模块总面积为0.65mm2,其中协议转换模块面积为0.12mm2,片间数据传输有效带宽可达1.63Gb/s。 展开更多
关键词 多核片上系统 DSP PCI EXPRESS I O互连 嵌入式系统
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部