期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
Schedule refinement for homogeneous multi-core processors in the presence of manufacturing-caused heterogeneity
1
作者 Zhi-xiang CHEN Zhao-lin LI +2 位作者 Shan CAO Fang WANG Jie ZHOU 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2015年第12期1018-1033,共16页
Multi-core homogeneous processors have been widely used to deal with computation-intensive embedded applications. However, with the continuous down scaling of CMOS technology, within-die variations in the manufacturin... Multi-core homogeneous processors have been widely used to deal with computation-intensive embedded applications. However, with the continuous down scaling of CMOS technology, within-die variations in the manufacturing process lead to a significant spread in the operating speeds of cores within homogeneous multi-core processors. Task scheduling approaches, which do not consider such heterogeneity caused by within-die variations,can lead to an overly pessimistic result in terms of performance. To realize an optimal performance according to the actual maximum clock frequencies at which cores can run, we present a heterogeneity-aware schedule refining(HASR) scheme by fully exploiting the heterogeneities of homogeneous multi-core processors in embedded domains.We analyze and show how the actual maximum frequencies of cores are used to guide the scheduling. In the scheme,representative chip operating points are selected and the corresponding optimal schedules are generated as candidate schedules. During the booting of each chip, according to the actual maximum clock frequencies of cores, one of the candidate schedules is bound to the chip to maximize the performance. A set of applications are designed to evaluate the proposed scheme. Experimental results show that the proposed scheme can improve the performance by an average value of 22.2%, compared with the baseline schedule based on the worst case timing analysis. Compared with the conventional task scheduling approach based on the actual maximum clock frequencies, the proposed scheme also improves the performance by up to 12%. 展开更多
关键词 Schedule refining multi-core processor heterogenEITY Representative chip operating point
原文传递
异构环境下的多子阵合成孔径声呐精确后向投影快速成像方法 被引量:4
2
作者 钟何平 唐劲松 +2 位作者 马梦博 田振 吴浩然 《武汉大学学报(信息科学版)》 EI CAS CSCD 北大核心 2022年第3期405-411,共7页
针对多子阵合成孔径声呐精确后向投影成像算法效率低的问题,提出了一种异构环境下的精确多子阵合成孔径声呐后向投影成像快速方法。在分析精确逐点后向投影成像算法原理的基础上,将脉冲压缩和方位向聚焦过程改造为单指令多线程模式,借... 针对多子阵合成孔径声呐精确后向投影成像算法效率低的问题,提出了一种异构环境下的精确多子阵合成孔径声呐后向投影成像快速方法。在分析精确逐点后向投影成像算法原理的基础上,将脉冲压缩和方位向聚焦过程改造为单指令多线程模式,借助图形处理器(graphics processor unit,GPU)强大的多核计算能力加速成像过程。通过仿真和实测数据的成像实验验证了所提快速成像算法的正确性和高效性,与串行成像算法相比,其加速比分别高达326.3和333.6。对于大规模数据成像处理,所提方法体现出优异的加速性能,满足实时信号处理需求,同时为后续开展运动补偿奠定了基础。 展开更多
关键词 合成孔径声呐 后向投影算法 并行计算 图形处理器 异构环境
原文传递
异构多核图形处理器存储系统设计与实现 被引量:5
3
作者 肖灵芝 蒲林 +1 位作者 韩俊刚 李涛 《电子技术应用》 北大核心 2013年第5期38-40,43,共4页
提出了异构多核图形处理器(HMGPU)存储管理系统的硬件实现方法,采用固定分区与分页式分区两种方式分别对大片连续数据与小片非连续数据进行管理,使用Verilog语言进行硬件设计和仿真,并在FPGA开发板上进行了验证。实验结果表明,该系统为H... 提出了异构多核图形处理器(HMGPU)存储管理系统的硬件实现方法,采用固定分区与分页式分区两种方式分别对大片连续数据与小片非连续数据进行管理,使用Verilog语言进行硬件设计和仿真,并在FPGA开发板上进行了验证。实验结果表明,该系统为HMGPU提供了2 021.2 MB/s的有效存储带宽。 展开更多
关键词 异构多核图形处理器 实时并行 硬件实现方法 存储管理系统
在线阅读 下载PDF
异构计算平台上列存储系统的并行连接优化策略 被引量:4
4
作者 丁祥武 陈金鑫 王梅 《计算机工程与应用》 CSCD 北大核心 2017年第5期73-80,共8页
GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进... GPU以及集成式的CPU-GPU架构凭借其强大的并行处理能力和可编程流水线方式,已经成为数据库领域的研究热点。为充分利用异构平台的并行计算能力,提升列存储系统的查询性能,在研究异构平台结构特性的基础上,首先提出了GPU多线程平台上进行连接的数据划分策略——ICMD(Improved CMD),利用GPU流处理器并行处理各个子空间上的连接,然后利用任务评估分配模型实现查询负载的动态分配,使得查询操作能在多核CPU、GPU上高效并行执行。同时利用片上全局同步机制、局部内存重用技术优化ICMD连接算法。最后采用SSB基准测试集测试,结果表明:Intel~?HD Graphics 4600平台上并行连接查询相比于CPU版本获得了35%的性能提升,较GPU查询引擎的Ocelot性能上提升了18%。 展开更多
关键词 多核中央处理器-图形处理器(CPU-GPU) 流处理器 异构编程 列存储 改进协调模块分布(ICMD) 任务动态评估分配
在线阅读 下载PDF
异构多核SoC可编程图形系统硬件设计 被引量:1
5
作者 周建伟 韩俊刚 +2 位作者 李涛 杜慧敏 焦继业 《电子技术应用》 北大核心 2014年第7期40-43,共4页
采用开源LEON3(basic version)处理器,运行Linux操作系统,并驱动西安邮电大学自主设计研发的基于传统GPU架构的可编程图形处理器,实现了包含可编程图形系统的SoC平台。将系统集成到Dini Group最新的DNV6_F2PCIE开发板上,采取OpenGL编程... 采用开源LEON3(basic version)处理器,运行Linux操作系统,并驱动西安邮电大学自主设计研发的基于传统GPU架构的可编程图形处理器,实现了包含可编程图形系统的SoC平台。将系统集成到Dini Group最新的DNV6_F2PCIE开发板上,采取OpenGL编程,通过鼠标、键盘、显示器运行2D、3D程序,进行图形的绘制,从而比较充分地验证了图形系统硬件设计。 展开更多
关键词 图形处理器 LEON3处理器 异构多核 LINUX操作系统
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部