期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
多路光学图像处理硬件系统的设计与实现
1
作者 张华 沈龙龙 康忠海 《光电技术应用》 2025年第2期51-55,共5页
随着光学成像技术的发展,光学成像探测设备的分辨率和帧频越来越高,需要图像处理系统具有更强大的数据处理能力。设计了基于现场可编程门阵列(field programmable gate array,FPGA)、数字信号处理器(digital signal processor,DSP)、中... 随着光学成像技术的发展,光学成像探测设备的分辨率和帧频越来越高,需要图像处理系统具有更强大的数据处理能力。设计了基于现场可编程门阵列(field programmable gate array,FPGA)、数字信号处理器(digital signal processor,DSP)、中央处理器(central processing unit,CPU)架构的多路光学图像处理硬件系统,实现了5路光学图像的采集、传输、处理和大容量存储,满足多路光学探测设备图像处理的要求。经实际应用验证,该系统工作稳定,运行效果良好。 展开更多
关键词 FPGA DSP ft-2000 存储
在线阅读 下载PDF
面向FT-M7002平台点积算法的优化实现 被引量:2
2
作者 郭盼盼 陈梦雪 +2 位作者 梁祖达 马晓畅 许邦建 《计算机工程与科学》 CSCD 北大核心 2022年第11期1909-1917,共9页
基于国产的FT-M7002平台高性能DSP,针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势,对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化。该研究充分挖掘了... 基于国产的FT-M7002平台高性能DSP,针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势,对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化。该研究充分挖掘了程序的向量并行性,有效地提升了数据传输的速度,提高了程序性能。实验结果表明,输入不同规模大小的数组,不同类型的点积算法在FT-M7002平台上优化后和优化前的平均性能比为12.4166~45.2338。相较于TI官网的dsplib库中不同类型的点积函数在TMS320C6678处理器上运行的性能,FT-M7002平台优化后的性能与TI平台的平均性能比为1.3716~4.5196。实验结果表明了该DSP平台相对于TI主流平台的计算性能优势。 展开更多
关键词 ft-M7002 DSP 点积算法 向量 DMA双通道传输 SVR传输
在线阅读 下载PDF
基于FT⁃2000/4的高速接入系统设计与实现 被引量:2
3
作者 高远 何赞园 邢留洋 《现代电子技术》 2022年第9期7-12,共6页
接入设备作为网络基础设施,广泛应用于通信系统的前端线路侧数据接收并转发至其他处理子系统。目前,大部分应用场景中的接入设备都选用国外高性能专用通信器件,无法满足自主可控的要求,给信息安全和网络安全带来了巨大隐患。针对上述问... 接入设备作为网络基础设施,广泛应用于通信系统的前端线路侧数据接收并转发至其他处理子系统。目前,大部分应用场景中的接入设备都选用国外高性能专用通信器件,无法满足自主可控的要求,给信息安全和网络安全带来了巨大隐患。针对上述问题,提出一种基于FT⁃2000/4国产处理器的高速接入系统设计,用于IP分组域数据的接入与分发。该系统从实际项目出发,遵循ATCA设备设计规范,符合数据中心和通信机房等场景的应用需求。同时,系统内的关键部件都选用国内厂商自主研制的芯片设计,完全达到自主可控的要求,有助于提升网络数据的安全性。实验在标准ATCA平台进行,通过Fabric数据通道测试系统的接入性能,测试结果表明,该系统的2个线路侧网络端口都能提供10GE的传输速率,满足当前大部分应用场景中高速接入的需求。 展开更多
关键词 高速接入系统 自主可控 ft⁃2000/4处理器 数据接入 数据分发 系统测试
在线阅读 下载PDF
基于SPI全双工通信的ICNI健康管控系统 被引量:3
4
作者 刘维 《电子测量技术》 北大核心 2024年第19期34-43,共10页
无人机通信导航识别系统(ICNI)更高程度的综合化使得ICNI主控模块需完成基于多种总线通信的系统管控、数据转发等功能,对核心处理器的处理性能和接口资源有着更高要求。因此对模块中的健康管控系统提出了更轻量级的设计要求。本文在主... 无人机通信导航识别系统(ICNI)更高程度的综合化使得ICNI主控模块需完成基于多种总线通信的系统管控、数据转发等功能,对核心处理器的处理性能和接口资源有着更高要求。因此对模块中的健康管控系统提出了更轻量级的设计要求。本文在主控模块内采用CPU+MCU分布式架构设计了一种全国产化的基于CAN总线的健康管理系统。由FT-2000/4作为核心处理器,MCU作为协处理器实现CAN总线接口单元,二者通过SPI全双工通信完成CAN总线应用层数据交互,实现CPU对系统内各模块/单元的状态查询、命令下发,从而实现系统的健康管理。该系统可实时监测系统内各模健康状态,电路设计仅占用核心处理器SPI和GPIO接口,不占用其他接口资源和可编程逻辑(FPGA)资源,硬件设计简单,减轻电路布局和结构设计压力。健康管理部分电路器件成本较业内其他典型设计降低至少60%,符合低成本需求。 展开更多
关键词 健康管理单元 ft-2000/4处理器 SPI通信 CAN总线 ICNI主控模块
原文传递
基于GCC实现飞腾处理器向量处理单元的编译器后端 被引量:3
5
作者 李春江 杜云飞 +2 位作者 倪晓强 王永文 杨灿群 《计算机科学》 CSCD 北大核心 2013年第12期19-22,共4页
编译器后端是针对特定目标机器的编译器实现,不同的指令集体系结构需要实现不同的编译器后端。面向飞腾处理器中向量处理单元(FT-VPU)的体系结构和指令集,基于GCC编译器实现了编译器后端,使GCC能够正确编译面向FT-VPU的SIMD指令的内嵌... 编译器后端是针对特定目标机器的编译器实现,不同的指令集体系结构需要实现不同的编译器后端。面向飞腾处理器中向量处理单元(FT-VPU)的体系结构和指令集,基于GCC编译器实现了编译器后端,使GCC能够正确编译面向FT-VPU的SIMD指令的内嵌函数。从四路双精度SIMD指令的机器描述出发,总结了在GCC后端所做的实现工作。其对基于GCC编译器实现面向特定目标机器的编译器后端有较大的参考价值。 展开更多
关键词 飞腾处理器 向量处理单元 GCC 编译器后端
在线阅读 下载PDF
飞腾1500A处理器性能分析工具Likwid研究 被引量:4
6
作者 彭林 方建滨 +3 位作者 杜琦 唐滔 黄春 杨灿群 《计算机工程与科学》 CSCD 北大核心 2018年第7期1147-1154,共8页
在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500... 在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500A处理器的拓扑结构及相关概要信息;编写内核驱动模块使能飞腾1500A处理器的性能监控单元,指定事件类型,通过对应硬件计数器记录目标程序执行过程中事件发生的次数;结合简单代码和模板化的微基准测试程序,使用性能分析工具收集程序执行过程中相关数据,进行性能分析。 展开更多
关键词 飞腾1500A处理器 性能分析工具 PMU
在线阅读 下载PDF
Canny边缘检测算法在飞腾平台上的实现与优化 被引量:7
7
作者 郭恒亮 柴晓楠 +2 位作者 韩林 赫晓慧 商建东 《计算机工程》 CAS CSCD 北大核心 2021年第7期37-43,共7页
为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能... 为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能力,根据FT-M7002平台向量存储器的层次结构特征,分析Canny梯度计算并行算法的访存模式,通过首地址偏移取址解决不连续访存问题,并结合双缓冲方式完成数据传输与数据计算。实验结果表明,在与原始Canny算法具有相同检测精度的情况下,该算法在卷积核大小为3×3、5×5、7×7时整体运行速度提升了1.490~2.112倍,缩小了与主流加速器件在数字图像处理领域的性能差距。 展开更多
关键词 ft-M7002处理器 CANNY边缘检测 梯度计算并行 访存优化 双缓冲方式
在线阅读 下载PDF
基于硬件锁的多线程同步设计和实现 被引量:1
8
作者 李春江 唐滔 杨灿群 《计算机科学》 CSCD 北大核心 2013年第9期35-37,60,共4页
硬件锁用简单的取数指令实现"取并加一"或"取并减一"的原子操作。首先介绍了通用多核多线程FT处理器实现的硬件锁机制,并和软件锁机制进行了比较,之后介绍了使用硬件锁机制实现多线程同步的方法,然后在GNU OpenMP... 硬件锁用简单的取数指令实现"取并加一"或"取并减一"的原子操作。首先介绍了通用多核多线程FT处理器实现的硬件锁机制,并和软件锁机制进行了比较,之后介绍了使用硬件锁机制实现多线程同步的方法,然后在GNU OpenMP运行库中设计并实现了利用硬件锁的多线程同步机制,最后采用典型OpenMP测试程序对使用硬件锁和使用软件锁的同步操作性能进行了评估和分析。 展开更多
关键词 硬件锁 同步 ft处理器 GNU OpenMP运行库
在线阅读 下载PDF
基于可变步长的访存延迟测量模型的研究与实现
9
作者 毛席龙 杨安 +2 位作者 吕高锋 林琦 程辉 《计算机工程与科学》 CSCD 北大核心 2014年第1期12-18,共7页
评测访存延迟对于优化应用访存模式和数据放置有重要的指导意义,然而数据Cache、多线程、数据预取等技术却严重干扰了访存延迟测量的精度。设计并实现了基于可变步长的访存延迟测量模型,在一块空间内根据用户指定的步长创建访问序列环,... 评测访存延迟对于优化应用访存模式和数据放置有重要的指导意义,然而数据Cache、多线程、数据预取等技术却严重干扰了访存延迟测量的精度。设计并实现了基于可变步长的访存延迟测量模型,在一块空间内根据用户指定的步长创建访问序列环,循环访问这个序列得出平均时间,即为访存延迟。最后对Intel的通用处理器和飞腾处理器在不同数据大小、步长、线程数等情况下的访存延迟进行了测量比较,该模型能够显示存储层次并精确显示测量延迟。 展开更多
关键词 内存延迟 可变步长 测量方法 SMT 多核处理器 飞腾处理器
在线阅读 下载PDF
基于飞腾处理器的瘦客户机散热结构设计 被引量:2
10
作者 李红 李俊 龚国辉 《计算机工程与科学》 CSCD 北大核心 2018年第10期1726-1730,共5页
基于目前国产处理器的瘦客户机整机功耗相对较高,利用常用的无风扇散热的被动散热方式在整机散热性能方面稍显不足,尤其是存在散热死区,从而设计了一种基于飞腾四核处理器的瘦客户机。该瘦客户机采用双散热模组设计,采用4个进风道和2个... 基于目前国产处理器的瘦客户机整机功耗相对较高,利用常用的无风扇散热的被动散热方式在整机散热性能方面稍显不足,尤其是存在散热死区,从而设计了一种基于飞腾四核处理器的瘦客户机。该瘦客户机采用双散热模组设计,采用4个进风道和2个出风道设计,使得机体内部无散热死区,实现整机超强的散热性能。温度测试数据表明:在25℃环境中,机器满负荷工况运行时,机体内各测试点的温度均在52℃以内,满足所有元器件的工作温度要求;同时,机器箱体外表面温度低于36℃,用户体验感良好。 展开更多
关键词 瘦客户机 飞腾处理器 散热结构 散热模组 风道
在线阅读 下载PDF
基于飞腾处理器的国产软硬件平台视频硬解码技术研究 被引量:2
11
作者 赵会良 《自动化应用》 2023年第22期227-228,共2页
为推广和提升国产软硬件平台的视频解码技术,本文基于飞腾处理器、JM7200GPU、银河麒麟系统的国产软硬件平台研究分析了视频解码技术。实验结果表明,与纯软件的解码方式相比,使用JM7200进行视频硬解码可有效降低CPU占用率。
关键词 JM7200 银河麒麟系统 硬解码 飞腾处理器
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部