-
题名多路光学图像处理硬件系统的设计与实现
- 1
-
-
作者
张华
沈龙龙
康忠海
-
机构
中国电子科技集团公司光电研究院
辽宁锦州
-
出处
《光电技术应用》
2025年第2期51-55,共5页
-
文摘
随着光学成像技术的发展,光学成像探测设备的分辨率和帧频越来越高,需要图像处理系统具有更强大的数据处理能力。设计了基于现场可编程门阵列(field programmable gate array,FPGA)、数字信号处理器(digital signal processor,DSP)、中央处理器(central processing unit,CPU)架构的多路光学图像处理硬件系统,实现了5路光学图像的采集、传输、处理和大容量存储,满足多路光学探测设备图像处理的要求。经实际应用验证,该系统工作稳定,运行效果良好。
-
关键词
FPGA
DSP
ft-2000
存储
-
Keywords
field programmable gate array(FPGA)
digital signal processor(DSP)
ft-2000
storage
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名面向FT-M7002平台点积算法的优化实现
被引量:2
- 2
-
-
作者
郭盼盼
陈梦雪
梁祖达
马晓畅
许邦建
-
机构
郑州大学计算机与人工智能学院
国家超级计算郑州中心(郑州大学)
湖南大学电气与信息工程学院
湖南大学信息科学与工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2022年第11期1909-1917,共9页
-
文摘
基于国产的FT-M7002平台高性能DSP,针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势,对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化。该研究充分挖掘了程序的向量并行性,有效地提升了数据传输的速度,提高了程序性能。实验结果表明,输入不同规模大小的数组,不同类型的点积算法在FT-M7002平台上优化后和优化前的平均性能比为12.4166~45.2338。相较于TI官网的dsplib库中不同类型的点积函数在TMS320C6678处理器上运行的性能,FT-M7002平台优化后的性能与TI平台的平均性能比为1.3716~4.5196。实验结果表明了该DSP平台相对于TI主流平台的计算性能优势。
-
关键词
ft-M7002
DSP
点积算法
向量
DMA双通道传输
SVR传输
-
Keywords
ft-M7002
digital signal processor(DSP)
dot product algorithm
vector
DMA dual channel transmission
SVR transmission
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于FT⁃2000/4的高速接入系统设计与实现
被引量:2
- 3
-
-
作者
高远
何赞园
邢留洋
-
机构
中国人民解放军战略支援部队信息工程大学
郑州大学
-
出处
《现代电子技术》
2022年第9期7-12,共6页
-
基金
国家自然科学基金资助项目(61801515)。
-
文摘
接入设备作为网络基础设施,广泛应用于通信系统的前端线路侧数据接收并转发至其他处理子系统。目前,大部分应用场景中的接入设备都选用国外高性能专用通信器件,无法满足自主可控的要求,给信息安全和网络安全带来了巨大隐患。针对上述问题,提出一种基于FT⁃2000/4国产处理器的高速接入系统设计,用于IP分组域数据的接入与分发。该系统从实际项目出发,遵循ATCA设备设计规范,符合数据中心和通信机房等场景的应用需求。同时,系统内的关键部件都选用国内厂商自主研制的芯片设计,完全达到自主可控的要求,有助于提升网络数据的安全性。实验在标准ATCA平台进行,通过Fabric数据通道测试系统的接入性能,测试结果表明,该系统的2个线路侧网络端口都能提供10GE的传输速率,满足当前大部分应用场景中高速接入的需求。
-
关键词
高速接入系统
自主可控
ft⁃2000/4处理器
数据接入
数据分发
系统测试
-
Keywords
high⁃speed access system
autonomous controllability
processor ft⁃2000/4
data access
data dissemination
system testing
-
分类号
TN871-34
[电子电信—信息与通信工程]
-
-
题名基于SPI全双工通信的ICNI健康管控系统
被引量:3
- 4
-
-
作者
刘维
-
机构
西南电子技术研究所
-
出处
《电子测量技术》
北大核心
2024年第19期34-43,共10页
-
文摘
无人机通信导航识别系统(ICNI)更高程度的综合化使得ICNI主控模块需完成基于多种总线通信的系统管控、数据转发等功能,对核心处理器的处理性能和接口资源有着更高要求。因此对模块中的健康管控系统提出了更轻量级的设计要求。本文在主控模块内采用CPU+MCU分布式架构设计了一种全国产化的基于CAN总线的健康管理系统。由FT-2000/4作为核心处理器,MCU作为协处理器实现CAN总线接口单元,二者通过SPI全双工通信完成CAN总线应用层数据交互,实现CPU对系统内各模块/单元的状态查询、命令下发,从而实现系统的健康管理。该系统可实时监测系统内各模健康状态,电路设计仅占用核心处理器SPI和GPIO接口,不占用其他接口资源和可编程逻辑(FPGA)资源,硬件设计简单,减轻电路布局和结构设计压力。健康管理部分电路器件成本较业内其他典型设计降低至少60%,符合低成本需求。
-
关键词
健康管理单元
ft-2000/4处理器
SPI通信
CAN总线
ICNI主控模块
-
Keywords
health management unit
ft-2000/4 processor
SPI communication
CAN bus
ICNI main control module
-
分类号
TN971
[电子电信—信号与信息处理]
-
-
题名基于GCC实现飞腾处理器向量处理单元的编译器后端
被引量:3
- 5
-
-
作者
李春江
杜云飞
倪晓强
王永文
杨灿群
-
机构
国防科学技术大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第12期19-22,共4页
-
基金
国家自然科学基金项目:多核多线程处理器SIMD扩展的编程模型和编译优化关键技术研究(61170046)
国家863计划项目:面向国产飞腾处理器的并行程序综合优化技术与系统(2012AA010903)资助
-
文摘
编译器后端是针对特定目标机器的编译器实现,不同的指令集体系结构需要实现不同的编译器后端。面向飞腾处理器中向量处理单元(FT-VPU)的体系结构和指令集,基于GCC编译器实现了编译器后端,使GCC能够正确编译面向FT-VPU的SIMD指令的内嵌函数。从四路双精度SIMD指令的机器描述出发,总结了在GCC后端所做的实现工作。其对基于GCC编译器实现面向特定目标机器的编译器后端有较大的参考价值。
-
关键词
飞腾处理器
向量处理单元
GCC
编译器后端
-
Keywords
ft processor, Vector processing unit, GCC, Compiler backend
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名飞腾1500A处理器性能分析工具Likwid研究
被引量:4
- 6
-
-
作者
彭林
方建滨
杜琦
唐滔
黄春
杨灿群
-
机构
国防科技大学计算机学院
国防科技大学并行与分布处理国家重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2018年第7期1147-1154,共8页
-
基金
国家重点研发计划(2017YFB0202004)
国家自然科学基金(61602501)
-
文摘
在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500A处理器的拓扑结构及相关概要信息;编写内核驱动模块使能飞腾1500A处理器的性能监控单元,指定事件类型,通过对应硬件计数器记录目标程序执行过程中事件发生的次数;结合简单代码和模板化的微基准测试程序,使用性能分析工具收集程序执行过程中相关数据,进行性能分析。
-
关键词
飞腾1500A处理器
性能分析工具
PMU
-
Keywords
ft-1500A processor
performance analysis tool
PMU
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名Canny边缘检测算法在飞腾平台上的实现与优化
被引量:7
- 7
-
-
作者
郭恒亮
柴晓楠
韩林
赫晓慧
商建东
-
机构
郑州大学河南省超级计算中心
郑州大学信息工程学院
郑州大学地球科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第7期37-43,共7页
-
基金
国家重点研发计划(2018YFB0505000)。
-
文摘
为实现国产飞腾DSP平台对底层图像库的支持,针对原始Canny边缘检测算法计算时间过长的问题,设计一种面向FT-M7002平台的Canny梯度计算并行算法。基于FT-M7002高性能处理架构,采用单指令流多数据流向量化方式增强DSP内核指令的并行处理能力,根据FT-M7002平台向量存储器的层次结构特征,分析Canny梯度计算并行算法的访存模式,通过首地址偏移取址解决不连续访存问题,并结合双缓冲方式完成数据传输与数据计算。实验结果表明,在与原始Canny算法具有相同检测精度的情况下,该算法在卷积核大小为3×3、5×5、7×7时整体运行速度提升了1.490~2.112倍,缩小了与主流加速器件在数字图像处理领域的性能差距。
-
关键词
ft-M7002处理器
CANNY边缘检测
梯度计算并行
访存优化
双缓冲方式
-
Keywords
ft-M7002 processor
Canny edge detection
parallel gradient computing
memory access optimization
double buffering mode
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于硬件锁的多线程同步设计和实现
被引量:1
- 8
-
-
作者
李春江
唐滔
杨灿群
-
机构
国防科学技术大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第9期35-37,60,共4页
-
基金
国家自然科学基金项目(61170046
61170045)
国家863计划项目(2012AA010903)资助
-
文摘
硬件锁用简单的取数指令实现"取并加一"或"取并减一"的原子操作。首先介绍了通用多核多线程FT处理器实现的硬件锁机制,并和软件锁机制进行了比较,之后介绍了使用硬件锁机制实现多线程同步的方法,然后在GNU OpenMP运行库中设计并实现了利用硬件锁的多线程同步机制,最后采用典型OpenMP测试程序对使用硬件锁和使用软件锁的同步操作性能进行了评估和分析。
-
关键词
硬件锁
同步
ft处理器
GNU
OpenMP运行库
-
Keywords
Hardware locks, Synchronization, ft processor, GNU OpenMP runtimes
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于可变步长的访存延迟测量模型的研究与实现
- 9
-
-
作者
毛席龙
杨安
吕高锋
林琦
程辉
-
机构
国防科学技术大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2014年第1期12-18,共7页
-
基金
国家973计划资助项目(2009CB320503)
-
文摘
评测访存延迟对于优化应用访存模式和数据放置有重要的指导意义,然而数据Cache、多线程、数据预取等技术却严重干扰了访存延迟测量的精度。设计并实现了基于可变步长的访存延迟测量模型,在一块空间内根据用户指定的步长创建访问序列环,循环访问这个序列得出平均时间,即为访存延迟。最后对Intel的通用处理器和飞腾处理器在不同数据大小、步长、线程数等情况下的访存延迟进行了测量比较,该模型能够显示存储层次并精确显示测量延迟。
-
关键词
内存延迟
可变步长
测量方法
SMT
多核处理器
飞腾处理器
-
Keywords
Memory latency variable stride measurement SMT multi-core processor ft processor
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名基于飞腾处理器的瘦客户机散热结构设计
被引量:2
- 10
-
-
作者
李红
李俊
龚国辉
-
机构
湖南长城银河科技有限公司
-
出处
《计算机工程与科学》
CSCD
北大核心
2018年第10期1726-1730,共5页
-
文摘
基于目前国产处理器的瘦客户机整机功耗相对较高,利用常用的无风扇散热的被动散热方式在整机散热性能方面稍显不足,尤其是存在散热死区,从而设计了一种基于飞腾四核处理器的瘦客户机。该瘦客户机采用双散热模组设计,采用4个进风道和2个出风道设计,使得机体内部无散热死区,实现整机超强的散热性能。温度测试数据表明:在25℃环境中,机器满负荷工况运行时,机体内各测试点的温度均在52℃以内,满足所有元器件的工作温度要求;同时,机器箱体外表面温度低于36℃,用户体验感良好。
-
关键词
瘦客户机
飞腾处理器
散热结构
散热模组
风道
-
Keywords
thin client computer
ft processor
heat dispersion structure
thermal module
air passage
-
分类号
TK121
[动力工程及工程热物理—工程热物理]
-
-
题名基于飞腾处理器的国产软硬件平台视频硬解码技术研究
被引量:2
- 11
-
-
作者
赵会良
-
机构
江苏自动化研究所
-
出处
《自动化应用》
2023年第22期227-228,共2页
-
基金
国防基础科研计划资助(JCKY2020206B068)。
-
文摘
为推广和提升国产软硬件平台的视频解码技术,本文基于飞腾处理器、JM7200GPU、银河麒麟系统的国产软硬件平台研究分析了视频解码技术。实验结果表明,与纯软件的解码方式相比,使用JM7200进行视频硬解码可有效降低CPU占用率。
-
关键词
JM7200
银河麒麟系统
硬解码
飞腾处理器
-
Keywords
JM7200
Kylin OS
hard decoding
ft processor
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-