期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
A Quantitative Evaluation of Vector Transcendental Functions on ARMv8-Based Processors
1
作者 沈洁 龙标 黄春 《Journal of Computer Science & Technology》 SCIE EI CSCD 2023年第3期686-701,共16页
Transcendental functions are important functions in various high performance computing applications.Because these functions are time-consuming and the vector units on modern processors become wider and more scalable,t... Transcendental functions are important functions in various high performance computing applications.Because these functions are time-consuming and the vector units on modern processors become wider and more scalable,there is an increasing demand for developing and using vector transcendental functions in such performance-hungry applications.However,the performance of vector transcendental functions as well as their accuracy remain largely unexplored.To address this issue,we perform a comprehensive evaluation of two Single Instruction Multiple Data(SIMD)intrinsics based vector math libraries on two ARMv8 compatible processors.We first design dedicated microbenchmarks that help us understand the performance behavior of vector transcendental functions.Then,we propose a piecewise,quantitative evaluation method with a set of meaningful metrics to quantify their performance and accuracy.By analyzing the experimental results,we find that vector transcendental functions achieve good performance speedups thanks to the vectorization and algorithm optimization.Moreover,vector math libraries can replace scalar math libraries in many cases because of improved performance and satisfactory accuracy.Despite this,the implementations of vector math libraries are still immature,which means further optimization is needed,and our evaluation reveals feasible optimization solutions for future vector math libraries. 展开更多
关键词 transcendental function vector math library piecewise quantitative evaluation microbenchmarking armv8-based processor
原文传递
面向ARMv8 64位多核处理器的QGEMM设计与实现 被引量:3
2
作者 姜浩 杜琦 +4 位作者 郭敏 全哲 左克 王锋 杨灿群 《计算机学报》 EI CSCD 北大核心 2017年第9期2018-2029,共12页
该文在ARMv8 64位多核处理器上基于OpenBLAS首次设计、实现并优化了四精度矩阵乘法(Quadruple precision General Matrix-Matrix Multiplication,QGEMM).由于浮点计算中不可避免地引入舍入误差,双精度矩阵乘法(DGEMM)在某些情况下不能... 该文在ARMv8 64位多核处理器上基于OpenBLAS首次设计、实现并优化了四精度矩阵乘法(Quadruple precision General Matrix-Matrix Multiplication,QGEMM).由于浮点计算中不可避免地引入舍入误差,双精度矩阵乘法(DGEMM)在某些情况下不能给出令人满意的数值结果,因此需要高精度或多精度算法来实现更精确的计算.Double-double算术是一种较为有效和广泛使用的手段.文中采用double-double数据格式构建结构体存储四精度浮点数据;基于OpenBLAS中的稠密矩阵计算的分块算法,增加四精度数据格式的相关的头文件和源文件,并用汇编代码撰写文中所提出的QGEMM的核心内核;利用无误差变换技术,调整并优化内核中的算法流程,避免规格化操作步骤造成的数据强制依赖关系;通过分析算法的数据依赖关系,设计寄存器的分配和轮转策略,优化指令调度顺序,开发指令级并行性,提高QGEMM的实际性能.根据具体算法使用混合乘加指令(FMA)的程度不同,文中采用了算法理论峰值性能这一概念,其有别于机器理论峰值的概念,能更好地评估文中所提出的QGEMM的实际效率.数值实验表明:文中通过汇编代码实现并优化的QGEMM性能最高达到19.7Gflops,效率为在ARMv864位多核处理器平台上QGEMM算法理论峰值性能的82.1%,在满足数值结果精度要求的同时,其计算速度约是由C语言撰写的未优化的QGEMM和MBLAS中QGEMM的5.8倍,是编译器GCC实现的long double数据格式的QGEMM的24倍.同时数值实验还显示文中提出的QGEMM针对不同规模的矩阵具有较好的线程可扩展性. 展开更多
关键词 armv8 64位多核处理器 QGEMM 四精度 double—double数据格式 LONG double数据格式 OpenBLAS
在线阅读 下载PDF
面向ARMv8 64位多核处理器QTRSM的实现 被引量:1
3
作者 杜琦 姜浩 +2 位作者 李宽 彭林 杨灿群 《计算机工程与科学》 CSCD 北大核心 2017年第3期451-457,共7页
在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用double-double数据格式及其相应的四精度加... 在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用double-double数据格式及其相应的四精度加减法、乘法和除法。以long double数据类型QTRSM为测试基准,就不同矩阵规模下测试结果精度和时间与double-double数据格式QTRSM进行比较。实验结果表明:两者得到近似相同精度的数值结果,但double-double数据格式QTRSM的性能是long double数据类型QTRSM的1.6倍。随着线程数的增加,两种QTRSM实现的加速比接近2.0,具有较好的可扩展性。 展开更多
关键词 armv8 64位多核处理器 OpenBLAS 四精度 double-double数据格式 QTRSM
在线阅读 下载PDF
基于ARMv8平台的多维FFT实现与优化研究 被引量:10
4
作者 陈暾 李志豪 +1 位作者 贾海鹏 张云泉 《计算机学报》 EI CSCD 北大核心 2019年第11期2384-2402,共19页
FFT(快速傅里叶变换)是用于计算离散傅里叶变换(DFT)或其逆运算的快速算法,它广泛应用于工程、科学和数学计算.到目前为止,鲜有基于ARM平台的高性能FFT算法的实现和优化,然而,随着ARMv8处理器应用的日益广泛,研究FFT算法在ARM平台上高... FFT(快速傅里叶变换)是用于计算离散傅里叶变换(DFT)或其逆运算的快速算法,它广泛应用于工程、科学和数学计算.到目前为止,鲜有基于ARM平台的高性能FFT算法的实现和优化,然而,随着ARMv8处理器应用的日益广泛,研究FFT算法在ARM平台上高性能实现日益重要.该文在ARMv8平台上实现和优化了一个高性能的多维FFT算法库:PerfFFT,通过FFT蝶形网络优化、蝶形计算优化、蝶形自动生成、SIMD优化、内存对齐、cache-aware的分块算法和高效转置等优化方法的应用,显著提升了FFT算法的性能.实验结果表明,PerfFFT相比目前应用最为广泛的开源FFT库FFTW实现了10%~591%的性能提升,而相比ARM高性能商业库ARM Performance Library实现了13%~44%的性能提升. 展开更多
关键词 armv8 FFT算法 FFTW ARMPL SIMD优化 CACHE优化 矩阵分块
在线阅读 下载PDF
基于ARMv8处理器的高性能图像处理算法实现与优化研究 被引量:5
5
作者 韦存阳 贾海鹏 +3 位作者 张云泉 曲国远 魏大洲 张广婷 《计算机工程与科学》 CSCD 北大核心 2022年第10期1711-1720,共10页
色彩空间转换、图像缩放、图像滤波都是图像处理领域常见的算法,广泛应用于数字媒体、数据通信、生物医学和航空航天等领域。目前上述算法在ARM处理器上虽有开源的OpenCV库,但缺少与Intel IPP库精度相当的高性能图像处理库。为此,根据... 色彩空间转换、图像缩放、图像滤波都是图像处理领域常见的算法,广泛应用于数字媒体、数据通信、生物医学和航空航天等领域。目前上述算法在ARM处理器上虽有开源的OpenCV库,但缺少与Intel IPP库精度相当的高性能图像处理库。为此,根据算法的计算访存特征,将上述算法分为数据无关算法、数据共享算法及非规则访存算法3类,提出了不同类别算法在ARMv8计算平台上的优化方法体系,最终构建了一个基于ARMv8计算平台的高性能图像处理算法库,精度上对标Intel IPP库,并通过算法优化、访存优化、SIMD优化及汇编指令优化等一系列优化方法的应用,大幅提升了图像处理算法的性能。实验结果表明,在华为鲲鹏920计算平台上,重点优化的CvtColor、Filter和Resize模块性能较OpenCV算法库都有显著提升。 展开更多
关键词 armv8 色彩空间转换 图像插值 图像滤波
在线阅读 下载PDF
基于ARMv8架构gadget自动搜索框架 被引量:3
6
作者 赵利军 王震宇 +1 位作者 王奕森 庄宽 《计算机应用与软件》 CSCD 2016年第5期307-311,316,共6页
为了在ARM公司最新发布的首款支持64位处理器的ARMv8架构上实现ROP(Return_Oriented Programmig)技术,设计了ARMv8架构上的ROP gadget的自动搜索工具。通过结合ARMv8架构指令系统的特点,首先在库文件搜索出所有的以RET指令结尾的短指令... 为了在ARM公司最新发布的首款支持64位处理器的ARMv8架构上实现ROP(Return_Oriented Programmig)技术,设计了ARMv8架构上的ROP gadget的自动搜索工具。通过结合ARMv8架构指令系统的特点,首先在库文件搜索出所有的以RET指令结尾的短指令序列,并把这些指令序列存储在gadget库中,然后采用一些优化策略对该库进行优化,最后根据用户的输入在库中搜索到与用户输入功能相同的gadget链。通过对搜索工具搜索到的gadget的统计,结果表明gadget集具有图灵完整性,可以执行任意的操作。最后通过一个实例证明了ROP在ARMv8架构上的可行性。 展开更多
关键词 ROP 指令序列 自动搜索 armv8 图灵完整性
在线阅读 下载PDF
基于ARMv8架构的面向机器翻译的单精度浮点通用矩阵乘法优化 被引量:10
7
作者 龚鸣清 叶煌 +2 位作者 张鉴 卢兴敬 陈伟 《计算机应用》 CSCD 北大核心 2019年第6期1557-1562,共6页
针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指... 针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指令流水线和缓存未命中的发生概率;其次,针对三点导致计算效率受限的原因实现向量指令内联汇编、数据重排和数据预取三条优化技术;最后,根据语音方向的神经网络中常见的三种矩阵模式设计测试实验,实验中使用RK3399硬件平台运行程序。实验结果表示:方阵模式下单核计算速度为10.23 GFLOPS,达到实测浮点峰值的78.2%;在细长矩阵模式下单核计算速度为6.35 GFLOPS,达到实测浮点峰值的48.1%;在连续小矩阵模式下单核计算速度为2.53 GFLOPS,达到实测浮点峰值19.2%。将优化后的SGEMM算法部署到语音识别神经网络程序中,程序的实际语音识别速度取得了显著提高。 展开更多
关键词 armv8 单指令多数据流计算 基础线性代数子程序库 高性能计算
在线阅读 下载PDF
Effect of Bi_2O_3 Additive on the Microstructure and Dielectric Properties of BaTiO_3-Based Ceramics Sintered at Lower Temperature 被引量:1
8
作者 Shunhua Wu Xuesong Wei Xiaoyong Wang Hongxing Yang Shunqi Gao 《Journal of Materials Science & Technology》 SCIE EI CAS CSCD 2010年第5期472-476,共5页
High performance X8R dielectric ceramics were prepared by dopingBi2O3 to BaTiO3-based ceramics.The effect of small amounts(≤1.2 mol%) ofBi2O3 additive on the microstructure and dielectric properties of BaTiO3-based... High performance X8R dielectric ceramics were prepared by dopingBi2O3 to BaTiO3-based ceramics.The effect of small amounts(≤1.2 mol%) ofBi2O3 additive on the microstructure and dielectric properties of BaTiO3-based ceramics have been investigated.The Bi2O3 ,acting as a sintering additive,can effectively lower the sintering temperature of BaTiO3-based ceramics from 1300 to 1130 °C.The bulk density of BaTiO3-based ceramics increased and reached the maximum value with increasingBi2O3 content.The dielectric constant increased with increasingBi2O3 until it reached the maximum value with 0.8 mol%Bi2O3 additive,and the dielectric loss decreased with increasingBi2O3 content.Optimal dielectric properties of ε=2470,tanδ=0.011 and △ε/ε 25 ≤±9%(-55-150 °C) were obtained for the BaTiO3-based ceramics doped with 0.8 mol%Bi2O3 sintered at 1130 °C for 6 h. 展开更多
关键词 BaTiO3-based ceramics BI2O3 Dielectric properties X8R
原文传递
基于ARMv8架构ROP自动构造框架 被引量:1
9
作者 赵利军 彭城 《计算机应用与软件》 2017年第8期316-322,328,共8页
为了在ARM公司最新发布的首款支持64位处理器的ARMv8架构上实现ROP(Return_Oriented Programmig)技术,提高ROP攻击效力,设计了ARMv8架构上的ROP自动构造工具。首先对已有的ARM架构下gadget搜索工具进行扩展,使之支持ARMv8架构下可用指... 为了在ARM公司最新发布的首款支持64位处理器的ARMv8架构上实现ROP(Return_Oriented Programmig)技术,提高ROP攻击效力,设计了ARMv8架构上的ROP自动构造工具。首先对已有的ARM架构下gadget搜索工具进行扩展,使之支持ARMv8架构下可用指令序列的搜索,并把这些指令序列存储在gadget库中,其次采用优化策略对gadget库进行优化。然后利用语义等价性找出与shellcode语义相同的gadget链,并利用寄存器连通性解决语义断层和寄存器冲突等问题。最后完成gadget的自动串联形成具有特定行为的ROP链。通过利用ROP自动构造工具对网站"exploit.db"中大量的shellcode进行自动构造,证明了工具具有良好的攻击效力,增强了ROP攻击的实用性。 展开更多
关键词 ROP指令序列 armv8 寄存器连通性 语义断层 寄存器冲突
在线阅读 下载PDF
基于ARMv8架构的线性代数式检索结果并行集成模式
10
作者 吴丽娇 《宁夏师范学院学报》 2021年第1期79-84,共6页
为了提高线性代数式检索结果并行集成和调度能力,提出基于ARMv8架构的线性代数式检索结果并行集成模式.采用语义图模型分析方法进行特征提取和概念集融合,采用概念空间融合的方法,对线性代数式检索结果并行参数融合处理,采用语义图模型... 为了提高线性代数式检索结果并行集成和调度能力,提出基于ARMv8架构的线性代数式检索结果并行集成模式.采用语义图模型分析方法进行特征提取和概念集融合,采用概念空间融合的方法,对线性代数式检索结果并行参数融合处理,采用语义图模型分布式重组的方法,输出线性代数式检索结果,通过ARMv8架构并行集成线性代数式检索结果,仿真结果表明,采用该方法进行线性代数式检索结果并行集成的输出稳定性较高,查准率较高.提高对线性代数式检索结果的访问和资源优化调度能力. 展开更多
关键词 armv8架构 线性代数 检索结果 并行集成 访问
在线阅读 下载PDF
ARMv8 ROP shellcode复杂控制流构造
11
作者 赵利军 董莎莎 《计算机应用与软件》 北大核心 2019年第5期225-230,共6页
一个复杂的ROP shellcode从语义层面经常会用到循环和递归等控制流形式。条件跳转控制流gadget是循环和递归等控制结构的基础。然而ARMv7指令集中的间接条件跳转指令在ARMv8指令集中已经不再存在。ARMv8指令集中的条件跳转指令的目标地... 一个复杂的ROP shellcode从语义层面经常会用到循环和递归等控制流形式。条件跳转控制流gadget是循环和递归等控制结构的基础。然而ARMv7指令集中的间接条件跳转指令在ARMv8指令集中已经不再存在。ARMv8指令集中的条件跳转指令的目标地址的偏移已经被硬编码,不能被使用,所以ARMv8架构下只能通过无条件跳转gadget的重复使用实现循环和递归。这不仅执行效率低,而且浪费了大量的内存空间。基于上述问题,对ARMv7架构的条件跳转gadget进行了分析,提出一种ARMv8架构基于CMP指令和CSEL指令gadget构造条件跳转gadget方法。不仅解决了ARMv7架构基于间接条件跳转指令gadget构造ROP shellcode复杂控制流的方法在ARMv8架构中不再适用的问题,而且通过实验证明了与无条件跳转gadget方法相比,节省了大量的内存空间。 展开更多
关键词 ROP SHELLCODE armv8 控制流语义 CMP GADGET CSEL GADGET
在线阅读 下载PDF
ARMv8-A Return-Oriented Programming实现方法
12
作者 赵利军 李民 彭诚 《计算机应用与软件》 北大核心 2018年第11期253-258,313,共7页
ARMv8-A是ARM公司首款支持64位指令集的处理器架构,其引入一个全新的64位指令集A64。ARMv8-A与以往的ARM架构在指令集、指令编码、内部寄存器(功能定义、长度和个数)、函数调用规约、函数prologue和epilogue处理等诸多方面均存在很大的... ARMv8-A是ARM公司首款支持64位指令集的处理器架构,其引入一个全新的64位指令集A64。ARMv8-A与以往的ARM架构在指令集、指令编码、内部寄存器(功能定义、长度和个数)、函数调用规约、函数prologue和epilogue处理等诸多方面均存在很大的差异。在ARMv8-A处理器架构上,如何来实现返回导向编程ROP(Return-Oriented Programming)攻击以及是否具有图灵完整性等问题目前尚不明确。深入讨论ARMv8-A上实现ROP的基本单元的特性,给出其逻辑结构与分类方法,并给出实现ARMv8-A ROP的原理框架与方法。通过一个基于Linaro ARMv8 Linux实现的ARMv8 ROP攻击实例来验证提出的技术和方法。 展开更多
关键词 armv8 返回导向编程 指令序列 漏洞利用
在线阅读 下载PDF
Research on Vehicle Tracking Method Based on YOLOv8 and Adaptive Kalman Filtering: Integrating SVM Dynamic Selection and Error Feedback Mechanism
13
作者 Liping Zheng Hao Gou +1 位作者 Kaiwen Xiao Moran Qiu 《Open Journal of Applied Sciences》 2024年第12期3569-3588,共20页
Vehicle tracking plays a crucial role in intelligent transportation, autonomous driving, and video surveillance. However, challenges such as occlusion, multi-target interference, and nonlinear motion in dynamic scenar... Vehicle tracking plays a crucial role in intelligent transportation, autonomous driving, and video surveillance. However, challenges such as occlusion, multi-target interference, and nonlinear motion in dynamic scenarios make tracking accuracy and stability a focus of ongoing research. This paper proposes an integrated method combining YOLOv8 object detection with adaptive Kalman filtering. The approach employs a support vector machine (SVM) to dynamically select the optimal filter (including standard Kalman filter, extended Kalman filter, and unscented Kalman filter), enhancing the system’s adaptability to different motion patterns. Additionally, an error feedback mechanism is incorporated to dynamically adjust filter parameters, further improving responsiveness to sudden events. Experimental results on the KITTI and UA-DETRAC datasets demonstrate that the proposed method significantly improves detection accuracy (mAP@0.5 increased by approximately 3%), tracking accuracy (MOTA improved by 5%), and system robustness, providing an efficient solution for vehicle tracking in complex environments. 展开更多
关键词 Multi-Target Tracking YOLOv8-based Detection Adaptive Filtering Support Vector Machine Error Feedback Mechanism
在线阅读 下载PDF
基于嵌入式ARMv7的监测飞行器系统设计 被引量:1
14
作者 燕丽红 林志雄 王灏 《电子设计工程》 2014年第23期70-73,共4页
针对监测飞行器的智能化和小型化的要求,本系统采用物联网UP-CUP IOT A8-Ⅱ平台,详细介绍了基于嵌入式ARMv7的飞行器的模块化设计方案,包括采用德国原装进口LHI778探头的红外传感器等组成的信息采集模块,具有USB接口的WIFI无线网卡和2.4... 针对监测飞行器的智能化和小型化的要求,本系统采用物联网UP-CUP IOT A8-Ⅱ平台,详细介绍了基于嵌入式ARMv7的飞行器的模块化设计方案,包括采用德国原装进口LHI778探头的红外传感器等组成的信息采集模块,具有USB接口的WIFI无线网卡和2.4G的射频组成的无线通信模块及控制飞行器飞行姿态的飞行控制模块等,最后通过手持终端和PC终端进行了系统测试。结果表明整个系统设计合理,具有一定的工程应用价值。 展开更多
关键词 UP-CUP IOT A8-Ⅱ平台 嵌入式armv7 WIFI无线网卡 无线通信模块 飞行控制模块
在线阅读 下载PDF
基于NFS的Cortex-A8开发板自开发程序应用研究
15
作者 于博 《软件导刊》 2015年第4期118-120,共3页
Cortex-A8处理器是第一款基于ARMv7架构的应用处理器,是有史以来ARM开发的性能最高、最具功率效率的处理器。ARM Cortex-A8处理器是一款适用于复杂操作系统的应用处理器。基于NFS文件系统,对Cortex-A8开发板远程添加自开发程序应用进行... Cortex-A8处理器是第一款基于ARMv7架构的应用处理器,是有史以来ARM开发的性能最高、最具功率效率的处理器。ARM Cortex-A8处理器是一款适用于复杂操作系统的应用处理器。基于NFS文件系统,对Cortex-A8开发板远程添加自开发程序应用进行了研究。 展开更多
关键词 NFS Cortex-A8处理器 armv7架构 自开发程序
在线阅读 下载PDF
基于ARM V8平台的向量算法库实现与优化 被引量:8
16
作者 王晶 张云泉 梁军 《计算机工程》 CAS CSCD 北大核心 2019年第6期82-88,共7页
基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8... 基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8平台上的优化。实验结果表明,该方案在ARMV8计算平台上实现的向量算法库性能提升可达到10%~300%。 展开更多
关键词 数学函数库 armv8架构 向量算法库 单指令流多数据 访存优化
在线阅读 下载PDF
A New 3D Pb(Ⅱ) Coordination Polymer [Pb(L)]_n Based on a Long Flexible Octane-1,8-dicarboxylic Acid:Crystal Structure and Physical Properties
17
作者 韩倩 郭胜男 王秀艳 《Chinese Journal of Structural Chemistry》 SCIE CAS CSCD 2015年第11期1756-1760,共5页
A new Pb(II)-based coordination polymer, [Pb(L)]n (1), was hydrothermally synthesized and its structure was determined by single-crystal X-ray diffraction (H2L = octane- 1,8-dicarboxylic acid). Compound 1 crys... A new Pb(II)-based coordination polymer, [Pb(L)]n (1), was hydrothermally synthesized and its structure was determined by single-crystal X-ray diffraction (H2L = octane- 1,8-dicarboxylic acid). Compound 1 crystallizes in orthorhombic, space group Pnma with a = 32.061(4), b = 7.2597(8), c = 4.8084(5) A, V= 1119.2(2) A3, Z = 4, C10H1604Pb, Mr = 407.42, Dc = 2.418 g/cm3, F(000) = 760, μ(MoKa) = 15.066 mm-1, R = 0.0270 and wR = 0.0666. In 1, each Pb(II) cation is coordinated by six carboxylate oxygen atoms from four L2- anions. Each L2- anion bridges three Pb(ll) atoms in a μ3:η2:η1:η1 mode to form a 3D framework. The structure of 1 was characterized by IR spectrum and thermogravimetric analysis. Moreover, solid state luminescent property of 1 was also investigated. 展开更多
关键词 crystal structure Pb(Ⅱ)-based coordination polymer octane-1 8-dicarboxylic acid luminescent property
在线阅读 下载PDF
一种基于Q-learning强化学习的导向性处理器安全性模糊测试方案
18
作者 崔云凯 张伟 《北京信息科技大学学报(自然科学版)》 2024年第4期81-87,95,共8页
针对处理器安全性模糊测试在进行细粒度变异时遗传算法存在一定的盲目性,易使生成的测试用例触发相同类型漏洞的问题,提出了一种基于Q-learning强化学习的导向性处理器安全性模糊测试方案。通过测试用例的状态值和所触发的漏洞类型对应... 针对处理器安全性模糊测试在进行细粒度变异时遗传算法存在一定的盲目性,易使生成的测试用例触发相同类型漏洞的问题,提出了一种基于Q-learning强化学习的导向性处理器安全性模糊测试方案。通过测试用例的状态值和所触发的漏洞类型对应的权值构造奖励函数,使用强化学习指导生成具有针对性和导向性的测试用例,快速地触发不同类型的漏洞。在Hikey970平台上的实验验证了基于ARMv8的测试用例生成框架的有效性,并且相较于传统使用遗传算法作为反馈的策略,本文方案在相同时间内生成有效测试用例的的数量多19.15%,发现漏洞类型的数量多80.00%。 展开更多
关键词 处理器漏洞检测 模糊测试 Q-learning强化学习 armv8 分支预测类漏洞
在线阅读 下载PDF
Synthesis and luminescence properties of red-emitting M_2Si_5N_8:Eu^(2+)-based(M=Ca,Sr,Ba) phosphors by a simple nitrate reduction 被引量:4
19
作者 CHEN ChangCheng XIE ErQing 《Science China(Physics,Mechanics & Astronomy)》 SCIE EI CAS 2014年第3期433-436,共4页
M2SisN8:Eu2+-based (M=Ca, Sr, Ba) red-emitting phosphors are fabricated at relatively low temperature (1200℃) and atmos- pheric pressure using a simple solid-state reaction process. Several processing parameter... M2SisN8:Eu2+-based (M=Ca, Sr, Ba) red-emitting phosphors are fabricated at relatively low temperature (1200℃) and atmos- pheric pressure using a simple solid-state reaction process. Several processing parameters are systematically investigated to optimize the phosphors structural characterization and photoluminescence performance, including the amount of europium and the properties of the precursor materials. The as-prepared M2SisNs:Eu2+-based (M=Ca, Sr, Ba) phosphors are orange in color and are intensively emitted in the red region of 580-670 nm under 465 nm excitation. 展开更多
关键词 M2SisN8:Eu2+-based phosphors nitrate reduction LUMINESCENCE
原文传递
基于NEON并行计算架构的矩阵乘法加速技术
20
作者 祁俊雄 程岳 +3 位作者 刘作龙 韩伟 潘妍 李晨卉 《航空计算技术》 2024年第3期48-52,共5页
当今计算机的信号处理需求与日俱增。随着ARM体系结构的迅速发展,基于ARM架构的国产处理器迅速崛起,研究针对ARM平台的通用信号处理加速技术具有重要意义。通过分析ARMv8架构以及NEON并行计算技术,以FT-2000/4(ARMv8架构)为实验平台,研... 当今计算机的信号处理需求与日俱增。随着ARM体系结构的迅速发展,基于ARM架构的国产处理器迅速崛起,研究针对ARM平台的通用信号处理加速技术具有重要意义。通过分析ARMv8架构以及NEON并行计算技术,以FT-2000/4(ARMv8架构)为实验平台,研究典型DSP函数库在ARMv8架构上的优化加速。以矩阵运算为例,提出了基于NEON的通用矩阵乘法算法。实验结果表明所提算法在ARM架构上有显著的加速效果。为搭建针对ARM架构的全面且高效的通用信号处理库提供了技术支持。 展开更多
关键词 通用信号处理 armv8 FT-2000/4 NEON 矩阵乘法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部