期刊文献+
共找到2,351篇文章
< 1 2 118 >
每页显示 20 50 100
Performance Prediction Based on Statistics of Sparse Matrix-Vector Multiplication on GPUs 被引量:1
1
作者 Ruixing Wang Tongxiang Gu Ming Li 《Journal of Computer and Communications》 2017年第6期65-83,共19页
As one of the most essential and important operations in linear algebra, the performance prediction of sparse matrix-vector multiplication (SpMV) on GPUs has got more and more attention in recent years. In 2012, Guo a... As one of the most essential and important operations in linear algebra, the performance prediction of sparse matrix-vector multiplication (SpMV) on GPUs has got more and more attention in recent years. In 2012, Guo and Wang put forward a new idea to predict the performance of SpMV on GPUs. However, they didn’t consider the matrix structure completely, so the execution time predicted by their model tends to be inaccurate for general sparse matrix. To address this problem, we proposed two new similar models, which take into account the structure of the matrices and make the performance prediction model more accurate. In addition, we predict the execution time of SpMV for CSR-V, CSR-S, ELL and JAD sparse matrix storage formats by the new models on the CUDA platform. Our experimental results show that the accuracy of prediction by our models is 1.69 times better than Guo and Wang’s model on average for most general matrices. 展开更多
关键词 SPARSE matrix-vector MULTIPLICATION Performance Prediction GPU Normal DISTRIBUTION UNIFORM DISTRIBUTION
暂未订购
A quantum algorithm for Toeplitz matrix-vector multiplication
2
作者 高尚 杨宇光 《Chinese Physics B》 SCIE EI CAS CSCD 2023年第10期248-253,共6页
Toeplitz matrix-vector multiplication is widely used in various fields,including optimal control,systolic finite field multipliers,multidimensional convolution,etc.In this paper,we first present a non-asymptotic quant... Toeplitz matrix-vector multiplication is widely used in various fields,including optimal control,systolic finite field multipliers,multidimensional convolution,etc.In this paper,we first present a non-asymptotic quantum algorithm for Toeplitz matrix-vector multiplication with time complexity O(κpolylogn),whereκand 2n are the condition number and the dimension of the circulant matrix extended from the Toeplitz matrix,respectively.For the case with an unknown generating function,we also give a corresponding non-asymptotic quantum version that eliminates the dependency on the L_(1)-normρof the displacement of the structured matrices.Due to the good use of the special properties of Toeplitz matrices,the proposed quantum algorithms are sufficiently accurate and efficient compared to the existing quantum algorithms under certain circumstances. 展开更多
关键词 quantum algorithm Toeplitz matrix-vector multiplication circulant matrix
原文传递
A small microring array that performs large complex-valued matrix-vector multiplication 被引量:10
3
作者 Junwei Cheng Yuhe Zhao +7 位作者 Wenkai Zhang Hailong Zhou Dongmei Huang Qing Zhu Yuhao Guo Bo Xu Jianji Dong Xinliang Zhang 《Frontiers of Optoelectronics》 EI CSCD 2022年第2期1-15,共15页
As an important computing operation,photonic matrix-vector multiplication is widely used in photonic neutral networks and signal processing.However,conventional incoherent matrix-vector multiplication focuses on real-... As an important computing operation,photonic matrix-vector multiplication is widely used in photonic neutral networks and signal processing.However,conventional incoherent matrix-vector multiplication focuses on real-valued operations,which cannot work well in complex-valued neural networks and discrete Fourier transform.In this paper,we propose a systematic solution to extend the matrix computation of microring arrays from the real-valued field to the complex-valued field,and from small-scale(i.e.,4×4)to large-scale matrix computation(i.e.,16×16).Combining matrix decomposition and matrix partition,our photonic complex matrix-vector multiplier chip can support arbitrary large-scale and complex-valued matrix computation.We further demonstrate Walsh-Hardmard transform,discrete cosine transform,discrete Fourier transform,and image convolutional processing.Our scheme provides a path towards breaking the limits of complex-valued computing accelerator in conventional incoherent optical architecture.More importantly,our results reveal that an integrated photonic platform is of huge potential for large-scale,complex-valued,artificial intelligence computing and signal processing. 展开更多
关键词 Photonic matrix-vector multiplication Complex-valued computing Microring array Signal/image processing
原文传递
swDaCe:一种申威众核处理器上以数据为中心的并行编程模型设计与实现
4
作者 沈沛祺 陈俊仕 安虹 《小型微型计算机系统》 北大核心 2026年第3期751-759,共9页
高性能科学计算是超级计算机的核心应用领域,包括粒子模拟、气候分析等关键任务.然而,随着摩尔定律逐渐失效,超级计算机体系结构日益趋向异构和复杂,导致科学计算应用的开发和优化变得更加困难.为解决这一问题,本文基于新一代申威超级... 高性能科学计算是超级计算机的核心应用领域,包括粒子模拟、气候分析等关键任务.然而,随着摩尔定律逐渐失效,超级计算机体系结构日益趋向异构和复杂,导致科学计算应用的开发和优化变得更加困难.为解决这一问题,本文基于新一代申威超级计算平台,提出并实现了一种以数据为中心的并行编程模型——swDaCe.该模型通过解耦数据流图优化与原始程序,使得编程人员可以使用Python描述计算逻辑,并最终生成适配申威众核架构的高性能C++代码.此外,本文提出了一系列针对申威架构的数据流优化方法,包括从核任务映射、向量化并行以及DMA访存优化,以充分利用申威众核处理器的计算能力.实验结果表明,swDaCe生成的代码在稀疏矩阵计算等典型应用中实现了显著的性能提升,单核组加速比达到25倍以上,验证了该框架在申威架构上的有效性. 展开更多
关键词 新一代神威平台 异构众核处理器 数据流编程 并行计算 稀疏矩阵乘
在线阅读 下载PDF
分布式矩阵-向量乘掉队节点编码新方案
5
作者 韦宝典 莫肇豪 马啸 《通信学报》 北大核心 2026年第2期168-178,共11页
编码分布式计算(CDC)是利用纠删码解决掉队节点问题的一种主流方案,但是现有相关工作忽略了掉队节点的计算性能,产生了较多额外编译码时间。针对此问题,基于阶束矩阵码(HBMC),提出固定码率阶束编码分布式计算(F-HB)以及无速率阶束编码... 编码分布式计算(CDC)是利用纠删码解决掉队节点问题的一种主流方案,但是现有相关工作忽略了掉队节点的计算性能,产生了较多额外编译码时间。针对此问题,基于阶束矩阵码(HBMC),提出固定码率阶束编码分布式计算(F-HB)以及无速率阶束编码分布式计算(R-HB)两类方案,其中,F-HB能够解决掉队节点问题,降低编译码时间;R-HB利用掉队节点完成计算。理论分析和实验仿真均证明了所提方案在解决掉队节点问题、降低额外编译码时间及提升计算效率方面的有效性。仿真结果表明,与未编码分布式计算(UDC)方案相比,所提两类方案任务时间分别减少68%与74%。基于HBMC的F-HB和R-HB方案通过降低编译码时间、利用掉队节点计算性能,显著缩短了分布式矩阵−向量乘计算系统的任务时间,为解决掉队节点问题提供了高效可行的新途径。 展开更多
关键词 分布式计算 矩阵−向量乘 阶束矩阵码 固定码率阶束编码分布式计算 无速率阶束编码分布式计算
在线阅读 下载PDF
BHDC:准对角阵高效SpMV的分块混合存储格式
6
作者 徐悦竹 赵泽煊 +1 位作者 邰宇浩 王宇华 《计算机应用与软件》 北大核心 2026年第2期118-126,共9页
利用科学计算解决工程领域的实际问题往往可以转化为大型线性方程组的求解,在这一过程中最常调用的步骤就是稀疏矩阵向量乘。对于工程中常见的稀疏准对角矩阵,提出结合DIA和CSR两种方式优点的分块混合存储方式BHDC,将原矩阵分成若干行段... 利用科学计算解决工程领域的实际问题往往可以转化为大型线性方程组的求解,在这一过程中最常调用的步骤就是稀疏矩阵向量乘。对于工程中常见的稀疏准对角矩阵,提出结合DIA和CSR两种方式优点的分块混合存储方式BHDC,将原矩阵分成若干行段,根据阈值将对角稠密区域和散点分别存储,既利用DIA存储方式下良好的浮点运算性能,又通过CSR存储方式避免对角线急剧增加而降低性能。在CUDA平台上选取若干稀疏矩阵进行测试,获得了优于上述两种存储方式的时空性能和优于不分块混合方式HDC的时间性能。 展开更多
关键词 准对角矩阵 稀疏矩阵向量乘 分块存储 CUDA
在线阅读 下载PDF
基于指令串行融合的RISC-V向量处理器计算方法
7
作者 李凯歌 高鑫 杨孟飞 《微电子学与计算机》 2026年第3期155-163,共9页
在传统冯诺依曼计算机架构中,卷积神经网络、矩阵计算与快速傅里叶变换等算法存在频繁的数据重用,导致向量处理器流水线中产生大量写后读指令,易引发数据冲突。同时,数据在向量寄存器和计算单元之间的反复传输带来了显著的功耗开销。针... 在传统冯诺依曼计算机架构中,卷积神经网络、矩阵计算与快速傅里叶变换等算法存在频繁的数据重用,导致向量处理器流水线中产生大量写后读指令,易引发数据冲突。同时,数据在向量寄存器和计算单元之间的反复传输带来了显著的功耗开销。针对上述问题,提出了一种面向向量计算的数据冲突解决机制。通过利用数据重用减少数据流动,从而降低计算芯片功耗。将该方法应用于RISC-V向量处理器的仿真实验表明:在128×128矩阵乘法计算时,整体芯片功耗降低约5.8%;在计算神经卷积网络算法时,功耗降低约6.2%。该方法具有轻量化的特点,所引入的面积开销可忽略不计。 展开更多
关键词 RISC-V 向量处理器 矩阵计算 能效
在线阅读 下载PDF
甘肃省BDS-3 PPP高等级控制网构建方法
8
作者 郑三君 马下平 +1 位作者 李祖锋 赵亮 《辽宁工程技术大学学报(自然科学版)》 北大核心 2026年第1期90-97,共8页
为解决全球卫星导航系统(GNSS)相对定位成本高、作业复杂的问题,基于北斗三号(BDS-3)观测数据,提出一种利用精密单点(PPP)定位结果及其方差-协方差信息构建虚拟基线向量,并通过布尔莎模型实现国际地球参考框架2020(ITRF2020)至2000中国... 为解决全球卫星导航系统(GNSS)相对定位成本高、作业复杂的问题,基于北斗三号(BDS-3)观测数据,提出一种利用精密单点(PPP)定位结果及其方差-协方差信息构建虚拟基线向量,并通过布尔莎模型实现国际地球参考框架2020(ITRF2020)至2000中国大地坐标系(CGCS2000)的坐标转换。研究结果表明:BDS-3 PPP观测4 h,E、N、U方向定位精度分别优于11.9 mm、11.8 mm、13.1 mm,满足GNSS大地控制网要求;观测72 h,E、N、U方向定位精度分别为3 mm、4 mm和7 mm;布尔莎模型转换精度与公共点同步观测时长显著相关,待转点与公共点同步观测时长一致时,E、N、U方向的转换精度分别为4.0 mm、2.1 mm、3.4 mm;虚拟基线向量在观测0.5 h、1 h后可分别达到GNSS大地控制网D级、C级精度要求,观测4 h后基线向量分量误差小于3 mm,相对中误差小于9.122 8×10^(-8),CGCS2000空间直角坐标分量误差小于2 mm,优于相对定位基线向量网24 h解算结果。研究结论为有效提升控制网建设效率提供参考。 展开更多
关键词 北斗三号全球卫星导航系统 精密单点定位 布尔莎模型 基线向量 方差-协方差矩阵
原文传递
*-Sylvester矩阵方程转换为广义Sylvester矩阵方程的方法
9
作者 汪秋分 马昌凤 《山东大学学报(理学版)》 北大核心 2026年第2期20-25,共6页
研究*-Sylvester矩阵方程AX+X^(*)B=D的等价转换形式。利用Kronecker积和向量化算子以及置换矩阵的基本性质,分离了矩阵的实部和虚部,在两种不同的情况下得到了*-Sylvester矩阵方程的等价转换形式,并证明了在满足一定条件下其可以等价... 研究*-Sylvester矩阵方程AX+X^(*)B=D的等价转换形式。利用Kronecker积和向量化算子以及置换矩阵的基本性质,分离了矩阵的实部和虚部,在两种不同的情况下得到了*-Sylvester矩阵方程的等价转换形式,并证明了在满足一定条件下其可以等价转换为广义Sylvester矩阵方程。 展开更多
关键词 *-Sylvester矩阵方程 广义Sylvester矩阵方程 KRONECKER积 向量化 等价转换
原文传递
基于OC-SVM-MF算法的水电机组运行状态异常诱因快速检测
10
作者 吴昊 刘轩 +3 位作者 雷俊雄 张之皓 邓文涛 聂靓靓 《水电站机电技术》 2026年第2期5-9,135,共6页
针对水电机组运行数据异常诱因定位效率低、依赖人工经验的问题,提出一种基于单类支持向量机(OCSVM)与矩阵分解(MF)的融合算法。该方法首先利用OC-SVM对机组时序运行数据进行无监督异常检测;在识别出异常时段后,再应用MF算法挖掘多源监... 针对水电机组运行数据异常诱因定位效率低、依赖人工经验的问题,提出一种基于单类支持向量机(OCSVM)与矩阵分解(MF)的融合算法。该方法首先利用OC-SVM对机组时序运行数据进行无监督异常检测;在识别出异常时段后,再应用MF算法挖掘多源监测数据中隐含的关联关系,快速推荐最相关的异常诱因测点。以某抽蓄机组下导摆度异常实例验证,该方法能准确捕捉异常事件,并从38个测点中有效推荐出8个关键关联测点,为现场排查指明方向,极大提升了故障诊断效率。结果表明,所提OC-SVM-MF算法为水电机组状态异常的高效、自动化溯源提供了新思路。 展开更多
关键词 水电机组 异常检测 诱因推荐 单类支持向量机 矩阵分解
在线阅读 下载PDF
基于偏振光谱成像技术的物体表面粗糙度检测方法应用探讨
11
作者 董三主 《天津科技》 2026年第2期56-59,共4页
为避免对物体表面进行粗糙度检测时易因操作失误导致检测结果异常的问题,提出基于偏振光谱成像技术的物体表面粗糙度检测方法。利用电矢量对Mach-Zehnder干涉仪光波的偏振态进行深入分析,以获取物体表面的偏振光谱图像;接着利用穆勒矩... 为避免对物体表面进行粗糙度检测时易因操作失误导致检测结果异常的问题,提出基于偏振光谱成像技术的物体表面粗糙度检测方法。利用电矢量对Mach-Zehnder干涉仪光波的偏振态进行深入分析,以获取物体表面的偏振光谱图像;接着利用穆勒矩阵定量分析光与表面相互作用后的去极化效应,建立偏振态与粗糙度之间的精确映射关系。测量结果的波动范围稳定在0.03 nm以内,显著优于其他两种主流视觉检测方法,验证了该方法在纳米级粗糙度检测方面的高精度与高稳定性,为超精密制造领域的表面质量控制提供了可靠的技术支持。 展开更多
关键词 偏振光谱成像 表面粗糙度 电矢量 光波偏振态 穆勒矩阵
在线阅读 下载PDF
基于缓存数据重用的稀疏矩阵向量乘序列优化
12
作者 徐传福 邱昊中 车永刚 《计算机研究与发展》 北大核心 2025年第6期1434-1442,共9页
稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可... 稀疏线性方程组求解等高性能计算应用常常涉及稀疏矩阵向量乘(SpMV)序列Ax,A2x,…,Asx的计算.上述SpMV序列操作又称为稀疏矩阵幂函数(matrix power kernel,MPK).由于MPK执行多次SpMV且稀疏矩阵保持不变,在缓存(cache)中重用稀疏矩阵,可避免每次执行SpMV均从主存加载A,从而缓解SpMV访存受限问题,提升MPK性能.但缓存数据重用会导致相邻SpMV操作之间的数据依赖,现有MPK优化多针对单次SpMV调用,或在实现数据重用时引入过多额外开销.提出了缓存感知的MPK(cache-awareMPK,Ca-MPK),基于稀疏矩阵的依赖图,设计了体系结构感知的递归划分方法,将依赖图划分为适合缓存大小的子图/子矩阵,通过构建分割子图解耦数据依赖,根据特定顺序在子矩阵上调度执行SpMV,实现缓存数据重用.测试结果表明,Ca-MPK相对于Intel OneMKL库和最新MPK实现,平均性能提升分别多达约1.57倍和1.40倍. 展开更多
关键词 稀疏矩阵向量乘 矩阵幂函数 缓存数据重用 数据依赖 稀疏线性方程组求解
在线阅读 下载PDF
基于多传感器数据融合的船舶三维精密测量技术研究
13
作者 李燕 王双亭 《舰船科学技术》 北大核心 2025年第23期179-183,共5页
为获取覆盖船舶各个区域的全面信息,研究多传感器组合的船舶精密测量技术。在船舶中部核心区域、船艏与船艉处,安装多个线性激光传感器,采集不同区域的船舶三维轮廓点云数据;依据坐标转换方式,组合多个线性激光传感器采集的船舶三维轮... 为获取覆盖船舶各个区域的全面信息,研究多传感器组合的船舶精密测量技术。在船舶中部核心区域、船艏与船艉处,安装多个线性激光传感器,采集不同区域的船舶三维轮廓点云数据;依据坐标转换方式,组合多个线性激光传感器采集的船舶三维轮廓点云数据,得到覆盖船舶各个区域的全面船舶三维数据;通过自适应无迹卡尔曼滤波融合估计器,估计坐标转换的旋转矩阵与平移向量,得到更为精准的全面船舶三维数据,通过提取并测量该三维数据中的特征点、线、面,完成船舶精密测量。实验证明:该技术可有效组合船舶三维轮廓点云数据,完成船舶精密测量;在不同温度下,该技术船舶精密测量的相对误差均较小,始终控制在±0.05%以内。 展开更多
关键词 多传感器 船舶精密测量 坐标转换 旋转矩阵 平移向量 卡尔曼滤波
在线阅读 下载PDF
面向复杂路面环境的SINS/LDV鲁棒标定算法
14
作者 韩勇强 李贞旭 +3 位作者 崔少君 孙恩顺 叶响 陈家斌 《中国惯性技术学报》 北大核心 2025年第11期1091-1100,共10页
针对激光多普勒测速仪(LDV)在积水、泥泞等复杂路面环境下易出现量测野值与测速失效,导致标定精度下降的问题,提出一种面向复杂路面环境的捷联惯性导航系统(SINS)/LDV鲁棒标定算法。首先,基于SINS与GNSS组合输出的导航信息及LDV速度信息... 针对激光多普勒测速仪(LDV)在积水、泥泞等复杂路面环境下易出现量测野值与测速失效,导致标定精度下降的问题,提出一种面向复杂路面环境的捷联惯性导航系统(SINS)/LDV鲁棒标定算法。首先,基于SINS与GNSS组合输出的导航信息及LDV速度信息,构造滑动窗口内的位移增量观测矢量,并采用指数加权移动平均方法提升抗噪能力,从而提高LDV比例因子的标定精度。然后,通过改进向量化K矩阵的鲁棒卡尔曼滤波算法有效降低观测矢量中噪声的影响,提升了安装误差角的标定精度。仿真和车载实验表明,在LDV测速失效时,所提算法仍能有效标定相关误差参数。基于标定结果的车载航位推算验证显示:与基于四元数的卡尔曼滤波及梯度下降四元数标定算法相比,所提算法的水平定位均方根误差(RMSE)分别降低18.18%和28.74%,高度定位RMSE分别降低22.68%和45.69%,总里程177 km的终点水平定位精度达到0.018%D,提升了复杂路面环境下算法的鲁棒性和标定精度。 展开更多
关键词 捷联惯导 激光多普勒测速仪 标定算法 向量化K矩阵滤波
在线阅读 下载PDF
矢网端口扩展技术中矩阵开关的设计与实现
15
作者 李静 任翔 +2 位作者 马帅帅 张凌峰 周鑫 《舰船电子工程》 2025年第6期202-206,共5页
射频矩阵开关是实现装备信号通道切换的关键设备,是影响整个系统稳定性和可靠性的直接因素,广泛应用于自动测试系统及测试仪器等领域。论文根据矢量网络分析仪端口扩展及自动化测试平台搭建目的实际要求,设计并实现了一种2×6固态... 射频矩阵开关是实现装备信号通道切换的关键设备,是影响整个系统稳定性和可靠性的直接因素,广泛应用于自动测试系统及测试仪器等领域。论文根据矢量网络分析仪端口扩展及自动化测试平台搭建目的实际要求,设计并实现了一种2×6固态射频矩阵开关,频率范围覆盖DC-18GHz。测试结果表明,该矩阵开关具有良好的幅度及相位一致性,损耗小,回损高,隔离度高,开关切换速度快,可靠性高,满足矢量网络分析仪端口扩展要求及系统集成等特点。 展开更多
关键词 矢量网络分析仪 矩阵开关 相位一致性 损耗
在线阅读 下载PDF
Cx43在软骨细胞和BMSCs中的通讯作用及其对MMP13分泌水平的影响
16
作者 薛俊杰 李婧瑜 +1 位作者 张莉 任超超 《口腔颌面修复学杂志》 2025年第4期253-261,共9页
目的:通过shRNA慢病毒转染靶向抑制Cx43基因及其表达,检测其对体外培养的软骨细胞(SW1353)中MMP13分泌水平的影响,并探讨软骨细胞(SW1353)与BMSCs之间通过Cx43进行细胞间通讯的可能机制。方法:构建MMP13基因的shRNA慢病毒载体,经293T细... 目的:通过shRNA慢病毒转染靶向抑制Cx43基因及其表达,检测其对体外培养的软骨细胞(SW1353)中MMP13分泌水平的影响,并探讨软骨细胞(SW1353)与BMSCs之间通过Cx43进行细胞间通讯的可能机制。方法:构建MMP13基因的shRNA慢病毒载体,经293T细胞包装后转染BMSCs,建立BMSCs的稳转细胞株;利用已转染Cx43基因shRNA慢病毒载体的软骨细胞(SW1353)建立稳转细胞株。RT-PCR检测筛选出抑制效率最高的细胞株,在transwell培养皿中对上述两种稳转细胞株进行细胞共培养实验。用ELISA检测法和Western-Blot检测软骨细胞(SW1353)中MMP13的蛋白表达水平。结果:1.成功构建MMP13基因的shRNA慢病毒载体,并筛选出MMP13-shRNA-3是转染效率最高的载体。2.BMSCs被MMP13-shRNA-3转染后行RT-PCR检测,结果显示:与对照组相比,实验组中抑制效率最高的是稳转细胞株BMSCs-sh-3-4,具有统计学意义(P<0.05)。3.细胞共培养后的ELISA检测结果显示实验组中软骨细胞(SW1353)的MMP13蛋白表达水平明显下降。4.细胞共培养后Western-Blot结果显示实验组中软骨细胞(SW1353)的MMP13蛋白表达水平显著下降,具有统计学意义(P<0.05)。结论:利用shRNA慢病毒转染抑制Cx43基因表达,可以降低软骨基质降解关键酶MMP13的基因转录水平和蛋白表达水平。软骨细胞(SW1353)与BMSCs之间可能通过Cx43进行细胞间通讯。 展开更多
关键词 骨关节炎 缝隙连接蛋白43 基质金属蛋白酶13 软骨细胞 慢病毒
暂未订购
面向不确定度的机床系统正交鲁棒设计方法
17
作者 韦进文 郭志俊 李东旭 《机电工程》 北大核心 2025年第4期780-788,共9页
针对数控机床加工中存在不确定度从而影响机床加工精度的问题,依据广义叉积(GCP)鲁棒定理所明确的“叉矩阵(CM)正交则积向量(PV)鲁棒性最强”,提出了一种新的机床控制系统鲁棒设计方法。首先,采用了牛顿法建立了机床的动力学模型,并利... 针对数控机床加工中存在不确定度从而影响机床加工精度的问题,依据广义叉积(GCP)鲁棒定理所明确的“叉矩阵(CM)正交则积向量(PV)鲁棒性最强”,提出了一种新的机床控制系统鲁棒设计方法。首先,采用了牛顿法建立了机床的动力学模型,并利用阶跃响应方法分析了不确定度对控制系统性能的影响;其次,详细阐述了GCP鲁棒定理,并将其应用于机床的控制系统设计,即用差分方程系数构造CM、输入输出序列构造PV,得到了系统的GCP形式;然后,在状态空间对系统进行了状态反馈设计,建立了满足CM正交条件的方程组,通过求解该正交方程组确定了控制器参数;最后,采用了蒙特卡洛法(MCM)仿真与加工实验,对该方法的有效性进行了验证。研究结果表明:采用该方法的正交鲁棒系统具有强鲁棒性,对比传统的极点配置系统和滑模控制系统,实验加工误差的期望值分别降低了40.4%和12.3%。该方法能有效抑制不确定度的影响,可为机床控制系统鲁棒设计提供参考。 展开更多
关键词 不确定度 广义叉积 叉矩阵 积向量 正交鲁棒设计 蒙特卡洛法 控制系统性能
在线阅读 下载PDF
基于欧式变换的矩形破片拦截靶点云拼接方法 被引量:1
18
作者 任杰 蒋海燕 姬建荣 《兵工学报》 北大核心 2025年第2期347-356,共10页
三维激光扫描技术可直接获取破片拦截靶板的高精度点云数据,从而识别提取破片对拦截靶形成的孔洞、凹坑等损伤特征,然而对于大规模靶板阵列,激光扫描仪在多个位置、角度所采集的靶板局部点云位置相互独立,难以反映靶板阵列整体结构,为... 三维激光扫描技术可直接获取破片拦截靶板的高精度点云数据,从而识别提取破片对拦截靶形成的孔洞、凹坑等损伤特征,然而对于大规模靶板阵列,激光扫描仪在多个位置、角度所采集的靶板局部点云位置相互独立,难以反映靶板阵列整体结构,为此提出一种基于欧式空间变换的矩形靶板阵列点云拼接方法。根据局部点云角点坐标及位置关系构建旋转矩阵与平移向量,通过多次旋转变换与平移变换实现多个局部点云的角度姿态调整,拼接为一个矩形破片拦截靶整体点云。与现场靶板阵列的尺寸相对比,拼接所得靶板整体点云的高度与长度的平均相对误差分别为2.035%、1.192%。所提方法填补了破片飞散分布测试技术领域靶板阵列激光点云拼接方法的研究空白,在此基础上未来可结合破片特征识别技术,进一步开展基于激光点云的战斗部破片场飞散分布三维重构方面的研究。 展开更多
关键词 破片分布测试 点云数据处理 欧式空间变换 旋转矩阵 平移向量
在线阅读 下载PDF
基于稳健波束形成算法的压力容器泄漏检测方法
19
作者 徐承军 常远 张锐辉 《制造业自动化》 2025年第9期93-100,共8页
为解决在复杂条件下压力容器泄漏源位置的定位问题,提出了一种基于稳健自适应波束形成算法的压力容器泄漏检测方法。所提算法通过导向矢量优化结合重构协方差矩阵的方法实现波束形成,提高了波束形成的稳健性,具体通过构造信号子空间的... 为解决在复杂条件下压力容器泄漏源位置的定位问题,提出了一种基于稳健自适应波束形成算法的压力容器泄漏检测方法。所提算法通过导向矢量优化结合重构协方差矩阵的方法实现波束形成,提高了波束形成的稳健性,具体通过构造信号子空间的投影矩阵,对导向矢量进行投影修正,降低导向矢量带来的误差,得到更加准确的期望信号导向矢量,同时采用广义线性组合的方法重构协方差矩阵,从而实现稳健波束形成技术。通过数值仿真分析和实验验证了算法的检测定位效果,结果表明基于稳健波束形成算法可以准确定位气体泄漏源的位置,平均检测成功率在93%以上,最大定位误差小于0.03 m。相比于传统泄漏检测方法,在低采样率和低信噪比的噪声情况下,该方法具有更高的定位分辨能力和准确率,提高了压力容器泄漏检测的工程实用性。 展开更多
关键词 波束形成 压力容器 泄漏检测 导向矢量优化 协方差矩阵重构
在线阅读 下载PDF
面向SW26010-Pro众核处理器的新型矩阵存储格式及稀疏矩阵向量乘(SpMV)算法研究
20
作者 王萃 刘芳芳 +2 位作者 马文静 赵玉文 胡力娟 《计算机学报》 北大核心 2025年第6期1290-1304,共15页
稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵... 稀疏矩阵向量乘(Sparse Matrix-Vector Multiplication,SpMV)是高性能计算、人工智能大模型领域中的关键操作,其性能通常对应用程序整体性能的提升具有重要影响。高效的稀疏矩阵存储格式是影响SpMV性能的重要因素,然而,现有的稀疏矩阵存储格式主要通过压缩零元素以减少访存,未充分利用非零元素的数值规律,因此仍有进一步压缩和优化的空间。本文通过对压缩稀疏行(Compressed Sparse Row,CSR)存储格式中非零元数组内的重复元素进行进一步的压缩,提出了一种新型的稀疏矩阵存储格式(Further Compressed Sparse Row,FCSR),并设计了从CSR到FCSR格式转换的异构并行算法,以尽量减少格式转换带来的开销。同时,本文面向SW26010-Pro众核处理器,设计了基于FCSR存储格式的SpMV异构并行算法,对SpMV进行了细粒度的任务划分和并行优化设计,探究了五种向量x的间接访存方式,并通过双缓冲技术对算法进行了优化。最后,本文选用SuiteSparse矩阵集中的稀疏矩阵进行了测试,实验结果表明,本文提出的基于FCSR存储格式的异构众核SpMV算法相较于主核版SpMV算法具有明显的性能提升,最高加速比达到43.11,平均加速比为7.56,测试矩阵最高带宽利用率达到了91.13%,平均带宽利用率为26.27%。另外,本文对基于FCSR存储格式和CSR存储格式的SpMV算法性能进行了比较,在两者均得到充分优化的前提下,基于FCSR存储格式的SpMV算法相较于基于CSR存储格式的SpMV算法性能的平均加速比达到1.19。 展开更多
关键词 稀疏矩阵向量乘 SW26010-Pro众核处理器 新型矩阵存储格式 并行优化 双缓冲技术
在线阅读 下载PDF
上一页 1 2 118 下一页 到第
使用帮助 返回顶部