期刊文献+
共找到583篇文章
< 1 2 30 >
每页显示 20 50 100
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:7
1
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
在线阅读 下载PDF
Automatic Segmentation Method for Cone-Beam Computed Tomography Image of the Bone Graft Region within Maxillary Sinus Based on the Atrous Spatial Pyramid Convolution Network 被引量:1
2
作者 XU Jiangchang HE Shamin +2 位作者 YU Dedong WU Yiqun CHEN Xiaojun 《Journal of Shanghai Jiaotong university(Science)》 EI 2021年第3期298-305,共8页
Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the B... Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the BG region from cone-beam computed tomography(CBCT)images is connected to the margin of the maxillary sinus,and its boundary is blurred.Common segmentation methods are usually performed manually by experienced doctors,and are complicated by challenges such as low efficiency and low precision.In this study,an auto-segmentation approach was applied to the BG region within the maxillary sinus based on an atrous spatial pyramid convolution(ASPC)network.The ASPC module was adopted using residual connections to compose multiple atrous convolutions,which could extract more features on multiple scales.Subsequently,a segmentation network of the BG region with multiple ASPC modules was established,which effectively improved the segmentation performance.Although the training data were insufficient,our networks still achieved good auto-segmentation results,with a dice coefficient(Dice)of 87.13%,an Intersection over Union(Iou)of 78.01%,and a sensitivity of 95.02%.Compared with other methods,our method achieved a better segmentation effect,and effectively reduced the misjudgement of segmentation.Our method can thus be used to implement automatic segmentation of the BG region and improve doctors’work efficiency,which is of great importance for developing preliminary studies on the measurement of postoperative BG within the maxillary sinus. 展开更多
关键词 atrous spatial pyramid convolution(ASPC) bone graft(BG)region medical image segmentation residual connection
原文传递
Local-Tetra-Patterns for Face Recognition Encoded on Spatial Pyramid Matching
3
作者 Khuram Nawaz Khayam Zahid Mehmood +4 位作者 Hassan Nazeer Chaudhry Muhammad Usman Ashraf Usman Tariq Mohammed Nawaf Altouri Khalid Alsubhi 《Computers, Materials & Continua》 SCIE EI 2022年第3期5039-5058,共20页
Face recognition is a big challenge in the research field with a lot of problems like misalignment,illumination changes,pose variations,occlusion,and expressions.Providing a single solution to solve all these problems... Face recognition is a big challenge in the research field with a lot of problems like misalignment,illumination changes,pose variations,occlusion,and expressions.Providing a single solution to solve all these problems at a time is a challenging task.We have put some effort to provide a solution to solving all these issues by introducing a face recognition model based on local tetra patterns and spatial pyramid matching.The technique is based on a procedure where the input image is passed through an algorithm that extracts local features by using spatial pyramid matching andmax-pooling.Finally,the input image is recognized using a robust kernel representation method using extracted features.The qualitative and quantitative analysis of the proposed method is carried on benchmark image datasets.Experimental results showed that the proposed method performs better in terms of standard performance evaluation parameters as compared to state-of-the-art methods on AR,ORL,LFW,and FERET face recognition datasets. 展开更多
关键词 Face recognition local tetra patterns spatial pyramid matching robust kernel representation max-pooling
在线阅读 下载PDF
HSPOG:An Optimized Target Recognition Method Based on Histogram of Spatial Pyramid Oriented Gradients 被引量:4
4
作者 Shaojun Guo Feng Liu +3 位作者 Xiaohu Yuan Chunrong Zou Li Chen Tongsheng Shen 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2021年第4期475-483,共9页
The Histograms of Oriented Gradients(HOG)can produce good results in an image target recognition mission,but it requires the same size of the target images for classification of inputs.In response to this shortcoming,... The Histograms of Oriented Gradients(HOG)can produce good results in an image target recognition mission,but it requires the same size of the target images for classification of inputs.In response to this shortcoming,this paper performs spatial pyramid segmentation on target images of any size,gets the pixel size of each image block dynamically,and further calculates and normalizes the gradient of the oriented feature of each block region in each image layer.The new feature is called the Histogram of Spatial Pyramid Oriented Gradients(HSPOG).This approach can obtain stable vectors for images of any size,and increase the target detection rate in the image recognition process significantly.Finally,the article verifies the algorithm using VOC2012 image data and compares the effect of HOG. 展开更多
关键词 Histograms of Oriented Gradients(HOG) Histogram of spatial pyramid Oriented Gradients(HSPOG) object recognition spatial pyramid segmentation
原文传递
EYE-YOLO: a multi-spatial pyramid pooling and Focal-EIOU loss inspired tiny YOLOv7 for fundus eye disease detection
5
作者 Akhil Kumar R.Dhanalakshmi 《International Journal of Intelligent Computing and Cybernetics》 2024年第3期503-522,共20页
Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically fo... Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically for eye disease detection.The model proposed in this work is a highly useful tool for the development of applications for autonomous detection of eye diseases in fundus images that can help and assist ophthalmologists.Design/methodology/approach:The approach adopted to carry out this work is twofold.Firstly,a richly annotated dataset consisting of eye disease classes,namely,cataract,glaucoma,retinal disease and normal eye,was created.Secondly,an improved variant of the Tiny YOLOv7 model was developed and proposed as EYE-YOLO.The proposed EYE-YOLO model has been developed by integrating multi-spatial pyramid pooling in the feature extraction network and Focal-EIOU loss in the detection network of the Tiny YOLOv7 model.Moreover,at run time,the mosaic augmentation strategy has been utilized with the proposed model to achieve benchmark results.Further,evaluations have been carried out for performance metrics,namely,precision,recall,F1 Score,average precision(AP)and mean average precision(mAP).Findings:The proposed EYE-YOLO achieved 28%higher precision,18%higher recall,24%higher F1 Score and 30.81%higher mAP than the Tiny YOLOv7 model.Moreover,in terms of AP for each class of the employed dataset,it achieved 9.74%higher AP for cataract,27.73%higher AP for glaucoma,72.50%higher AP for retina disease and 13.26%higher AP for normal eye.In comparison to the state-of-the-art Tiny YOLOv5,Tiny YOLOv6 and Tiny YOLOv8 models,the proposed EYE-YOLO achieved 6:23.32%higher mAP.Originality/value:This work addresses the problem of eye disease recognition as a bounding box regression and detection problem.Whereas,the work in the related research is largely based on eye disease classification.The other highlight of this work is to propose a richly annotated dataset for different eye diseases useful for training deep learning-based object detectors.The major highlight of this work lies in the proposal of an improved variant of the Tiny YOLOv7 model focusing on eye disease detection.The proposed modifications in the Tiny YOLOv7 aided the proposed model in achieving better results as compared to the state-of-the-art Tiny YOLOv8 and YOLOv8 Nano. 展开更多
关键词 Tiny YOLOv7 spatial pyramid pooling Focal-EIOU loss Eye disease detection
在线阅读 下载PDF
Feature pyramid attention network for audio-visual scene classification 被引量:1
6
作者 Liguang Zhou Yuhongze Zhou +3 位作者 Xiaonan Qi Junjie Hu Tin Lun Lam Yangsheng Xu 《CAAI Transactions on Intelligence Technology》 2025年第2期359-374,共16页
Audio-visual scene classification(AVSC)poses a formidable challenge owing to the intricate spatial-temporal relationships exhibited by audio-visual signals,coupled with the complex spatial patterns of objects and text... Audio-visual scene classification(AVSC)poses a formidable challenge owing to the intricate spatial-temporal relationships exhibited by audio-visual signals,coupled with the complex spatial patterns of objects and textures found in visual images.The focus of recent studies has predominantly revolved around extracting features from diverse neural network structures,inadvertently neglecting the acquisition of semantically meaningful regions and crucial components within audio-visual data.The authors present a feature pyramid attention network(FPANet)for audio-visual scene understanding,which extracts semantically significant characteristics from audio-visual data.The authors’approach builds multi-scale hierarchical features of sound spectrograms and visual images using a feature pyramid representation and localises the semantically relevant regions with a feature pyramid attention module(FPAM).A dimension alignment(DA)strategy is employed to align feature maps from multiple layers,a pyramid spatial attention(PSA)to spatially locate essential regions,and a pyramid channel attention(PCA)to pinpoint significant temporal frames.Experiments on visual scene classification(VSC),audio scene classification(ASC),and AVSC tasks demonstrate that FPANet achieves performance on par with state-of-the-art(SOTA)approaches,with a 95.9 F1-score on the ADVANCE dataset and a relative improvement of 28.8%.Visualisation results show that FPANet can prioritise semantically meaningful areas in audio-visual signals. 展开更多
关键词 dimension alignment feature pyramid attention network pyramid channel attention pyramid spatial attention semantic relevant regions
在线阅读 下载PDF
基于空间通道自适应特征的肝脏病理图像分割网络
7
作者 王建宇 王朝立 +1 位作者 孙占全 刘晓虹 《电子科技》 2026年第1期9-17,共9页
针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与... 针对肝脏病理图像中病变区域与周围组织相似度高、对比度低以及边界模糊等问题,文中提出了一个基于空间通道自适应特征的肝脏病理分割网络。通过混合校准注意力使网络能够自适应地选择经空间和通道校准过的特征信息,有利于编码器捕获与肝脏病灶相关的重要特征,并在编码器最深层引入空洞空间金字塔池化模块来弥补高级特征所缺失的多尺度信息,提高模型的分割精度。在私有肝脏数据集、公开肝脏数据集以及其他两种公开病理数据集对所提网络进行对比实验和消融实验。实验结果表明,相较于其他方法,所提网络的分割结果较佳,且有效解决了肝细胞癌分割问题。 展开更多
关键词 肝细胞癌 病理图像 编解码架构 混合校准注意力模块 空间注意力 通道注意力 空洞空间金字塔池化模块 多尺度信息
在线阅读 下载PDF
基于改进YOLOv11的CNN-Transformer混合水域垃圾检测算法
8
作者 赵建永 李瑞东 +1 位作者 姚浩 魏秀蓉 《无线互联科技》 2026年第4期21-25,50,共6页
河流水面漂浮物检测受限于复杂环境条件(如光照变化、波纹干扰)和检测目标尺度较小的特点,传统方法难以实现高精度检测。文章提出一种面向复杂水域场景的单阶段检测模型YOLOv11n-SPT,在YOLOv11n基础上引入新型Spatial Pyramid Transform... 河流水面漂浮物检测受限于复杂环境条件(如光照变化、波纹干扰)和检测目标尺度较小的特点,传统方法难以实现高精度检测。文章提出一种面向复杂水域场景的单阶段检测模型YOLOv11n-SPT,在YOLOv11n基础上引入新型Spatial Pyramid Transformer(SPT)模块与通道注意力机制。SPT模块采用多分支空间金字塔结构,实现高分辨率细节保留与超大感受野全局建模的协同。在FloW-Img数据集上,YOLOv11n-SPT的mAP@0.5达到81.2%,较基线YOLOv11n提升2.9个百分点;消融实验表明,单独引入SPT模块使mAP@0.5提升2.0%,召回率提升2.1%,进一步叠加通道注意力后精确率提升至85.4%。YOLOv11n-SPT在微小目标与强干扰场景下表现出更强的鲁棒性与定位精度,为无人清漂船、无人机巡河等实际水域环境治理任务提供了高效可靠的感知方案。 展开更多
关键词 水面漂浮物检测 spatial pyramid Transformer YOLOv11
在线阅读 下载PDF
基于Oracle 10g Spatial的栅格数据存储、管理及关键技术 被引量:13
9
作者 黄登山 陈大克 +1 位作者 葛峰 李全杰 《桂林工学院学报》 北大核心 2005年第3期317-321,共5页
在Oracle 10g Spatial可以存储管理矢量数据的基础上,研究栅格图像的存储与管理,分析了栅格数据、元数据、波段、图层、坐标系、物理存储结构等几个相关概念,探讨了存储管理中分块、索引、影像金字塔、地理参照等关键技术,最后用实验证... 在Oracle 10g Spatial可以存储管理矢量数据的基础上,研究栅格图像的存储与管理,分析了栅格数据、元数据、波段、图层、坐标系、物理存储结构等几个相关概念,探讨了存储管理中分块、索引、影像金字塔、地理参照等关键技术,最后用实验证明,采用Oracle 10gSpatial选件可以进行栅格图像的有效存储与管理.并设计了空间数据表结构,将空间对象的栅格数据、矢量数据及属性数据存储到同一数据库,实现了空间数据的一体化管理. 展开更多
关键词 栅格数据 ORACLE spatial 数据库 影像金字塔
在线阅读 下载PDF
基于Oracle 9i Spatial的海量空间影像数据管理 被引量:11
10
作者 邓雪清 张永生 +1 位作者 李波 巩丹超 《测绘学院学报》 北大核心 2003年第2期110-112,116,共4页
利用Oracle 9iSpatial组件提供的模型和功能 ,研究了海量空间影像数据的管理技术。实验表明 ,采用规则分块技术和构建影像金字塔可以实现对超大空间影像的有效管理 ,并为高性能并行数据服务提供了实现基础。
关键词 海量空间影像 几何图形 空间查询 金字塔结构 多分辨率层次模型
在线阅读 下载PDF
基于多尺度特征融合的矿用钢索损伤检测网络
11
作者 徐永恒 裴晓芳 《计算机工程与设计》 北大核心 2026年第2期576-583,共8页
矿用钢索的安全性直接影响作业人员生命保障与设备运行,其损伤检测面临尺度多变、形态不规则的挑战。针对此问题,提出一种轻量级的可形变与多尺度融合网络。设计一种DRConv卷积模块,提升网络在复杂环境下的精度。基于MSDA注意力机制,提... 矿用钢索的安全性直接影响作业人员生命保障与设备运行,其损伤检测面临尺度多变、形态不规则的挑战。针对此问题,提出一种轻量级的可形变与多尺度融合网络。设计一种DRConv卷积模块,提升网络在复杂环境下的精度。基于MSDA注意力机制,提出空洞空间金字塔SPDA改进原有的SPPF模块,提升上采样效果。基于DCN和D-LKA的思想设计SLNK模块,并结合RT-DETR解码器中的CCFM网络,形成一种全新的融合多尺度和可形变卷积的颈部网络RTSLNK,轻量化模型的同时提高精度。实验结果表明,相较于原模型YOLOv8n,平均精度提高5.2%,参数量降低10.5%,在矿用钢索损伤检测任务中表现出色。 展开更多
关键词 矿用钢丝绳索 表面损伤检测 可形变卷积 空洞空间金字塔 可变形大核注意力 跨尺度特征融合 轻量化网络
在线阅读 下载PDF
基于多层次特征融合和注意力机制的无人机图像小目标检测算法
12
作者 张信佳 王芳 《计算机工程》 北大核心 2026年第2期148-157,共10页
无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点,这导致检测过程中容易出现漏检和误检。为应对上述挑战,基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先,引入空间深度转换卷积(SPD-Conv)模块替换... 无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点,这导致检测过程中容易出现漏检和误检。为应对上述挑战,基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先,引入空间深度转换卷积(SPD-Conv)模块替换原模型的跨步卷积层,避免细节信息丢失,增强小目标特征提取能力;其次,设计新型平均快速空间金字塔池化(AGSPPF)模块,引入平均池化操作缓解池化层在提取特征信息的同时会导致部分信息丢失的问题,提升模型的特征提取能力;再次,新增针对小目标的大尺度检测分支,捕捉浅层特征中丰富的细节信息,提升模型对小目标的检测能力;最后,将归一化注意力机制(NAM)嵌入骨干网络,对特征信息进行加权处理,抑制无效的特征信息。在VisDrone2019数据集和NWPU VHR-10数据集上的训练测试结果表明,该算法的均值平均精度(mAP)分别达到了42.3%和96.5%,与基线模型YOLOv5s相比分别提高了8.4和2.6百分点。通过与其他基于深度学习的主流模型对比实验,进一步验证了该模型的鲁棒性和精确性。 展开更多
关键词 YOLOv5s模型 小目标检测 空间深度转换卷积 空间金字塔池化 归一化注意力机制
在线阅读 下载PDF
轻量化几何流形深度网络的自闭症诊断方法
13
作者 吴金颖 马慧彬 《现代信息科技》 2026年第3期70-75,共6页
自闭症谱系障碍(Autism Spectrum Disorder,ASD)是一类常见的中枢神经发育障碍,其临床诊断存在主观性强、准确性不足的问题。为提升功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)在计算机辅助诊断中的性能,文章构建了... 自闭症谱系障碍(Autism Spectrum Disorder,ASD)是一类常见的中枢神经发育障碍,其临床诊断存在主观性强、准确性不足的问题。为提升功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)在计算机辅助诊断中的性能,文章构建了一种轻量化几何流形深度网络(Lightweight Geometric Manifold Deep Network,LGMD-Net)。该网络采用多通道二维残差结构结合医学几何先验获取三维信息,通过轻量化残差块实现高效特征提取;在特征降维阶段,引入空间金字塔池化捕获多尺度空间特征,并结合流形混合(Manifold Mixup)技术实现特征增强与正则化。实验在ABIDE数据集上开展,结果表明,该方法在分类准确率、F1值及AUC等指标上均优于卷积神经网络、Transformer及图神经网络模型,同时在参数规模、推理时间与显存占用方面具备显著优势。研究结果验证了LGMD-Net在提升诊断准确性及工程化应用中的可行性。 展开更多
关键词 自闭症谱系障碍 功能磁共振成像 轻量化网络 空间金字塔池化 流形混合
在线阅读 下载PDF
基于Oracle 10g Spatial的空间栅格数据的存储与管理 被引量:1
14
作者 李光师 徐全生 史新慧 《地理空间信息》 2007年第2期30-33,共4页
深入地研究和分析了Oracle 10g Spatial中新增的栅格数据的存储和管理机制,包括其采用的数据模型、元数据管理机制、栅格金字塔策略及物理存储结构等。在实验中给出了一个比较典型的对栅格数据进行存储和管理的操作示例。同时,指出了Ora... 深入地研究和分析了Oracle 10g Spatial中新增的栅格数据的存储和管理机制,包括其采用的数据模型、元数据管理机制、栅格金字塔策略及物理存储结构等。在实验中给出了一个比较典型的对栅格数据进行存储和管理的操作示例。同时,指出了Oracle提供的栅格数据上载工具存在的局限性,并针对该局限性提出了一种简单有效的解决方案。 展开更多
关键词 栅格数据 ORACLE spatial GEORASTER 栅格金字塔
在线阅读 下载PDF
基于改进U-KAN的田间秸秆覆盖率检测技术
15
作者 马钦 陈子霖 +6 位作者 王昊天 刘哲 张凯 史晓晨 李海龙 张婧芳 吴才聪 《农业机械学报》 北大核心 2026年第4期309-316,共8页
准确高效地检测秸秆覆盖率关乎土壤保护和农业可持续发展,然而现有的秸秆覆盖率检测模型易受光照或阴影等自然环境的影响,当秸秆与土地相似度较高时模型精度会大幅下降。针对车载相机拍摄的秸秆图像中秸秆形态各异、光照引起土地泛白、... 准确高效地检测秸秆覆盖率关乎土壤保护和农业可持续发展,然而现有的秸秆覆盖率检测模型易受光照或阴影等自然环境的影响,当秸秆与土地相似度较高时模型精度会大幅下降。针对车载相机拍摄的秸秆图像中秸秆形态各异、光照引起土地泛白、土地颗粒感强或阴影遮挡的问题,本文提出了一种在自然环境下检测不同尺度秸秆的语义分割方法(Unified attention mixed pooling pyramidU-KAN)。本文用深度膨胀可分离卷积替代传统空洞空间金字塔池化的空洞卷积以获取更多秸秆细节信息,并在自适应平均池化的基础上,增加条带池化分支以更好捕获间隔较大秸秆的特征,从而构建混合池化膨胀空间金字塔模块,将该模块应用于主干网络的最高语义层以获取零散分布秸秆的多尺度信息。同时在解码阶段引入统一注意力融合模块以有效恢复秸秆分割边缘的细节信息。试验结果表明,UMU-KAN在本文构建的秸秆数据集上平均交并比为85.36%,平均像素精度为91.71%,优于经典算法Unet、Swin-Unet和DeepLabv3+,其平均交并比相比DeepLabv3+高1.25个百分点,该模型对自然环境下形态各异的秸秆具有更强的分割性能和良好的鲁棒性,此外本文也进一步证明了柯尔莫戈洛夫-阿诺尔德网络(Kolmogorov-Arnold network,KAN)在农业视觉领域的发展潜力。 展开更多
关键词 秸秆覆盖率 语义分割 空洞空间金字塔
在线阅读 下载PDF
改进YOLOv8n的航拍多尺度目标检测模型
16
作者 贾亮 陈茂辉 +1 位作者 王琪 徐城 《电子测量技术》 北大核心 2026年第1期237-246,共10页
针对无人机航拍图像中目标小而密集,且极易出现漏检和误检等情况,文章提出一种改进YOLOv8n的无人机航拍复杂背景下多尺度目标检测模型UCM-YOLOv8。首先设计一种集聚合与扩散特性于一体的金字塔式网络结构,让每个尺度的特征都具有详细的... 针对无人机航拍图像中目标小而密集,且极易出现漏检和误检等情况,文章提出一种改进YOLOv8n的无人机航拍复杂背景下多尺度目标检测模型UCM-YOLOv8。首先设计一种集聚合与扩散特性于一体的金字塔式网络结构,让每个尺度的特征都具有详细的上下文信息。其次,提出任务动态对齐检测头,从多个卷积层中学习交互特征,提高检测精度。此外,将卷积加性自注意力机制与C2f模块有效融合,进一步增强特征表达能力。最后,为抑制低分辨率图像产生的有害梯度,运用Wise-Inner损失函数替换原CIou损失函数。在VisDrone2019数据集上进行对比实验和消融实验,mAP50值较基线模型提升了10.8%,参数量减少了9.6%。证明本模型在无人机航拍视角下的小目标检测效果优异,适合无人机航拍图像的应用。 展开更多
关键词 无人机航拍 目标检测 损失函数 空间金字塔 解耦检测头 多尺度
原文传递
基于模块化AI模组的火灾图像智能检测
17
作者 杨涛 汪友杰 王伟 《齐鲁工业大学学报》 2026年第1期57-64,共8页
火灾监测对减少生命财产损失至关重要,但传统方法在复杂环境中存在实时性与准确性不足的问题。本文提出一种基于改进YOLOv5s的轻量化火灾图像检测算法,结合边缘计算技术优化监测系统。通过引入卷积块注意力模块(CBAM)增强特征学习能力,... 火灾监测对减少生命财产损失至关重要,但传统方法在复杂环境中存在实时性与准确性不足的问题。本文提出一种基于改进YOLOv5s的轻量化火灾图像检测算法,结合边缘计算技术优化监测系统。通过引入卷积块注意力模块(CBAM)增强特征学习能力,采用多孔空间金字塔池化(ASPP)扩大模型感受野,并利用EIoU Loss损失函数加速收敛、提升回归精度。实验表明,改进后模型的火灾识别率提高至94%,精确率与召回率分别达到94.2%和92.4%。通过将系统搭载在模块化AI模组上,直接处理视频数据,避免了云端传输延迟,显著提升了检测实时性。该方法为复杂场景下的火灾监测提供了高效解决方案,对提升应急响应能力具有重要意义。 展开更多
关键词 边缘计算 火灾监测 神经网络 卷积块注意力模块 多孔空间金字塔池化
在线阅读 下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet 被引量:2
18
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
在线阅读 下载PDF
改进YOLOv8n的焊接缺陷检测方法
19
作者 张湃 田树耀 《焊接学报》 北大核心 2026年第1期66-78,86,共14页
针对焊接缺陷具有多尺度,形态复杂和易受背景干扰等特点,提出一种基于YOLOv8n的焊接缺陷检测算法YOLOSBRS.首先利用空间和通道重建卷积(spatial and channel reconstruction convolution,SCConv)卷积改进主干网络的C2f模块;同时设计一... 针对焊接缺陷具有多尺度,形态复杂和易受背景干扰等特点,提出一种基于YOLOv8n的焊接缺陷检测算法YOLOSBRS.首先利用空间和通道重建卷积(spatial and channel reconstruction convolution,SCConv)卷积改进主干网络的C2f模块;同时设计一种具有双层路由注意力机制的空间金字塔快速平均池化(spatial pyramid pooling fast average pooling with biformer attention module, SPPF_ABF)模块,将原始SPPF模块的最大池化替换为平均池化操作,并引入双层路由Transformer注意力机制;其次采用重参数化广义特征金字塔网络(reparameterized generalized feature pyramid network,RepGFPN)优化特征融合部分;最后,基于参数共享原理及引入联合空间到深度层和非跨步卷积层模块(a module combining space-to-depth and non-strided convolutional layers,SPD_Conv)改进检测头,实现轻量化的同时提升网络对复杂缺陷的检测能力.试验结果表明,改进后算法的精度和交并比为50%的平均精度均值(mean average precision at 50%intersection over union,mAP50)分别提高3.1%和2.8%,为焊接缺陷检测提供一种高效且可行的解决方案. 展开更多
关键词 焊接缺陷检测 空间和通道重建卷积 双层注意力机制 重参数化广义特征金字塔网络 检测头改进
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法 被引量:1
20
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部