期刊文献+
共找到575篇文章
< 1 2 29 >
每页显示 20 50 100
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:7
1
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
在线阅读 下载PDF
Automatic Segmentation Method for Cone-Beam Computed Tomography Image of the Bone Graft Region within Maxillary Sinus Based on the Atrous Spatial Pyramid Convolution Network 被引量:1
2
作者 XU Jiangchang HE Shamin +2 位作者 YU Dedong WU Yiqun CHEN Xiaojun 《Journal of Shanghai Jiaotong university(Science)》 EI 2021年第3期298-305,共8页
Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the B... Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the BG region from cone-beam computed tomography(CBCT)images is connected to the margin of the maxillary sinus,and its boundary is blurred.Common segmentation methods are usually performed manually by experienced doctors,and are complicated by challenges such as low efficiency and low precision.In this study,an auto-segmentation approach was applied to the BG region within the maxillary sinus based on an atrous spatial pyramid convolution(ASPC)network.The ASPC module was adopted using residual connections to compose multiple atrous convolutions,which could extract more features on multiple scales.Subsequently,a segmentation network of the BG region with multiple ASPC modules was established,which effectively improved the segmentation performance.Although the training data were insufficient,our networks still achieved good auto-segmentation results,with a dice coefficient(Dice)of 87.13%,an Intersection over Union(Iou)of 78.01%,and a sensitivity of 95.02%.Compared with other methods,our method achieved a better segmentation effect,and effectively reduced the misjudgement of segmentation.Our method can thus be used to implement automatic segmentation of the BG region and improve doctors’work efficiency,which is of great importance for developing preliminary studies on the measurement of postoperative BG within the maxillary sinus. 展开更多
关键词 atrous spatial pyramid convolution(ASPC) bone graft(BG)region medical image segmentation residual connection
原文传递
Local-Tetra-Patterns for Face Recognition Encoded on Spatial Pyramid Matching
3
作者 Khuram Nawaz Khayam Zahid Mehmood +4 位作者 Hassan Nazeer Chaudhry Muhammad Usman Ashraf Usman Tariq Mohammed Nawaf Altouri Khalid Alsubhi 《Computers, Materials & Continua》 SCIE EI 2022年第3期5039-5058,共20页
Face recognition is a big challenge in the research field with a lot of problems like misalignment,illumination changes,pose variations,occlusion,and expressions.Providing a single solution to solve all these problems... Face recognition is a big challenge in the research field with a lot of problems like misalignment,illumination changes,pose variations,occlusion,and expressions.Providing a single solution to solve all these problems at a time is a challenging task.We have put some effort to provide a solution to solving all these issues by introducing a face recognition model based on local tetra patterns and spatial pyramid matching.The technique is based on a procedure where the input image is passed through an algorithm that extracts local features by using spatial pyramid matching andmax-pooling.Finally,the input image is recognized using a robust kernel representation method using extracted features.The qualitative and quantitative analysis of the proposed method is carried on benchmark image datasets.Experimental results showed that the proposed method performs better in terms of standard performance evaluation parameters as compared to state-of-the-art methods on AR,ORL,LFW,and FERET face recognition datasets. 展开更多
关键词 Face recognition local tetra patterns spatial pyramid matching robust kernel representation max-pooling
在线阅读 下载PDF
HSPOG:An Optimized Target Recognition Method Based on Histogram of Spatial Pyramid Oriented Gradients 被引量:4
4
作者 Shaojun Guo Feng Liu +3 位作者 Xiaohu Yuan Chunrong Zou Li Chen Tongsheng Shen 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2021年第4期475-483,共9页
The Histograms of Oriented Gradients(HOG)can produce good results in an image target recognition mission,but it requires the same size of the target images for classification of inputs.In response to this shortcoming,... The Histograms of Oriented Gradients(HOG)can produce good results in an image target recognition mission,but it requires the same size of the target images for classification of inputs.In response to this shortcoming,this paper performs spatial pyramid segmentation on target images of any size,gets the pixel size of each image block dynamically,and further calculates and normalizes the gradient of the oriented feature of each block region in each image layer.The new feature is called the Histogram of Spatial Pyramid Oriented Gradients(HSPOG).This approach can obtain stable vectors for images of any size,and increase the target detection rate in the image recognition process significantly.Finally,the article verifies the algorithm using VOC2012 image data and compares the effect of HOG. 展开更多
关键词 Histograms of Oriented Gradients(HOG) Histogram of spatial pyramid Oriented Gradients(HSPOG) object recognition spatial pyramid segmentation
原文传递
EYE-YOLO: a multi-spatial pyramid pooling and Focal-EIOU loss inspired tiny YOLOv7 for fundus eye disease detection
5
作者 Akhil Kumar R.Dhanalakshmi 《International Journal of Intelligent Computing and Cybernetics》 2024年第3期503-522,共20页
Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically fo... Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically for eye disease detection.The model proposed in this work is a highly useful tool for the development of applications for autonomous detection of eye diseases in fundus images that can help and assist ophthalmologists.Design/methodology/approach:The approach adopted to carry out this work is twofold.Firstly,a richly annotated dataset consisting of eye disease classes,namely,cataract,glaucoma,retinal disease and normal eye,was created.Secondly,an improved variant of the Tiny YOLOv7 model was developed and proposed as EYE-YOLO.The proposed EYE-YOLO model has been developed by integrating multi-spatial pyramid pooling in the feature extraction network and Focal-EIOU loss in the detection network of the Tiny YOLOv7 model.Moreover,at run time,the mosaic augmentation strategy has been utilized with the proposed model to achieve benchmark results.Further,evaluations have been carried out for performance metrics,namely,precision,recall,F1 Score,average precision(AP)and mean average precision(mAP).Findings:The proposed EYE-YOLO achieved 28%higher precision,18%higher recall,24%higher F1 Score and 30.81%higher mAP than the Tiny YOLOv7 model.Moreover,in terms of AP for each class of the employed dataset,it achieved 9.74%higher AP for cataract,27.73%higher AP for glaucoma,72.50%higher AP for retina disease and 13.26%higher AP for normal eye.In comparison to the state-of-the-art Tiny YOLOv5,Tiny YOLOv6 and Tiny YOLOv8 models,the proposed EYE-YOLO achieved 6:23.32%higher mAP.Originality/value:This work addresses the problem of eye disease recognition as a bounding box regression and detection problem.Whereas,the work in the related research is largely based on eye disease classification.The other highlight of this work is to propose a richly annotated dataset for different eye diseases useful for training deep learning-based object detectors.The major highlight of this work lies in the proposal of an improved variant of the Tiny YOLOv7 model focusing on eye disease detection.The proposed modifications in the Tiny YOLOv7 aided the proposed model in achieving better results as compared to the state-of-the-art Tiny YOLOv8 and YOLOv8 Nano. 展开更多
关键词 Tiny YOLOv7 spatial pyramid pooling Focal-EIOU loss Eye disease detection
在线阅读 下载PDF
Feature pyramid attention network for audio-visual scene classification 被引量:1
6
作者 Liguang Zhou Yuhongze Zhou +3 位作者 Xiaonan Qi Junjie Hu Tin Lun Lam Yangsheng Xu 《CAAI Transactions on Intelligence Technology》 2025年第2期359-374,共16页
Audio-visual scene classification(AVSC)poses a formidable challenge owing to the intricate spatial-temporal relationships exhibited by audio-visual signals,coupled with the complex spatial patterns of objects and text... Audio-visual scene classification(AVSC)poses a formidable challenge owing to the intricate spatial-temporal relationships exhibited by audio-visual signals,coupled with the complex spatial patterns of objects and textures found in visual images.The focus of recent studies has predominantly revolved around extracting features from diverse neural network structures,inadvertently neglecting the acquisition of semantically meaningful regions and crucial components within audio-visual data.The authors present a feature pyramid attention network(FPANet)for audio-visual scene understanding,which extracts semantically significant characteristics from audio-visual data.The authors’approach builds multi-scale hierarchical features of sound spectrograms and visual images using a feature pyramid representation and localises the semantically relevant regions with a feature pyramid attention module(FPAM).A dimension alignment(DA)strategy is employed to align feature maps from multiple layers,a pyramid spatial attention(PSA)to spatially locate essential regions,and a pyramid channel attention(PCA)to pinpoint significant temporal frames.Experiments on visual scene classification(VSC),audio scene classification(ASC),and AVSC tasks demonstrate that FPANet achieves performance on par with state-of-the-art(SOTA)approaches,with a 95.9 F1-score on the ADVANCE dataset and a relative improvement of 28.8%.Visualisation results show that FPANet can prioritise semantically meaningful areas in audio-visual signals. 展开更多
关键词 dimension alignment feature pyramid attention network pyramid channel attention pyramid spatial attention semantic relevant regions
在线阅读 下载PDF
基于Oracle 10g Spatial的栅格数据存储、管理及关键技术 被引量:13
7
作者 黄登山 陈大克 +1 位作者 葛峰 李全杰 《桂林工学院学报》 北大核心 2005年第3期317-321,共5页
在Oracle 10g Spatial可以存储管理矢量数据的基础上,研究栅格图像的存储与管理,分析了栅格数据、元数据、波段、图层、坐标系、物理存储结构等几个相关概念,探讨了存储管理中分块、索引、影像金字塔、地理参照等关键技术,最后用实验证... 在Oracle 10g Spatial可以存储管理矢量数据的基础上,研究栅格图像的存储与管理,分析了栅格数据、元数据、波段、图层、坐标系、物理存储结构等几个相关概念,探讨了存储管理中分块、索引、影像金字塔、地理参照等关键技术,最后用实验证明,采用Oracle 10gSpatial选件可以进行栅格图像的有效存储与管理.并设计了空间数据表结构,将空间对象的栅格数据、矢量数据及属性数据存储到同一数据库,实现了空间数据的一体化管理. 展开更多
关键词 栅格数据 ORACLE spatial 数据库 影像金字塔
在线阅读 下载PDF
基于Oracle 9i Spatial的海量空间影像数据管理 被引量:11
8
作者 邓雪清 张永生 +1 位作者 李波 巩丹超 《测绘学院学报》 北大核心 2003年第2期110-112,116,共4页
利用Oracle 9iSpatial组件提供的模型和功能 ,研究了海量空间影像数据的管理技术。实验表明 ,采用规则分块技术和构建影像金字塔可以实现对超大空间影像的有效管理 ,并为高性能并行数据服务提供了实现基础。
关键词 海量空间影像 几何图形 空间查询 金字塔结构 多分辨率层次模型
在线阅读 下载PDF
基于Oracle 10g Spatial的空间栅格数据的存储与管理 被引量:1
9
作者 李光师 徐全生 史新慧 《地理空间信息》 2007年第2期30-33,共4页
深入地研究和分析了Oracle 10g Spatial中新增的栅格数据的存储和管理机制,包括其采用的数据模型、元数据管理机制、栅格金字塔策略及物理存储结构等。在实验中给出了一个比较典型的对栅格数据进行存储和管理的操作示例。同时,指出了Ora... 深入地研究和分析了Oracle 10g Spatial中新增的栅格数据的存储和管理机制,包括其采用的数据模型、元数据管理机制、栅格金字塔策略及物理存储结构等。在实验中给出了一个比较典型的对栅格数据进行存储和管理的操作示例。同时,指出了Oracle提供的栅格数据上载工具存在的局限性,并针对该局限性提出了一种简单有效的解决方案。 展开更多
关键词 栅格数据 ORACLE spatial GEORASTER 栅格金字塔
在线阅读 下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet 被引量:2
10
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
在线阅读 下载PDF
DCA-YOLO:Detection Algorithm for YOLOv8 Pulmonary Nodules Based on Attention Mechanism Optimization 被引量:1
11
作者 SONG Yongsheng LIU Guohua 《Journal of Donghua University(English Edition)》 2025年第1期78-87,共10页
Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially... Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially leading to false positives or missed detections.To solve these problems,the YOLOv8 network is enhanced by adding deformable convolution and atrous spatial pyramid pooling(ASPP),along with the integration of a coordinate attention(CA)mechanism.This allows the network to focus on small targets while expanding the receptive field without losing resolution.At the same time,context information on the target is gathered and feature expression is enhanced by attention modules in different directions.It effectively improves the positioning accuracy and achieves good results on the LUNA16 dataset.Compared with other detection algorithms,it improves the accuracy of pulmonary nodule detection to a certain extent. 展开更多
关键词 pulmonary nodule YOLOv8 network object detection deformable convolution atrous spatial pyramid pooling(ASPP) coordinate attention(CA)mechanism
在线阅读 下载PDF
基于UCTransNet的建筑损害评估模型
12
作者 谢国波 张文亮 +1 位作者 何林 林志毅 《计算机工程与设计》 北大核心 2025年第1期44-51,共8页
为提高建筑损害的评估精度,提出一种基于UCTransNet的双阶段灾后建筑损害评估模型(MGDLNet)。阶段一使用UCTransNet完成建筑分割。阶段二使用改进后的DM-UCTransNet进行建筑损害评估,通过差异特征提取模块充分融合多尺度的建筑损害特征... 为提高建筑损害的评估精度,提出一种基于UCTransNet的双阶段灾后建筑损害评估模型(MGDLNet)。阶段一使用UCTransNet完成建筑分割。阶段二使用改进后的DM-UCTransNet进行建筑损害评估,通过差异特征提取模块充分融合多尺度的建筑损害特征,嵌入空间金字塔更好捕捉小目标建筑及边缘特征,引入深度监督机制和改进损失函数加强浅层特征学习并平衡样本。实验结果表明,MGDLNet在目标数据集有较大优势,其加权F1得分相较于SegNet、UNet、DeeplabV3+、TransUNet和UCTransNet分别提高了8.6%、1.9%、5.0%、2.7%和1.4%。 展开更多
关键词 建筑损害评估 UCTransNet 双阶段 差异特征 空间金字塔 深度监督 损失函数
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法
13
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
14
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
原文传递
基于多尺度特征融合与重构卷积的肝肿瘤图像分割方法
15
作者 马金林 酒志青 +4 位作者 马自萍 夏明格 张凯 程叶霞 马瑞士 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期94-108,共15页
针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核... 针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核重构模块,使编码器保留更多的细节信息,并使解码器能更有效地恢复信息,以提升肝肿瘤图像特征的表达能力。然后,为丰富全局上下文信息的传递,设计了三分支空间金字塔池化模块来优化瓶颈结构的信息传递,打破单一路径的限制。接着,设计了多尺度特征融合模块来优化编码器信息的复用机制,增强模型对全局上下文信息的建模能力,并提升其在提取不同尺度肝肿瘤图像特征时的效能。最后,在LiTS2017和3DIRCADb数据集上对该文方法的性能进行了测试。实验结果表明:在LiTS2017数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.56%和95.25%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.71%和81.58%;在3DIRCADb数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.63%和95.39%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.62%和81.63%。 展开更多
关键词 肝肿瘤图像分割 卷积核重构 空间金字塔池化 多尺度特征融合
在线阅读 下载PDF
结合倒残差自注意力机制的遥感图像目标检测
16
作者 赵文清 赵振寰 巩佳潇 《智能系统学报》 北大核心 2025年第1期64-72,共9页
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,... 针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。 展开更多
关键词 遥感图像 目标检测 倒残差 自注意力机制 多尺度 空间金字塔 特征提取 特征融合
在线阅读 下载PDF
基于多尺度渐近金字塔的太阳电池缺陷检测网络
17
作者 朱磊 耿萃萃 +3 位作者 李博涛 潘杨 张博 姚丽娜 《太阳能学报》 北大核心 2025年第5期267-274,共8页
以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关... 以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关注重点区域的同时减少参数量的引入;最后提出一种改进渐近金字塔网络AFPNa结构,缓解网络在特征融合过程中信息的丢失或退化问题,提升缺陷检测精度。实验结果表明,与YOLOv8原模型及RTMDET等7种先进检测网络相比,MSANet具有更高的检测精度,相较原模型均值平均精度提升5.7个百分点。 展开更多
关键词 缺陷检测 深度学习 太阳电池 分层特征融合结构 多尺度渐近金字塔 空间注意力机制
原文传递
RAUGAN:基于循环生成对抗网络的红外图像彩色化方法
18
作者 朴燕 康继元 《吉林大学学报(工学版)》 北大核心 2025年第8期2722-2731,共10页
针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的S... 针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的Skip connection结构处连接,使解码分支中的不同尺度输出特征图都能与编码器中对应的输出特征图相结合;其次,设计了由残差块与通道和空间注意力模块(CBAM)构成的深度瓶颈层块替换UNet网络中的瓶颈层,用于增强局部区域特征,提高其识别能力;最后,在判别网络中引用感知损失函数从而解决色彩恢复失真的问题。实验结果表明:该方法彩色化效果明显优于其他方法。 展开更多
关键词 计算机应用 红外图像彩色化 循环生成对抗网络 空洞空间金字塔池化 注意力模块
原文传递
基于改进DeepLabV3+的城市列车轨道区域分割方法
19
作者 胡波 刘培文 刘瑞琪 《菏泽学院学报》 2025年第5期76-82,共7页
针对城市列车轨道区域与路面背景相似度较高而导致的轨道区域提取效果较差的问题,提出一种基于改进DeeplabV3+模型的轨道区域的分割算法.首先,针对列车轨道区域长宽比例较大的特点,使用条形池化卷积层代替ASPP结构中的全局池化层,以提... 针对城市列车轨道区域与路面背景相似度较高而导致的轨道区域提取效果较差的问题,提出一种基于改进DeeplabV3+模型的轨道区域的分割算法.首先,针对列车轨道区域长宽比例较大的特点,使用条形池化卷积层代替ASPP结构中的全局池化层,以提升算法对条形轨道区域的提取能力;其次设计使用特征分组注意力(FGA)机制,提升模型对细节的关注度;最后改变上采样频率,降低因快速上采样而造成边界信息的模糊化影响.将3192张城市轨道图像作为数据集,经验证与原网络相比,改进网络在数据集中的平均交并比以及召回率分别提高了3.65%、3.83%,达到93.88%以及97.35%,有效提升了轨道区域提取效果. 展开更多
关键词 区域提取 Deeplabv3+ 条形池化 注意力 空间金字塔
在线阅读 下载PDF
基于改进Hyper-YOLO的煤矿输送带异物检测方法
20
作者 李刚 朱宇 +6 位作者 杨庆贺 邹军鹏 才天 贺鹏 张亚兵 赵艺鸣 田鑫浩 《工矿自动化》 北大核心 2025年第7期114-121,共8页
基于YOLO系列的输送带异物检测技术已取得丰富的研究成果,但其颈部网络无法使相隔较远的特征层直接交换特征信息,引发小目标漏检、重复检测等问题。Hyper-YOLO可在颈部网络实现特征层之间跨层、跨位置的高阶关联,但会增加计算量,且降低... 基于YOLO系列的输送带异物检测技术已取得丰富的研究成果,但其颈部网络无法使相隔较远的特征层直接交换特征信息,引发小目标漏检、重复检测等问题。Hyper-YOLO可在颈部网络实现特征层之间跨层、跨位置的高阶关联,但会增加计算量,且降低对高频特征信息的敏感性,导致在噪声较为敏感的区域特征提取能力下降,预测边界框发生偏移。针对上述问题,提出一种基于改进Hyper-YOLO的煤矿输送带异物检测方法。在图像预处理阶段采用动态对比度受限自适应直方图均衡化(Dy-CLAHE)方法,将Laplacian算子引入对比度受限自适应直方图均衡化(CLAHE)框架,建立噪声水平与对比度限制阈值之间的动态映射关系,有效解决了粉尘环境下图像细节丢失和噪声放大的问题;对Hyper-YOLO进行改进,采用高效交并比(EIoU)损失函数优化边界框回归过程,提升了预测边界框定位精度,并在混合聚合网络(MANet)的深层和浅层嵌入高效通道注意力机制(ECA)模块,通过局部跨通道交互动态调整通道权重,有效平衡对高频和低频特征信息的敏感性,降低小目标异物的漏检率,同时通过简化快速空间金字塔池化(SimSPPF)模块,减少了冗余计算,在保证精度的同时提升了推理速度。实验结果表明:改进Hyper-YOLO在准确率和mAP@0.5指标上分别为94.2%和93.4%,相较于Hyper-YOLO提高了5.0%和3.5%,参数量为3.26×10^(6)个,召回率为87.7%,检测速度为158帧/s,满足煤矿井下异物实时检测的需求;在不同煤矿输送带异物检测场景下无漏检及重复检测情况,预测边界框更贴合异物。 展开更多
关键词 煤矿输送带 异物检测 Hyper-YOLO 动态对比度受限自适应直方图均衡 EIoU 高效通道注意力机制 简化快速空间金字塔池化
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部