期刊文献+
共找到2,124篇文章
< 1 2 107 >
每页显示 20 50 100
Low-light image enhancement based on multi-illumination estimation and multi-scale fusion
1
作者 ZHANG Xin'ai GAO Jing +1 位作者 NIE Kaiming LUO Tao 《Optoelectronics Letters》 2025年第6期362-369,共8页
To improve image quality under low illumination conditions,a novel low-light image enhancement method is proposed in this paper based on multi-illumination estimation and multi-scale fusion(MIMS).Firstly,the illuminat... To improve image quality under low illumination conditions,a novel low-light image enhancement method is proposed in this paper based on multi-illumination estimation and multi-scale fusion(MIMS).Firstly,the illumination is processed by contrast-limited adaptive histogram equalization(CLAHE),adaptive complementary gamma function(ACG),and adaptive detail preserving S-curve(ADPS),respectively,to obtain three components.Then,the fusion-relevant features,exposure,and color contrast are selected as the weight maps.Subsequently,these components and weight maps are fused through multi-scale to generate enhanced illumination.Finally,the enhanced images are obtained by multiplying the enhanced illumination and reflectance.Compared with existing approaches,this proposed method achieves an average increase of 0.81%and 2.89%in the structural similarity index measurement(SSIM)and peak signal-to-noise ratio(PSNR),and a decrease of 6.17%and 32.61%in the natural image quality evaluator(NIQE)and gradient magnitude similarity deviation(GMSD),respectively. 展开更多
关键词 adaptive detail preserving s curve contrast limited adaptive histogram equalization adaptive complementary gamma function low light image enhancement equalization clahe adaptive complementary gamma function acg multi scale fusion weight maps multi illumination estimation
原文传递
Multi-scale feature fusion optical remote sensing target detection method 被引量:1
2
作者 BAI Liang DING Xuewen +1 位作者 LIU Ying CHANG Limei 《Optoelectronics Letters》 2025年第4期226-233,共8页
An improved model based on you only look once version 8(YOLOv8)is proposed to solve the problem of low detection accuracy due to the diversity of object sizes in optical remote sensing images.Firstly,the feature pyram... An improved model based on you only look once version 8(YOLOv8)is proposed to solve the problem of low detection accuracy due to the diversity of object sizes in optical remote sensing images.Firstly,the feature pyramid network(FPN)structure of the original YOLOv8 mode is replaced by the generalized-FPN(GFPN)structure in GiraffeDet to realize the"cross-layer"and"cross-scale"adaptive feature fusion,to enrich the semantic information and spatial information on the feature map to improve the target detection ability of the model.Secondly,a pyramid-pool module of multi atrous spatial pyramid pooling(MASPP)is designed by using the idea of atrous convolution and feature pyramid structure to extract multi-scale features,so as to improve the processing ability of the model for multi-scale objects.The experimental results show that the detection accuracy of the improved YOLOv8 model on DIOR dataset is 92%and mean average precision(mAP)is 87.9%,respectively 3.5%and 1.7%higher than those of the original model.It is proved the detection and classification ability of the proposed model on multi-dimensional optical remote sensing target has been improved. 展开更多
关键词 multi scale feature fusion optical remote sensing feature map improve target detection ability optical remote sensing imagesfirstlythe target detection feature fusionto enrich semantic information spatial information
原文传递
MSL-Net:a lightweight apple leaf disease detection model based on multi-scale feature fusion
3
作者 YANG Kangyi YAN Chunman 《Optoelectronics Letters》 2025年第12期745-752,共8页
Aiming at the problem of low detection accuracy due to the different scale sizes of apple leaf disease spots and their similarity to the background,this paper proposes a multi-scale lightweight network(MSL-Net).Firstl... Aiming at the problem of low detection accuracy due to the different scale sizes of apple leaf disease spots and their similarity to the background,this paper proposes a multi-scale lightweight network(MSL-Net).Firstly,a multiplexed aggregated feature extraction network is proposed using residual bottleneck block(RES-Bottleneck)and middle partial-convolution(MP-Conv)to capture multi-scale spatial features and enhance focus on disease features for better differentiation between disease targets and background information.Secondly,a lightweight feature fusion network is designed using scale-fuse concatenation(SF-Cat)and triple-scale sequence feature fusion(TSSF)module to merge multi-scale feature maps comprehensively.Depthwise convolution(DWConv)and GhostNet lighten the network,while the cross stage partial bottleneck with 3 convolutions ghost-normalization attention module(C3-GN)reduces missed detections by suppressing irrelevant background information.Finally,soft non-maximum suppression(Soft-NMS)is used in the post-processing stage to improve the problem of misdetection of dense disease sites.The results show that the MSL-Net improves mean average precision at intersection over union of 0.5(mAP@0.5)by 2.0%over the baseline you only look once version 5s(YOLOv5s)and reduces parameters by 44%,reducing computation by 27%,outperforming other state-of-the-art(SOTA)models overall.This method also shows excellent performance compared to the latest research. 展开更多
关键词 enhance focus disease features background i multi scale feature fusion apple leaf disease spots residual bottleneck block res bottleneck multiplexed aggregated feature extraction network lightweight network apple leaf disease detection
原文传递
SFMFusion:基于语义特征映射自编码的红外与可见光图像融合
4
作者 管芳景 汪娟 罗晓清 《红外技术》 北大核心 2026年第2期156-165,共10页
以往的红外与可见光图像融合方法常忽略了语义信息特征的关系,导致红外图像的独特信息挖掘不够充分。为了充分提取挖掘图像的语义信息和细粒度判别特征,本文提出了一种基于语义特征映射自编码的红外与可见光图像融合方法(SFMFusion)。... 以往的红外与可见光图像融合方法常忽略了语义信息特征的关系,导致红外图像的独特信息挖掘不够充分。为了充分提取挖掘图像的语义信息和细粒度判别特征,本文提出了一种基于语义特征映射自编码的红外与可见光图像融合方法(SFMFusion)。该方法针对粗、细粒度关注的信息重点不同,采取了两重融合策略:对于包含图像空间细节纹理的浅层信息,本文设计了基于内容丰富度的融合规则;对于蕴含图像判别性内容的深层语义信息,设计了基于最小二乘法的语义特征映射融合规则,通过寻求最佳特征映射以便最大限度地保留红外图像的独特信息。在此基础上,为了进一步增强语义融合特征的上下文相关性,本文设计了多尺度增强模块。该模块使用多个具有不同扩张率的空洞卷积对特征进行并行处理语义融合特征,以此学习特征不同尺度的信息。最后,在浅层融合细节信息的逐层引导下,从粗到细重构出最终的融合图像。通过在标准图像TNO和RoadScene数据集上进行主客观实验,与传统和近来深度学习融合方法进行比较分析,结果显示本文方法能有效保留并融合红外与可见光图像中的互补信息,在视觉感知和定量指标上均取得较好的效果。 展开更多
关键词 特征映射 语义 最小二乘法 多尺度 红外与可见光 图像融合
在线阅读 下载PDF
An infrared and visible image fusion method based upon multi-scale and top-hat transforms 被引量:1
5
作者 Gui-Qing He Qi-Qi Zhang +3 位作者 Hai-Xi Zhang Jia-Qi Ji Dan-Dan Dong Jun Wang 《Chinese Physics B》 SCIE EI CAS CSCD 2018年第11期340-348,共9页
The high-frequency components in the traditional multi-scale transform method are approximately sparse, which can represent different information of the details. But in the low-frequency component, the coefficients ar... The high-frequency components in the traditional multi-scale transform method are approximately sparse, which can represent different information of the details. But in the low-frequency component, the coefficients around the zero value are very few, so we cannot sparsely represent low-frequency image information. The low-frequency component contains the main energy of the image and depicts the profile of the image. Direct fusion of the low-frequency component will not be conducive to obtain highly accurate fusion result. Therefore, this paper presents an infrared and visible image fusion method combining the multi-scale and top-hat transforms. On one hand, the new top-hat-transform can effectively extract the salient features of the low-frequency component. On the other hand, the multi-scale transform can extract highfrequency detailed information in multiple scales and from diverse directions. The combination of the two methods is conducive to the acquisition of more characteristics and more accurate fusion results. Among them, for the low-frequency component, a new type of top-hat transform is used to extract low-frequency features, and then different fusion rules are applied to fuse the low-frequency features and low-frequency background; for high-frequency components, the product of characteristics method is used to integrate the detailed information in high-frequency. Experimental results show that the proposed algorithm can obtain more detailed information and clearer infrared target fusion results than the traditional multiscale transform methods. Compared with the state-of-the-art fusion methods based on sparse representation, the proposed algorithm is simple and efficacious, and the time consumption is significantly reduced. 展开更多
关键词 infrared and visible image fusion multi-scale transform mathematical morphology top-hat trans- form
原文传递
A Lightweight Convolutional Neural Network with Hierarchical Multi-Scale Feature Fusion for Image Classification 被引量:2
6
作者 Adama Dembele Ronald Waweru Mwangi Ananda Omutokoh Kube 《Journal of Computer and Communications》 2024年第2期173-200,共28页
Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware reso... Convolutional neural networks (CNNs) are widely used in image classification tasks, but their increasing model size and computation make them challenging to implement on embedded systems with constrained hardware resources. To address this issue, the MobileNetV1 network was developed, which employs depthwise convolution to reduce network complexity. MobileNetV1 employs a stride of 2 in several convolutional layers to decrease the spatial resolution of feature maps, thereby lowering computational costs. However, this stride setting can lead to a loss of spatial information, particularly affecting the detection and representation of smaller objects or finer details in images. To maintain the trade-off between complexity and model performance, a lightweight convolutional neural network with hierarchical multi-scale feature fusion based on the MobileNetV1 network is proposed. The network consists of two main subnetworks. The first subnetwork uses a depthwise dilated separable convolution (DDSC) layer to learn imaging features with fewer parameters, which results in a lightweight and computationally inexpensive network. Furthermore, depthwise dilated convolution in DDSC layer effectively expands the field of view of filters, allowing them to incorporate a larger context. The second subnetwork is a hierarchical multi-scale feature fusion (HMFF) module that uses parallel multi-resolution branches architecture to process the input feature map in order to extract the multi-scale feature information of the input image. Experimental results on the CIFAR-10, Malaria, and KvasirV1 datasets demonstrate that the proposed method is efficient, reducing the network parameters and computational cost by 65.02% and 39.78%, respectively, while maintaining the network performance compared to the MobileNetV1 baseline. 展开更多
关键词 MobileNet Image Classification Lightweight Convolutional Neural Network Depthwise Dilated Separable Convolution Hierarchical multi-scale Feature fusion
在线阅读 下载PDF
ScaleMamba-YOLO:基于MambaYOLO的多尺度医学目标检测模型
7
作者 覃晓 钱泉梅 《南宁师范大学学报(自然科学版)》 2026年第2期63-75,共13页
针对MambaYOLO在医学影像分析中存在的多尺度适应性不足(病灶尺寸差异大导致固定感受野效果受限)和背景干扰敏感(正常组织噪声影响检测)2个关键问题,本研究提出了一种基于MambaYOLO的多尺度医学目标检测模型ScaleMamba-YOLO。首先,针对... 针对MambaYOLO在医学影像分析中存在的多尺度适应性不足(病灶尺寸差异大导致固定感受野效果受限)和背景干扰敏感(正常组织噪声影响检测)2个关键问题,本研究提出了一种基于MambaYOLO的多尺度医学目标检测模型ScaleMamba-YOLO。首先,针对尺度特征捕捉不足的问题,设计了医学多尺度局部特征增强模块(Medical Multi-scale Local Feature Enhancement Block),通过异构卷积核并行架构实现病理特征的全尺度覆盖,实现了对微小病灶和弥散性大病灶的协同检测。其次,为了减少背景噪声放大,提出特征聚合提取模块(Partial-enhanced C2F),采用部分卷积技术选择性保留关键特征通道,有效抑制了医学影像中正常组织区域的背景干扰。最后,为了验证模型的有效性,在Br35H(脑部MRI肿瘤)和PLoPy(结肠镜息肉)两个典型的公开医学数据集上进行了测试。实验结果表明,ScaleMamba-YOLO模型的平均精度均值(AP)分别达到72.7%和85.7%,相较于基线MambaYOLO模型,AP分别提升了2.2个百分点和1.7个百分点。这表明ScaleMamba-YOLO模型能有效克服多尺度适应性不足和背景干扰问题,可以显著提升模型对不同尺寸医学病灶的检测精度。 展开更多
关键词 Mamba MambaYOLO 多尺度特征融合 局部特征增强 医学影像分析
在线阅读 下载PDF
基于YOLO-BioFusion的血细胞检测模型 被引量:1
8
作者 张傲 刘微 +2 位作者 刘阳 杨思瑶 管勇 《电子测量技术》 北大核心 2025年第18期177-188,共12页
血细胞检测是临床诊断中的重要任务,尤其在面对细胞类型多样、尺寸差异显著、目标重叠频繁以及复杂背景时,现有检测模型的精度和鲁棒性仍面临挑战。为解决这些问题,本文提出了一种改进的YOLOv8目标检测模型——YOLO-BioFusion。该模型... 血细胞检测是临床诊断中的重要任务,尤其在面对细胞类型多样、尺寸差异显著、目标重叠频繁以及复杂背景时,现有检测模型的精度和鲁棒性仍面临挑战。为解决这些问题,本文提出了一种改进的YOLOv8目标检测模型——YOLO-BioFusion。该模型通过引入ACFN模块,提高了对细小目标和重叠目标的检测能力;应用C2f-DPE和SPPF-LSK模块增强了多尺度特征的融合与提取,提升了模型的鲁棒性和泛化能力;同时,采用Inner-CIoU损失函数加速了模型收敛并提高了定位精度。实验结果表明,在BCCD数据集上,YOLO-BioFusion的mAP@0.5为94.0%,mAP@0.5:0.95为65.2%,分别较YOLOv8-n提高了1.9%和3.2%。与此同时,计算成本仅为6.8 GFLOPs,展示了其在资源受限环境中的应用潜力。该研究为复杂背景下的血细胞检测提供了一种高效且精确的解决方案。 展开更多
关键词 血细胞检测 多尺度特征融合 损失函数优化 YOLOv8 重叠目标
原文传递
Multi-source Remote Sensing Image Registration Based on Contourlet Transform and Multiple Feature Fusion 被引量:6
9
作者 Huan Liu Gen-Fu Xiao +1 位作者 Yun-Lan Tan Chun-Juan Ouyang 《International Journal of Automation and computing》 EI CSCD 2019年第5期575-588,共14页
Image registration is an indispensable component in multi-source remote sensing image processing. In this paper, we put forward a remote sensing image registration method by including an improved multi-scale and multi... Image registration is an indispensable component in multi-source remote sensing image processing. In this paper, we put forward a remote sensing image registration method by including an improved multi-scale and multi-direction Harris algorithm and a novel compound feature. Multi-scale circle Gaussian combined invariant moments and multi-direction gray level co-occurrence matrix are extracted as features for image matching. The proposed algorithm is evaluated on numerous multi-source remote sensor images with noise and illumination changes. Extensive experimental studies prove that our proposed method is capable of receiving stable and even distribution of key points as well as obtaining robust and accurate correspondence matches. It is a promising scheme in multi-source remote sensing image registration. 展开更多
关键词 Feature fusion multi-scale circle Gaussian combined invariant MOMENT multi-direction GRAY level CO-OCCURRENCE matrix multi-SOURCE remote sensing image registration CONTOURLET transform
原文传递
融合Multi-scale CNN和Bi-LSTM的人脸表情识别研究 被引量:3
10
作者 李军 李明 《北京联合大学学报》 CAS 2021年第1期35-39,44,共6页
为了有效改善现有人脸表情识别模型中存在信息丢失严重、特征信息之间联系不密切的问题,提出一种融合多尺度卷积神经网络(Multi-scale CNN)和双向长短期记忆(Bi-LSTM)的模型。Bi-LSTM可以增强特征信息间的联系与信息的维持,在Multi-scal... 为了有效改善现有人脸表情识别模型中存在信息丢失严重、特征信息之间联系不密切的问题,提出一种融合多尺度卷积神经网络(Multi-scale CNN)和双向长短期记忆(Bi-LSTM)的模型。Bi-LSTM可以增强特征信息间的联系与信息的维持,在Multi-scale CNN中通过不同尺度的卷积核可以提取到更加丰富的特征信息,并通过加入批标准化(BN)层与特征融合处理,从而加快网络的收敛速度,有利于特征信息的重利用,再将两者提取到的特征信息进行融合,最后将改进的正则化方法应用到目标函数中,减小网络复杂度和过拟合。在JAFFE和FER-2013公开数据集上进行实验,准确率分别达到了95.455%和74.115%,由此证明所提算法的有效性和先进性。 展开更多
关键词 多尺度卷积神经网络 双向长短期记忆 特征融合 批标准化层 正则化
在线阅读 下载PDF
基于多尺度双流网络的深度伪造检测方法
11
作者 蒋翠玲 程梓源 +1 位作者 俞新贵 万永菁 《计算机工程》 北大核心 2026年第1期242-253,共12页
人脸深度伪造技术的滥用给社会和个人带来了极大的安全隐患,因此深度伪造检测技术已成为当今研究的热点。目前基于深度学习的伪造检测技术在高质量(HQ)数据集上效果较好,但在低质量(LQ)数据集和跨数据集上的检测效果不佳。为提升深度伪... 人脸深度伪造技术的滥用给社会和个人带来了极大的安全隐患,因此深度伪造检测技术已成为当今研究的热点。目前基于深度学习的伪造检测技术在高质量(HQ)数据集上效果较好,但在低质量(LQ)数据集和跨数据集上的检测效果不佳。为提升深度伪造检测的泛化性,提出一种基于多尺度双流网络(MSDSnet)的深度伪造检测方法。MSDSnet输入分为空域特征流和高频噪声特征流,首先采用多尺度融合(MSF)模块捕获不同情况下图像在空域被篡改的粗粒度人脸特征和伪造图像的细粒度高频噪声特征信息,然后通过MSF模块将空域流和高频噪声流的双流特征充分融合,由多模态交互注意力(MIA)模块进一步交互以充分学习双流特征信息,最后利用FcaNet(Frequency Channel Attention Network)获取伪造人脸特征的全局信息并完成检测分类。实验结果表明,该方法在HQ数据集Celeb-DF v2上的准确率为98.54%,在LQ数据集FaceForensics++上的准确率为93.11%,同时在跨数据集上的实验效果也优于其他同类方法。 展开更多
关键词 深度伪造检测 双流网络 多尺度融合 多模态交互注意力 高频噪声
在线阅读 下载PDF
基于多尺度特征融合的超短期风电功率预测
12
作者 高鹭 庄庆泽 +2 位作者 张飞 秦岭 邬锡麟 《电子测量技术》 北大核心 2026年第1期166-175,共10页
鉴于风电在能源结构中的重要性及其间断性带来的挑战,本文提出了一种基于异常值处理和多尺度特征融合的端到端超短期风电功率多步预测组合模型,旨在提高超短期风电功率预测的精确度与稳定性,进而为电力系统调度与运行的准确性与稳定性... 鉴于风电在能源结构中的重要性及其间断性带来的挑战,本文提出了一种基于异常值处理和多尺度特征融合的端到端超短期风电功率多步预测组合模型,旨在提高超短期风电功率预测的精确度与稳定性,进而为电力系统调度与运行的准确性与稳定性提供有力支撑。首先,通过RobustTSF方法处理时间序列异常,为预测模型的鲁棒性提供有力的保障,减少了异常时间序列预测和噪声标签学习之间的差异。其次,融合空间金字塔匹配映射策略、Levy飞行策略以及自适应t分布变异策略对蜣螂优化算法进行改进,显著提高了全局搜索能力和收敛效率。同时,利用多策略蜣螂优化算法优化改进的TimeMixer模型的超参数,以获得最优的模型性能。最后使用CATimeMixer模型,实现了多尺度季节特征和趋势特征的融合和预测。实验结果表明,相较于基准模型多层感知机的MAE、RMSE、MSE分别下降了49.71%、41.26%、65.50%,同时R2提高了4.49%,能够有效降低预测误差,为超短期风电功率的准确预测提供了一种新的方法和思路。 展开更多
关键词 超短期风电功率多步预测 异常值处理 多尺度特征融合 多策略蜣螂优化算法
原文传递
LDD-YOLO:改进YOLOv8的轻量级密集行人检测算法
13
作者 杨迪 张喜龙 王鹏 《计算机科学与探索》 北大核心 2026年第1期251-265,共15页
针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合... 针对当前行人检测算法在密集场景中由于遮挡和尺度变化导致的漏检、误检,以及模型计算复杂度高等问题,提出了一种基于YOLOv8的轻量级密集行人检测方法(LDD-YOLO),以实现检测效率与精度的平衡。设计了一种重参数化层聚合网络RELAN,融合了重参数化卷积和多分支结构,分别在训练阶段和推理阶段强化特征表达能力与模型推理效率。引入了分离式大卷积核注意力机制的空间金字塔池化模块SPPF-LSKA,结合分离式大卷积核操作以扩大感受野,增强对密集目标的特征捕获能力,抑制背景干扰。为解决YOLOv8在特征处理中未能充分挖掘局部与全局信息的局限性,提出了一种改进的多尺度特征融合模块FFDM,通过融合多尺度特征信息,提升模型密集行人检测的特征表达能力。设计了一种轻量化的特征对齐检测头LSCSBD,利用不同特征层级之间的共享卷积层,提高参数利用效率并减少冗余计算。在CrowdHuman与WiderPerson数据集上的对比实验结果表明,LDD-YOLO在总体性能上优于对比模型,实现了精度与效率的平衡。 展开更多
关键词 密集行人检测 YOLO 重参数化 可分离大核注意力机制 多尺度特征融合 轻量化
在线阅读 下载PDF
基于多尺度特征融合的并行神经网络剩余寿命预测方法
14
作者 余萍 王浩年 曹洁 《太阳能学报》 北大核心 2026年第1期785-796,共12页
为更准确预测锂电池的剩余使用寿命(RUL),提高其可靠性,确保稳定运行,提出一种基于多尺度特征融合的并行神经网络预测方法。首先,利用不同尺度的时间卷积网络(TCN)提取锂电池的多尺度特征,从而增强局部和全局特征的提取能力;接着,引入... 为更准确预测锂电池的剩余使用寿命(RUL),提高其可靠性,确保稳定运行,提出一种基于多尺度特征融合的并行神经网络预测方法。首先,利用不同尺度的时间卷积网络(TCN)提取锂电池的多尺度特征,从而增强局部和全局特征的提取能力;接着,引入交叉注意力机制对特征进行筛选与融合,以提取关键的退化信息;随后,构建并行的Bi-LSTM和Bi-GRU网络,以学习退化特征并建立时间尺度上的长期依赖关系,最终实现RUL预测。通过美国航空航天局(NASA)和CALCE锂电池数据集验证,证明了所提方法在不同背景下的有效性。 展开更多
关键词 多尺度特征融合 时间卷积网络 交叉注意力机制 锂电池 剩余使用寿命预测 并行神经网络
原文传递
DUIE-YOLO:一种基于图像增强的水下鱿鱼目标检测算法
15
作者 曹莉凌 胡浩宇 曹守启 《上海海洋大学学报》 北大核心 2026年第1期254-269,共16页
为了解决水下图像因模糊和色偏导致的目标检测精度下降问题,提升复杂水下环境中鱿鱼检测的准确性和鲁棒性,本研究提出一种基于图像增强的水下鱿鱼检测算法DUIE-YOLO,采用“先增强后检测”的级联框架,由DUIE-Net增强模块和YOLOv8-HD检测... 为了解决水下图像因模糊和色偏导致的目标检测精度下降问题,提升复杂水下环境中鱿鱼检测的准确性和鲁棒性,本研究提出一种基于图像增强的水下鱿鱼检测算法DUIE-YOLO,采用“先增强后检测”的级联框架,由DUIE-Net增强模块和YOLOv8-HD检测模块组成。DUIE-Net模块通过颜色校正、多尺度特征融合、特征恢复与增强及去雾优化,显著提升图像质量;YOLOv8-HD检测模块结合FasterNet网络、小目标检测头、CoordAttention注意力机制及ShapeIoU损失函数,优化特征提取能力与小目标检测精度。实验结果表明,DUIE-YOLO相比原始YOLOv8n在Precision、Recall、F1-score和mAP等4个关键指标上分别提升4.2%、6.8%、5.7%和5.5%。联合实验结果显示,DUIE-Net与YOLOv8-HD的组合相比基线(Raw+YOLOv8n),mAP提升40.3%,Precision提升10.5%,Recall提升53%,F1-score提升31%,证明该算法具有显著的级联优化效果。研究表明,DUIE-YOLO通过图像增强与检测模块的协同优化,有效解决了水下图像质量差导致的检测性能下降问题。本研究为复杂水下环境中的目标识别提供了高精度的解决方案,对海洋生物监测与资源开发具有重要应用价值。 展开更多
关键词 水下鱿鱼检测 目标检测 图像增强 多尺度特征融合 YOLOv8
原文传递
基于改进RT-DETR的遥感图像目标检测算法
16
作者 肖锋 杨文豪 +2 位作者 张文娟 黄姝娟 周雨洁 《电子测量技术》 北大核心 2026年第2期192-202,共11页
遥感图像中的目标常呈细长、曲折等复杂形态,且伴随尺度变化大与背景干扰强等因素,导致现有检测方法易出现缺检和误检,难以满足高精度检测需求,为此,提出一种改进的遥感图像目标检测算法TriD-DETR。首先,通过动态调整卷积核形状并优化... 遥感图像中的目标常呈细长、曲折等复杂形态,且伴随尺度变化大与背景干扰强等因素,导致现有检测方法易出现缺检和误检,难以满足高精度检测需求,为此,提出一种改进的遥感图像目标检测算法TriD-DETR。首先,通过动态调整卷积核形状并优化通道适配与残差连接方式,设计了DKFE特征提取模块,该模块能够自适应地聚焦于细长曲折的局部区域,从而准确捕捉目标特征;其次,为了提高模型对复杂目标的定位和识别能力,提出DATE尺度内特征交互结构,在重构Transformer编码器的基础上引入可变形注意力机制,增强了模型对高级特征和深层语义信息的捕捉能力;最后,针对多尺度特征融合部分,提出DBFB多样性分支融合模块,通过组合不同尺度和复杂度的多样性分支使特征空间更丰富,从而增强模型的表达能力。实验结果表明,TriD-DETR算法在DIOR和RSOD数据集上分别达到86.8%和94.1%的mAP,相较于原模型RT-DETR-R18,分别提升了1.2%和2.3%,充分证明了TriD-DETR算法的可靠性与高效性。 展开更多
关键词 遥感图像 目标检测 RT-DETR 注意力机制 多尺度特征融合
原文传递
基于轻量级卷积神经网络的岩石图像岩性识别方法
17
作者 刘善伟 马志伟 +1 位作者 魏世清 魏忠勇 《地质科技通报》 北大核心 2026年第1期360-370,共11页
岩性识别是油气勘探和开发过程中的重要环节,对于油气勘探定位、储层评价以及储层模型建立具有重要的指导意义。但传统的人工岩性识别方法耗时耗力,经典的深度学习模型虽然识别精度高,但模型的参数量较大,为了提高模型识别精度,同时降... 岩性识别是油气勘探和开发过程中的重要环节,对于油气勘探定位、储层评价以及储层模型建立具有重要的指导意义。但传统的人工岩性识别方法耗时耗力,经典的深度学习模型虽然识别精度高,但模型的参数量较大,为了提高模型识别精度,同时降低模型的参数量,使模型适用于岩性实时识别工作,首先收集了白云岩、砂岩等8种岩石共3016张岩石图像构建岩性识别数据集,然后以轻量型卷积神经网络ShuffleNetV2模型为基础网络,提出了一种Rock-ShuffleNetV2岩性识别模型(RSHFNet模型)。模型中将混合注意力机制模块(convolutional block attention module,简称CBAM)以及多尺度特征融合模块(multi-scale feature fusion module,简称MSF)融入基础网络中以加强模型的特征提取能力,提升模型识别性能,并优化模型中ShuffleNetV2单元的堆叠次数以减少模型参数量。结果表明:与基础模型相比,RSHFNet模型的准确率达到了87.21%,提高了4.98%;同时,模型参数量与浮点运算量分别降低到了869702个,0.93×108,分别是基础模型的0.67,0.63倍,模型参数量明显降低;并且RSHFNet模型的综合性能明显优于现有的卷积神经网络。RSHFNet岩性识别模型具有较高的识别精度和较好的泛化能力,同时更加的轻量化,为实现野外实时的岩性识别工作提供了新思路。 展开更多
关键词 岩性识别 ShuffleNetV2网络 混合注意力机制模块 多尺度特征融合模块 卷积神经网络
在线阅读 下载PDF
基于RT-GLV的变电站电力人员绝缘手套穿戴检测方法
18
作者 袁杰 万忠原 +3 位作者 加尔肯别克 杨怡程 祁鹏程 陈治润 《郑州大学学报(工学版)》 北大核心 2026年第1期25-32,共8页
变电站电力人员作业穿戴的绝缘手套有目标小、易遮挡的特点,而一般的特征融合网络往往会丢失小目标信息。针对此问题,构建一种多尺度小目标特征融合网络STPFM,对RT-DETR-R18模型进行改进,设计了电力人员绝缘手套穿戴模型RT-GLV。首先,用... 变电站电力人员作业穿戴的绝缘手套有目标小、易遮挡的特点,而一般的特征融合网络往往会丢失小目标信息。针对此问题,构建一种多尺度小目标特征融合网络STPFM,对RT-DETR-R18模型进行改进,设计了电力人员绝缘手套穿戴模型RT-GLV。首先,用STPFM网络代替CCFM网络,利用STPFM网络的SSFF模块、TFE模块融合多尺度特征信息,此外,增加一个以SSFF模块为核心的小目标检测层,增强模型对小目标信息的学习能力;其次,为解决替换的STPFM网络模型参数量过大的问题,构建一种轻量化PB_Block模块,只替换主干网络中包含小目标信息较少的P4、P5层的模块,在轻量化模型的同时,又降低小目标信息的损失;最后,采用PIoUv2损失函数增强模型对难易样本的学习能力。实验结果表明:RT-GLV模型在电力人员绝缘手套穿戴检测中表现优异,与RT-DETR-R18相比,mAP@0.5提高2.1百分点,F 1分数提高1.6百分点,参数量减少21.5%;在小目标检测方面,穿戴绝缘手套的AP@0.5提高1.4百分点,未穿戴绝缘手套的AP@0.5提高6.4百分点,且模型检测速度达到91.3帧/s,满足电力人员绝缘手套穿戴检测的准确性、实时性要求。 展开更多
关键词 绝缘手套 RT-DETR 多尺度融合 轻量化 Powerful-IoU
在线阅读 下载PDF
道路场景下基于多尺度特征融合的语义分割网络
19
作者 徐晓苏 李东蒲 孟焱迪 《中国惯性技术学报》 北大核心 2026年第1期44-51,共8页
针对道路场景下高效图像语义分割的需求,提出一种基于Transformer的多尺度特征融合网络,旨在解决传统卷积神经网络难以有效捕捉图像的长程依赖关系及早期Transformer架构计算冗余且局部感知受限的问题。在编码阶段,采用基于MiT-B1的混合... 针对道路场景下高效图像语义分割的需求,提出一种基于Transformer的多尺度特征融合网络,旨在解决传统卷积神经网络难以有效捕捉图像的长程依赖关系及早期Transformer架构计算冗余且局部感知受限的问题。在编码阶段,采用基于MiT-B1的混合Transformer骨干网络,通过重叠图像块嵌入技术,保持特征的空间连续性,并结合高效自注意力机制降低计算开销。在解码阶段,设计了多尺度特征融合方案,利用通道空间注意力机制增强模型对关键目标的上下文捕捉能力;同时,提出一种轻量级改进残差卷积单元(RCU)提升多尺度特征的转换效率,有效弥补了跨层特征的语义差异。实验结果表明,在保持15.61 M轻量化参数规模的同时,所提算法在Cityscapes、ADE20K和COCO-Stuff数据集上的MIoU精度指标较基准模型分别提升了1.03%、1.36%和2.19%。此外,真实道路场景下的样机实验进一步证明,所提算法能够提供高精度的语义分割结果,满足自动驾驶系统的应用需求。 展开更多
关键词 语义分割 多尺度特征融合 残差卷积单元 混合Transformer编码器
在线阅读 下载PDF
集成全局局部感知与分层特征融合的带钢表面缺陷检测
20
作者 计忠平 林晨伟 +3 位作者 何志伟 杜晨杰 金冉 柴本成 《计算机工程与应用》 北大核心 2026年第4期373-381,共9页
在工业场景中,现有带钢表面缺陷检测算法易受背景噪声和无关信息干扰,难以有效提取缺陷特征。传统多尺度特征融合方法未充分考虑非相邻特征间信息传递不足的问题,限制了特征融合的效果。复杂缺陷形态和缺陷的非结构特性则进一步增加了... 在工业场景中,现有带钢表面缺陷检测算法易受背景噪声和无关信息干扰,难以有效提取缺陷特征。传统多尺度特征融合方法未充分考虑非相邻特征间信息传递不足的问题,限制了特征融合的效果。复杂缺陷形态和缺陷的非结构特性则进一步增加了检测的挑战性。针对这些问题,提出了集成全局局部感知与分层特征融合的带钢表面缺陷检测算法,以提升模型在特征提取、多尺度特征融合及非结构化缺陷检测方面的能力。提出了特征增强模块(feature enhancement module,FEM),通过动态调整特征权重实现对目标特征的强化和背景噪声的抑制,提升模型对带钢表面缺陷信息的关注度。提出分层融合网络(hierarchical fusion network,HFN),充分融合不同层级特征之间的语义信息,提升模型的多尺度特征表达能力。设计全局局部感知模块(global-local awareness module,GLAM),在捕捉远距离依赖和上下文信息的同时,关注局部细节,增强模型对非结构化缺陷的检测能力。在公开数据集NEU-DET与GC10-DET上的结果表明,该算法的平均精度均值(mAP@IoU=50)为80.7%和66.9%,相比于基准模型分别提升了3.8和2.0个百分点,有效提高了带钢表面缺陷的检测精度。 展开更多
关键词 表面缺陷检测 YOLOv8 多尺度特征融合 注意力机制
在线阅读 下载PDF
上一页 1 2 107 下一页 到第
使用帮助 返回顶部