期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
CT-MFENet:Context Transformer and Multi-Scale Feature Extraction Network via Global-Local Features Fusion for Retinal Vessels Segmentation
1
作者 SHAO Dangguo YANG Yuanbiao +1 位作者 MA Lei YI Sanli 《Journal of Shanghai Jiaotong university(Science)》 2025年第4期668-682,共15页
Segmentation of the retinal vessels in the fundus is crucial for diagnosing ocular diseases.Retinal vessel images often suffer from category imbalance and large scale variations.This ultimately results in incomplete v... Segmentation of the retinal vessels in the fundus is crucial for diagnosing ocular diseases.Retinal vessel images often suffer from category imbalance and large scale variations.This ultimately results in incomplete vessel segmentation and poor continuity.In this study,we propose CT-MFENet to address the aforementioned issues.First,the use of context transformer(CT)allows for the integration of contextual feature information,which helps establish the connection between pixels and solve the problem of incomplete vessel continuity.Second,multi-scale dense residual networks are used instead of traditional CNN to address the issue of inadequate local feature extraction when the model encounters vessels at multiple scales.In the decoding stage,we introduce a local-global fusion module.It enhances the localization of vascular information and reduces the semantic gap between high-and low-level features.To address the class imbalance in retinal images,we propose a hybrid loss function that enhances the segmentation ability of the model for topological structures.We conducted experiments on the publicly available DRIVE,CHASEDB1,STARE,and IOSTAR datasets.The experimental results show that our CT-MFENet performs better than most existing methods,including the baseline U-Net. 展开更多
关键词 retinal vessel segmentation context transformer(CT) multi-scale dense residual hybrid loss function global-local fusion
原文传递
基于SCE-YOLO网络的遥感小目标检测
2
作者 付佳俊 丁胜 +1 位作者 刘小明 李琛 《计算机工程与设计》 北大核心 2026年第1期235-243,共9页
为解决遥感图像密集小目标检测问题,提出基于YOLOv8n改进的空间上下文强化网络SCE-YOLO。在特征提取和特征融合之间构建一个高效的空间上下文增强模块SCEM来增强模型的局部特征信息和全局空间上下文感知能力;提出CSRC加强对特征的通道... 为解决遥感图像密集小目标检测问题,提出基于YOLOv8n改进的空间上下文强化网络SCE-YOLO。在特征提取和特征融合之间构建一个高效的空间上下文增强模块SCEM来增强模型的局部特征信息和全局空间上下文感知能力;提出CSRC加强对特征的通道和空间的关注度,来设计特征加权融合模块FWFM;使用加权损失函数降低微小目标对IoU的敏感度,提升微小目标的召回率。在自制的数据集RSOD、公共的AI-TOD微小遥感数据集上进行对比实验,实验结果表明,提出的算法在遥感小目标检测上具有良好的性能。 展开更多
关键词 遥感小目标检测 YOLOv8n 空间上下文强化模块 注意力机制 通道空间加权 特征加权融合模块 加权损失函数
在线阅读 下载PDF
Learning multi-scale attention network for fine-grained visual classification
3
作者 Peipei Zhao Siyan Yang +4 位作者 Wei Ding Ruyi Liu Wentian Xin Xiangzeng Liu Qiguang Miao 《Journal of Information and Intelligence》 2025年第6期492-503,共12页
Fine-grained visual classification(FGVC)is a very challenging task due to distinguishing subcategories under the same super-category.Recent works mainly localize discriminative image regions and capture subtle inter-c... Fine-grained visual classification(FGVC)is a very challenging task due to distinguishing subcategories under the same super-category.Recent works mainly localize discriminative image regions and capture subtle inter-class differences by utilizing attention-based methods.However,at the same layer,most attention-based works only consider large-scale attention blocks with the same size as feature maps,and they ignore small-scale attention blocks that are smaller than feature maps.To distinguish subcategories,it is important to exploit small local regions.In this work,a novel multi-scale attention network(MSANet)is proposed to capture large and small regions at the same layer in fine-grained visual classification.Specifically,a novel multi-scale attention layer(MSAL)is proposed,which generates multiple groups in each feature maps to capture different-scale discriminative regions.The groups based on large-scale regions can exploit global features and the groups based on the small-scale regions can extract local subtle features.Then,a simple feature fusion strategy is utilized to fully integrate global features and local subtle features to mine information that are more conducive to FGVC.Comprehensive experiments in Caltech-UCSD Birds-200-2011(CUB),FGVC-Aircraft(AIR)and Stanford Cars(Cars)datasets show that our method achieves the competitive performances,which demonstrate its effectiveness. 展开更多
关键词 Fine-grained visual classification multi-scale attention network multi-scale attention module Feature fusion strategy
原文传递
面向复杂背景下烟雾火焰检测的改进YOLOv8s算法 被引量:8
4
作者 马耀名 张鹏飞 谭福生 《计算机工程与应用》 北大核心 2025年第3期121-130,共10页
针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计... 针对复杂背景下烟雾火焰目标与背景混淆,导致烟雾火焰检测精度低等问题,提出一种面向复杂背景下烟雾火焰检测的YOLOv8s改进模型。特征通道之间具有高度相似性,为了有效利用跨不同通道间的冗余,提高模型对烟雾火焰目标和背景的区分,设计了C2fFR(C2f with partial rep conv)轻量级特征提取模块。设计了MCFM(multi-scale context fusion module)多尺度上下文融合模块,来捕捉并利用上下文信息,增强特征的表示。使用Inner-SIoU损失函数,解决边界框不匹配的问题,提高模型对高IoU样本的回归能力。实验结果表明,改进后的YOLOv8s烟雾火焰检测模型相比于基线模型YOLOv8s,mAP@50提升了4.6个百分点,mAP@50:95提升了2.3个百分点,模型参数量降低了18.9%,计算量降低了8.1%,FPS为93帧/s,与其他主流检测算法相比也具有较好的检测性能。 展开更多
关键词 YOLOv8s C2fFR 多尺度上下文融合 Inner-SIoU
在线阅读 下载PDF
基于改进TransUNet的肺部图像分割
5
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
基于改进RT-DETR的原油库指针式仪表检测方法
6
作者 张岩 张林军 +3 位作者 汪靖哲 李新月 张永雪 魏子心 《吉林大学学报(信息科学版)》 2025年第6期1352-1362,共11页
针对在原油库较为复杂的环境下,受不同的外界干扰因素的影响和现有硬件设备资源有限的限制,导致仪表定位检测时模型的精度低、计算复杂度高,难以推广应用的问题,提出了一种以RT-DETR(Real-Time Detection Transformer)为基础网络的原油... 针对在原油库较为复杂的环境下,受不同的外界干扰因素的影响和现有硬件设备资源有限的限制,导致仪表定位检测时模型的精度低、计算复杂度高,难以推广应用的问题,提出了一种以RT-DETR(Real-Time Detection Transformer)为基础网络的原油库指针式仪表定位方法。首先,引入FasterNet网络对仪表输入图像的部分通道进行特征提取,模型的参数量和计算复杂度明显减小;其次,引入HiLo注意力模块,通过两条路径分别对指针与刻度细节区域和表盘平滑区域进行特征选择,增强了模型对仪表关键特征的提取能力;最后,为了增强多尺度特征融合的能力,充分利用仪表的特征信息,引入基于上下文信息特征融合模块(CGFM:Context-Guide Fusion Module),进一步提升模型的鲁棒性。实验结果表明,仪表的检测精度达到了97.6%,模型的参数量为10.91 MByte,相较于YOLO(You Only Look Once)目标检测模型,具有很大的优势。 展开更多
关键词 指针式仪表 实时目标检测模型 快速神经网络 高低频注意力机制 基于上下文信息的特征融合模块
在线阅读 下载PDF
Modulation recognition network of multi-scale analysis with deep threshold noise elimination
7
作者 Xiang LI Yibing LI +1 位作者 Chunrui TANG Yingsong LI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2023年第5期742-758,共17页
To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning... To improve the accuracy of modulated signal recognition in variable environments and reduce the impact of factors such as lack of prior knowledge on recognition results,researchers have gradually adopted deep learning techniques to replace traditional modulated signal processing techniques.To address the problem of low recognition accuracy of the modulated signal at low signal-to-noise ratios,we have designed a novel modulation recognition network of multi-scale analysis with deep threshold noise elimination to recognize the actually collected modulated signals under a symmetric cross-entropy function of label smoothing.The network consists of a denoising encoder with deep adaptive threshold learning and a decoder with multi-scale feature fusion.The two modules are skip-connected to work together to improve the robustness of the overall network.Experimental results show that this method has better recognition accuracy at low signal-to-noise ratios than previous methods.The network demonstrates a flexible self-learning capability for different noise thresholds and the effectiveness of the designed feature fusion module in multi-scale feature acquisition for various modulation types. 展开更多
关键词 Signal noise elimination Deep adaptive threshold learning network multi-scale feature fusion modulation ecognition
原文传递
基于改进PV-RCNN的3D目标检测算法实验研究 被引量:5
8
作者 傅荟璇 刘凌风 王宇超 《实验技术与管理》 CAS 北大核心 2022年第2期23-28,共6页
3D目标检测结合了深度信息,能够提供目标的位置、方向和大小等空间场景信息,在自动驾驶和机器人领域发展迅速。针对PV-RCNN在3D目标检测时不能够充分适应不同的物体尺度、不同的点云密度、部分变形和杂波等问题,对3D目标检测的任务进行... 3D目标检测结合了深度信息,能够提供目标的位置、方向和大小等空间场景信息,在自动驾驶和机器人领域发展迅速。针对PV-RCNN在3D目标检测时不能够充分适应不同的物体尺度、不同的点云密度、部分变形和杂波等问题,对3D目标检测的任务进行实验研究。通过加入自适应可变形卷积、上下文融合模块和Gumbel Subset Sampling模块来训练层级特征,使得编码关键点自适应地朝着最具有判别和代表性的特征对齐,提高提案框回归精度。实验结果表明,改进后的PV-RCNN 3D目标检测精度得到了提升,尤其是在远距离物体识别和检测方面。 展开更多
关键词 3D检测 PV-RCNN 自适应可变形卷积 上下文融合模块
在线阅读 下载PDF
基于全局上下文的特定舞蹈动作识别方法研究 被引量:4
9
作者 毕雪超 《微型电脑应用》 2020年第10期21-23,共3页
为了提升机器视觉中特定舞蹈动作识别的性能,设计了基于全局上下文的特定舞蹈动作识别方法。该方法基于Hourglass结构,通过连接高低分辨率的特征图,将具备全局信息的深层特征图上采样与浅层特征融合,使得每一个阶段的高分辨率特征图均... 为了提升机器视觉中特定舞蹈动作识别的性能,设计了基于全局上下文的特定舞蹈动作识别方法。该方法基于Hourglass结构,通过连接高低分辨率的特征图,将具备全局信息的深层特征图上采样与浅层特征融合,使得每一个阶段的高分辨率特征图均具有低分辨率的特征图表示,从而得到信息更丰富的高分辨率特征图表示,最终回归人体姿态热力图。在Balletto舞蹈视频数据库中的测试结果表明,相比基于CPN和基于Hourglass的算法,所提算法的AP值提高2.4%,AR提升了1.6%。 展开更多
关键词 HOURGLASS 残差模块 向上连接 全局上下文信息 多尺度特征融合
在线阅读 下载PDF
基于双阶段特征解耦网络的单幅图像去雨方法 被引量:1
10
作者 汤红忠 熊珮全 +2 位作者 王蔚 王晒雅 陈磊 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期273-282,共10页
针对现有的单幅图像去雨方法无法有效地平衡背景图像细节恢复与有雨分量去除问题,提出一种基于双阶段特征解耦网络的单幅图像去雨方法,采用渐进式的学习方式从粗到细分阶段进行单幅图像去雨.首先构建压缩激励残差模块,实现背景图像与有... 针对现有的单幅图像去雨方法无法有效地平衡背景图像细节恢复与有雨分量去除问题,提出一种基于双阶段特征解耦网络的单幅图像去雨方法,采用渐进式的学习方式从粗到细分阶段进行单幅图像去雨.首先构建压缩激励残差模块,实现背景图像与有雨分量的初步分离;然后设计全局特征融合模块,其中特别引入特征解耦模块分离有雨分量和背景图像的特征,实现细粒度的图像去雨;最后利用重构损失、结构相似损失、边缘感知损失和纹理一致性损失构成的复合损失函数训练网络,实现高质量的无雨图像重构.实验结果表明,在Test100合成雨图数据集上,所提方法峰值信噪比为25.57dB,结构相似性为0.89;在100幅真实雨图上,所提方法的自然图像质量评估器为3.53,无参考图像空间质量评估器为20.16;在去雨后的RefineNet目标分割任务中,平均交并比为29.41%,平均像素精度为70.06%;视觉效果上,该方法能保留更多的背景图像特征,有效地辅助下游的目标分割任务的开展. 展开更多
关键词 特征解耦网络 压缩激励残差模块 全局特征融合模块 复合损失函数 单幅图像去雨
在线阅读 下载PDF
面向城市复杂场景的多尺度监督融合变化检测
11
作者 潘建平 谢鹏 +2 位作者 郭志豪 林娜 张慧娟 《遥感信息》 CSCD 北大核心 2024年第4期23-32,共10页
城市复杂场景中,地物形状多样,光照和成像角度变化大会导致变化检测结果受到干扰。为解决这些问题,文章提出了一种双上下文多尺度监督融合的网络模型(dual context multi-scale supervised fusion network model,DCMSFNet)。首先,在编... 城市复杂场景中,地物形状多样,光照和成像角度变化大会导致变化检测结果受到干扰。为解决这些问题,文章提出了一种双上下文多尺度监督融合的网络模型(dual context multi-scale supervised fusion network model,DCMSFNet)。首先,在编码部分使用双上下文增强模块获得地物丰富的全局上下文信息。在解码部分,采用级联的方法组合特征,然后通过自适应注意力模块捕捉不同尺度的变化关系,设计多尺度监督融合模块,增强深度网络融合,获得具有更高辨别能力的变化区域特征,将不同层级的输出结果与主网络的重构变化图融合形成最终的变化检测结果。该模型在LEVIR-CD和SYSU-CD变化检测数据集取得了较好的结果,F1-score分别提高了1.58%和2.17%,可更加精确识别复杂场景的变化区域,进一步减少无关因素引起的误检和漏检,且对目标地物边缘的检测更加平滑。 展开更多
关键词 深度学习 变化检测 双上下文增强 自适应注意力模块 多尺度监督融合
在线阅读 下载PDF
基于深度学习的三维肿瘤及器官分割
12
作者 顾德 王宁 +1 位作者 张寅斌 刘乐 《中国医学物理学杂志》 CSCD 2024年第9期1122-1128,共7页
针对三维医学图像中由于肿瘤或器官的形状、尺度差异较大导致分割精度较低的问题,提出一种端到端的三维全卷积分割模型。首先,设计空洞立方集成模块在不同分辨率阶段实现多尺度集成,增强复杂边界上的识别能力;其次,引入跨阶段上下文融... 针对三维医学图像中由于肿瘤或器官的形状、尺度差异较大导致分割精度较低的问题,提出一种端到端的三维全卷积分割模型。首先,设计空洞立方集成模块在不同分辨率阶段实现多尺度集成,增强复杂边界上的识别能力;其次,引入跨阶段上下文融合模块融合浅层和深层特征,促进收敛并更准确地定位目标对象;最后,解码器对来自编码器的特征进行拼接以实现分割。在脑肿瘤分割数据集上,平均Dice相似性系数值达到85.37%;在腹部器官分割数据集上,平均Dice相似性系数值达到83.99%。实验结果表明所提模型在三维肿瘤和器官的分割上具有较高精度。 展开更多
关键词 肿瘤分割 器官分割 三维卷积神经网络 空洞立方集成模块 跨阶段上下文融合模块
在线阅读 下载PDF
基于光场焦点堆栈的鲁棒深度估计 被引量:3
13
作者 吉新新 朴永日 +2 位作者 张淼 贾令尧 李培华 《计算机学报》 EI CAS CSCD 北大核心 2022年第6期1226-1240,共15页
传统的深度估计方法通常利用普通相机记录的二维图像进行单目或多目深度估计.因这种方式仅利用了光线的强度信息,忽略了它的方向信息,其深度估计的效果并不理想.相比之下,光场记录的信息不仅包含了光线的强度信息,还包含了方向信息.因此... 传统的深度估计方法通常利用普通相机记录的二维图像进行单目或多目深度估计.因这种方式仅利用了光线的强度信息,忽略了它的方向信息,其深度估计的效果并不理想.相比之下,光场记录的信息不仅包含了光线的强度信息,还包含了方向信息.因此,基于深度学习的光场深度估计方法越来越引起该领域研究人员的关注,现已成为深度估计方向的研究热点.然而,目前大部分的研究工作从极平面图像(EPI)或子孔径图像着手进行深度估计,而不能有效利用焦点堆栈含有的丰富深度信息.为此,本文提出了基于光场焦点堆栈的鲁棒深度估计方法.本文设计了一种上下文推理单元(CRU),它能够有效地挖掘焦点堆栈和RGB图像的内部空间相关性.同时,本文提出了注意力引导的跨模态融合模块(CMFA),对上下文推理单元提取的空间相关性信息进行有效融合.为了验证本方法的准确性,在DUT-LFDD和LFSD数据集上进行了广泛的验证.实验结果表明,本文方法的准确率相比现有的EPINet和PADMM分别提高了1.2%和2.25%.为进一步证明本方法的有效性,我们在现有公开的手机数据集上进行了反复的测试.可视化测试结果表明,本方法在普通消费级手机获取的图像上亦可取得满意的效果,能够适应现实应用场景. 展开更多
关键词 光场 焦点堆栈 上下文推理单元 注意力机制 跨模态融合模块
在线阅读 下载PDF
基于改进型SSD算法的空瓶表面缺陷检测 被引量:6
14
作者 吴华运 任德均 +3 位作者 付磊 郜明 吕义昭 邱吕 《计算机与现代化》 2020年第4期121-126,共6页
注塑空瓶在生产过程中瓶身表面会产生大量缺陷,这些缺陷对产品的外观和使用造成重要的影响。传统的人工检测由于劳动强度高、检测效率低等缺点已不适用,基于机器视觉的传统检测算法对于复杂的场景变化,所提取的特征通常很难用于缺陷分... 注塑空瓶在生产过程中瓶身表面会产生大量缺陷,这些缺陷对产品的外观和使用造成重要的影响。传统的人工检测由于劳动强度高、检测效率低等缺点已不适用,基于机器视觉的传统检测算法对于复杂的场景变化,所提取的特征通常很难用于缺陷分类和识别。因此,提出一种基于SSD算法,对注塑空瓶表面缺陷进行检测。考虑空瓶表面缺陷较小,特征难以提取,为提高检测效果,在SSD网络结构中加入特征融合模块,为预测层提供丰富的语义特征;同时在网络中引入注意力机制,增加网络的特征提取能力,有效地提高网络的检测精度。通过用空瓶表面缺陷数据集对本文的方法进行验证,准确率为98.3%,漏检率为0.74%,误检率为0.96%,mAP为96.5%,相比原始的SSD算法的mAP,本文算法提高了近5.6个百分点。 展开更多
关键词 缺陷检测 卷积神经网络 注意力机制 尺度特征融合模块 全局上下文模块
在线阅读 下载PDF
基于双分支交互的实时语义分割算法 被引量:1
15
作者 杨迪 陈春雨 《应用科技》 CAS 2024年第2期48-55,共8页
针对双分支实时语义分割算法存在双分支交互差、多尺度上下文信息提取不完善等问题,提出了基于双分支交互的实时语义分割网络(dual-branch interactive multi-scale fusion network for real-time semantic segmentation,DIMFNet)。算... 针对双分支实时语义分割算法存在双分支交互差、多尺度上下文信息提取不完善等问题,提出了基于双分支交互的实时语义分割网络(dual-branch interactive multi-scale fusion network for real-time semantic segmentation,DIMFNet)。算法以引导聚合双边语义分割网络(bilateral network with guided aggregation for real-time semantic segmentation,BiseNetV2)的双分支结构为基准进行改进,空间分支提取空间细节特征,上下文分支提取深层上下文特征。结合注意力思想提出注意力引导高级语义融合模块(attention guide high-level semantics fusion module,AGHSM)实现双分支的交互融合,以获得更好的空间特征表示;对金字塔池化模块进行改进,提出采用多层聚合金字塔池化模块(multi-layer aggregation pyramid pooling module,MAPPM)提取多尺度上下文特征,以获得更好的上下文特征表示。算法在Cityscapes数据集上进行消融实验并与现有实时语义分割网络进行对比,验证了各模块的有效性,以124.5 f/s达到了77.9%的平均交并比(mean intersection over union,MIoU);在CamVid数据集上以211.1 f/s达到了75.1%的MIoU。相比现有的实时语义分割网络,本文算法更好地权衡了分割的精度和速度。 展开更多
关键词 实时语义分割 空间分支 上下文分支 特征融合 注意力机制 多尺度特征提取 池化金字塔 深度监督
在线阅读 下载PDF
SwinEA:融合边缘感知的医学图像分割网络 被引量:4
16
作者 叶晋豫 李娇 +2 位作者 邓红霞 张瑞欣 李海芳 《计算机工程与设计》 北大核心 2024年第4期1149-1156,共8页
基于卷积神经网络的方法在医学图像分割任务中取得了显著成果,但该方法固有的归纳偏置使其不能很好地学习全局和长距离的语义信息交互,而Transformer的优势是关注全局信息,两者可以优势互补。因此提出一种针对分割边缘利用Swin Transfor... 基于卷积神经网络的方法在医学图像分割任务中取得了显著成果,但该方法固有的归纳偏置使其不能很好地学习全局和长距离的语义信息交互,而Transformer的优势是关注全局信息,两者可以优势互补。因此提出一种针对分割边缘利用Swin Transformer融合边缘感知的医学图像分割网络。设计基于上下文金字塔的边缘感知模块,用于融合全局的多尺度的上下文信息,针对边缘和角落等局部特征,利用浅层深度主干的特征产生丰富的边缘特征,因此提出的边缘感知模块可以尽可能多地产生边缘特征。在腹部多器官分割任务和心脏分割数据集的实验结果表明,该方法在各项指标中都有所提高。 展开更多
关键词 医学图像分割 移动窗口变形器 多头自注意力 边缘感知模块 上下文金字塔 多尺度特征 深度学习网络
在线阅读 下载PDF
融合多层次浅层信息的航拍小目标检测 被引量:1
17
作者 秦云飞 崔晓龙 +1 位作者 程林 樊继东 《计算机系统应用》 2024年第2期176-187,共12页
针对小目标检测及目标被遮挡的问题,本文基于VisDrone2019数据集构建相应交通场景,提出一种小目标检测算法.首先,充分利用主干网络的浅层特征改善小目标漏检的问题,通过在YOLOv7算法原有的网络结构上增加小目标检测层P2,并在P2小目标检... 针对小目标检测及目标被遮挡的问题,本文基于VisDrone2019数据集构建相应交通场景,提出一种小目标检测算法.首先,充分利用主干网络的浅层特征改善小目标漏检的问题,通过在YOLOv7算法原有的网络结构上增加小目标检测层P2,并在P2小目标检测层的模型上为特征融合网络添加多层次浅层信息融合模块,从而提高算法小目标检测效果.其次,使用全局上下文模块构建目标与全局上下文的联系,增强模型区分目标与背景的能力,改善目标因遮挡而出现特征缺失情况下的被检测效果.最后,本文采用专为小目标设计的损失函数NWD代替基线模型中的CIoU损失函数,从而解决了IoU本身及其扩展对微小物体的位置偏差非常敏感的问题.实验表明,改进后的YOLOv7模型在航拍小目标数据集VisDrone2019(测试集和验证集)上面mAP.5:.95分别有2.3%和2.8%的提升,取得了十分优异的检测效果. 展开更多
关键词 浅层特征 全局上下文模块 NWD损失函数 小目标检测 特征融合 目标检测
在线阅读 下载PDF
基于局部特征增强的视网膜血管分割
18
作者 王倩 辛月兰 《激光杂志》 CAS 北大核心 2024年第4期216-222,共7页
视网膜血管具有细小复杂的特点,在对其进行分割时,经常出现噪点、断裂和欠分割等问题。针对此现象,提出一种基于局部特征增强的轻量化网络LRU-Net,以捕获更多细小血管特征。首先,在通道注意力模块中加入特征提取模块,对输入特征进行二... 视网膜血管具有细小复杂的特点,在对其进行分割时,经常出现噪点、断裂和欠分割等问题。针对此现象,提出一种基于局部特征增强的轻量化网络LRU-Net,以捕获更多细小血管特征。首先,在通道注意力模块中加入特征提取模块,对输入特征进行二次特征提取,以得到更多的细节特征;其次,设计了一个特征融合模块,在解码器中能更有效地融合高级和低级特性,加强最终的特征表示;最后,设计了一个上下文聚合模块,提取最深层特征不同分辨率的多尺度信息,然后进行拼接,使进入上采样的输入特征更加细化。在FIVES和OCTA-500数据集上的实验结果表明,与基础网络U-Net相比,本文所提方法在做到轻量化的同时,视网膜血管分割的准确度也有了一定的提升,在两个数据集上分别达到了98.45%、97.05%。 展开更多
关键词 特征增强 特征融合模块 上下文聚合模块 视网膜血管分割
原文传递
An improved multiscale fusion dense network with efficient multiscale attention mechanism for apple leaf disease identification 被引量:1
19
作者 Dandan DAI Hui LIU 《Frontiers of Agricultural Science and Engineering》 2025年第2期173-189,共17页
With the development of smart agriculture,accurately identifying crop diseases through visual recognition techniques instead of by eye has been a significant challenge.This study focused on apple leaf disease,which is... With the development of smart agriculture,accurately identifying crop diseases through visual recognition techniques instead of by eye has been a significant challenge.This study focused on apple leaf disease,which is closely related to the final yield of apples.A multiscale fusion dense network combined with an efficient multiscale attention(EMA)mechanism called Incept_EMA_DenseNet was developed to better identify eight complex apple leaf disease images.Incept_EMA_DenseNet consists of three crucial parts:the inception module,which substituted the convolution layer with multiscale fusion methods in the shallow feature extraction layer;the EMA mechanism,which is used for obtaining appropriate weights of different dense blocks;and the improved DenseNet based on DenseNet_121.Specifically,to find appropriate multiscale fusion methods,the residual module and inception module were compared to determine the performance of each technique,and Incept_EMA_DenseNet achieved an accuracy of 95.38%.Second,this work used three attention mechanisms,and the efficient multiscale attention mechanism obtained the best performance.Third,the convolution layers and bottlenecks were modified without performance degradation,reducing half of the computational load compared with the original models.Incept_EMA_DenseNet,as proposed in this paper,has an accuracy of 96.76%,being 2.93%,3.44%,and 4.16%better than Resnet50,DenseNet_121 and GoogLeNet,respectively,proved to be reliable and beneficial,and can effectively and conveniently assist apple growers with leaf disease identification in the field. 展开更多
关键词 Incept_EMA_DenseNet multi-scale fusion module efficient multiscale attention mechanism apple leaf disease identification
原文传递
基于光流信息融合的无监督视频目标分割网络
20
作者 文彪 张惊雷 《天津理工大学学报》 2024年第6期94-101,共8页
随着机器学习特别是深度学习理论和算法的不断发展和视频数据的大量积累,采用无标签视频信息的无监督学习算法取得了长足进步。提出了一种融合光流信息的双流无监督学习视频目标分割网络。首先,将视频序列中的随机帧和与之对应的由光流... 随着机器学习特别是深度学习理论和算法的不断发展和视频数据的大量积累,采用无标签视频信息的无监督学习算法取得了长足进步。提出了一种融合光流信息的双流无监督学习视频目标分割网络。首先,将视频序列中的随机帧和与之对应的由光流网络生成的光流图分别输入到残差神经(residual networks,ResNet)主干网络,形成帧特征图和对应的帧间光流特征图。其次,为克服共同移动的背景信息对分割精度的影响,设计了目标位置信息融合模块(position information fusion,PIF),将输入视频帧和光流进行位置信息融合,在得到主要目标位置的同时,降低了背景噪声信号对分割的影响。最后,设计空间通道上下文信息融合注意力机制模块(spatial channel context information fusion,SCCF),将帧特征和光流特征的上下文信息与经典的空间通道注意力机制进行了融合。在DAVIS-16数据集上的实验表明,文中网络的平均区域相似性指标可达89.6,平均边界精度指标可达87.0,两项指标均达到该领域的最高水平。 展开更多
关键词 无监督学习 光流 视频目标分割 目标位置信息交互模块 空间通道上下文信息融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部