期刊文献+
共找到233篇文章
< 1 2 12 >
每页显示 20 50 100
Automatic Segmentation Method for Cone-Beam Computed Tomography Image of the Bone Graft Region within Maxillary Sinus Based on the Atrous Spatial Pyramid Convolution Network 被引量:1
1
作者 XU Jiangchang HE Shamin +2 位作者 YU Dedong WU Yiqun CHEN Xiaojun 《Journal of Shanghai Jiaotong university(Science)》 EI 2021年第3期298-305,共8页
Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the B... Sinus floor elevation with a lateral window approach requires bone graft(BG)to ensure sufficient bone mass,and it is necessary to measure and analyse the BG region for follow-up of postoperative patients.However,the BG region from cone-beam computed tomography(CBCT)images is connected to the margin of the maxillary sinus,and its boundary is blurred.Common segmentation methods are usually performed manually by experienced doctors,and are complicated by challenges such as low efficiency and low precision.In this study,an auto-segmentation approach was applied to the BG region within the maxillary sinus based on an atrous spatial pyramid convolution(ASPC)network.The ASPC module was adopted using residual connections to compose multiple atrous convolutions,which could extract more features on multiple scales.Subsequently,a segmentation network of the BG region with multiple ASPC modules was established,which effectively improved the segmentation performance.Although the training data were insufficient,our networks still achieved good auto-segmentation results,with a dice coefficient(Dice)of 87.13%,an Intersection over Union(Iou)of 78.01%,and a sensitivity of 95.02%.Compared with other methods,our method achieved a better segmentation effect,and effectively reduced the misjudgement of segmentation.Our method can thus be used to implement automatic segmentation of the BG region and improve doctors’work efficiency,which is of great importance for developing preliminary studies on the measurement of postoperative BG within the maxillary sinus. 展开更多
关键词 atrous spatial pyramid convolution(ASPC) bone graft(BG)region medical image segmentation residual connection
原文传递
M2ANet:Multi-branch and multi-scale attention network for medical image segmentation 被引量:1
2
作者 Wei Xue Chuanghui Chen +3 位作者 Xuan Qi Jian Qin Zhen Tang Yongsheng He 《Chinese Physics B》 2025年第8期547-559,共13页
Convolutional neural networks(CNNs)-based medical image segmentation technologies have been widely used in medical image segmentation because of their strong representation and generalization abilities.However,due to ... Convolutional neural networks(CNNs)-based medical image segmentation technologies have been widely used in medical image segmentation because of their strong representation and generalization abilities.However,due to the inability to effectively capture global information from images,CNNs can easily lead to loss of contours and textures in segmentation results.Notice that the transformer model can effectively capture the properties of long-range dependencies in the image,and furthermore,combining the CNN and the transformer can effectively extract local details and global contextual features of the image.Motivated by this,we propose a multi-branch and multi-scale attention network(M2ANet)for medical image segmentation,whose architecture consists of three components.Specifically,in the first component,we construct an adaptive multi-branch patch module for parallel extraction of image features to reduce information loss caused by downsampling.In the second component,we apply residual block to the well-known convolutional block attention module to enhance the network’s ability to recognize important features of images and alleviate the phenomenon of gradient vanishing.In the third component,we design a multi-scale feature fusion module,in which we adopt adaptive average pooling and position encoding to enhance contextual features,and then multi-head attention is introduced to further enrich feature representation.Finally,we validate the effectiveness and feasibility of the proposed M2ANet method through comparative experiments on four benchmark medical image segmentation datasets,particularly in the context of preserving contours and textures. 展开更多
关键词 medical image segmentation convolutional neural network multi-branch attention multi-scale feature fusion
原文传递
基于改进YOLOv7的带式输送机输送带破损检测
3
作者 李杰 庄子悦 +2 位作者 苗长云 李现国 刘意 《天津工业大学学报》 北大核心 2026年第1期70-78,84,共10页
针对目前带式输送机输送带破损检测存在准确率低、可靠性差等问题,提出了基于改进YOLOv7的带式输送机输送带破损检测方法。改进YOLOv7网络结构,在Backbone和Head中间引入基于通道和空间的卷积注意力机制(CBAM),抑制不相关细节,降低漏检... 针对目前带式输送机输送带破损检测存在准确率低、可靠性差等问题,提出了基于改进YOLOv7的带式输送机输送带破损检测方法。改进YOLOv7网络结构,在Backbone和Head中间引入基于通道和空间的卷积注意力机制(CBAM),抑制不相关细节,降低漏检率;在Head部分引入坐标卷积(CoordConv),改善对空间关系的理解,提高对于小目标特征的提取能力;在Head的E-ELAN中引入可切换的空洞卷积(SAConv),丰富感受野,提高处理不同尺寸破损的能力;设计了带式输送机输送带破损检测系统,将训练好的改进YOLOv7模型部署到Jetson Nano,并进行试验验证该系统的检测性能。结果表明:改进YOLOv7模型检测召回率均值为88.7%,精确率均值为92.8%,平均准确率均值为93.8%,与原模型相比分别提高了3.4、1.4、1.8个百分点;对裂纹、磨损、鼓泡、孔洞4种故障检测的召回率分别为94.0%、84.1%、82.2%、94.5%,与原模型相比分别提高了1.0、5.4、1.7、5.5个百分点;带式输送机输送带破损检测系统对4种破损的识别速度约为15帧/s,能够有效检测输送带破损。 展开更多
关键词 带式输送机 输送带破损检测 改进YOLOv7网络模型 可切换的空洞卷积 Jetson Nano嵌入式系统
在线阅读 下载PDF
BurdenNet:先验信息导引的复杂环境下高炉多态料面目标检测网络
4
作者 倪梓明 陈先中 +1 位作者 侯庆文 张洁 《工程科学学报》 北大核心 2026年第1期26-38,共13页
传统的单一状态料面目标检测网络未能考虑高炉冶炼状态的交替变化,在复杂环境下整体准确度较低,针对上述问题,本文提出一种先验信息导引的多态料面目标检测网络BurdenNet.首先,提出基于原始信号距离向精度的图像预分类方法,构建三类典... 传统的单一状态料面目标检测网络未能考虑高炉冶炼状态的交替变化,在复杂环境下整体准确度较低,针对上述问题,本文提出一种先验信息导引的多态料面目标检测网络BurdenNet.首先,提出基于原始信号距离向精度的图像预分类方法,构建三类典型状态的料面图像数据集,并以预分类的状态为先验信息对网络通路进行剪枝.其次,将料面细长低曲率的形状特征与雷达采样信号的稀疏性质作为先验信息,提出空洞垂直偏移卷积(Atrous vertical deformable convolution,AVDC)模块提取多态料面特征.在此基础上,利用机械探尺数据构建先验空间注意力特征图,提出先验聚焦注意力(Prior focusing attention,PFA)模块,使网络优先聚焦于图像中的料面区域.最后对于边界框的回归,提出条带交并比(Band intersection over union,BIOU)损失函数进一步提升目标检测的速度与准确性.在钢铁公司高炉的实测数据上进行实验,结果表明,本文的BurdenNet相较于单一状态目标检测网络,在多态料面数据集上整体精确率提升了13.9%与5.2%,综合性能(F1-Score)提升了8.1%与4.3%,为复杂环境下多态料面图像的目标检测提供更准确的方法. 展开更多
关键词 多态料面 先验信息 空洞垂直偏移卷积 先验聚焦注意力 网络剪枝
在线阅读 下载PDF
基于YOLO-SAGF的安全生产巡检仪表自动读数识别方法
5
作者 王妍玮 王钰 +3 位作者 吕东翰 金戈 关磊 靳玉龙 《中国安全生产科学技术》 北大核心 2026年第2期87-96,共10页
为解决复杂工业环境下仪表自动读数易受光照变化、粉尘干扰及安装位置多变影响,而导致的定位与识别精度不足问题,提出1种基于YOLO-SAGF的数字式仪表识别方法。该方法将SAConv模块引入C3k2结构,通过多空洞率卷积扩大感受野,增强网络对多... 为解决复杂工业环境下仪表自动读数易受光照变化、粉尘干扰及安装位置多变影响,而导致的定位与识别精度不足问题,提出1种基于YOLO-SAGF的数字式仪表识别方法。该方法将SAConv模块引入C3k2结构,通过多空洞率卷积扩大感受野,增强网络对多尺度与复杂特征的建模能力,并在检测头前引入全局注意力机制模块,强化全局维度特征交互并减少信息损失,提升特征表达能力,同时采用Focaler-IoU损失函数,缓解正负样本不平衡问题对边界框回归的影响,提高难样本关注度与回归精度。将目标定位结果输入训练完成的Paddle OCR字符识别模型中,从而实现数字式仪表读数任务。基于数字式仪表数据集进行对比实验与消融实验。研究结果表明:YOLO-SAGF算法定位仪表精度达到87.3%,分别比YOLOv11和YOLOv12提高了1.5%,2%,表计读数识别精度达到89%,满足实时性的要求。研究结果可有效提升安全生产巡检场景中数字式仪表读数的自动化水平,为数字式仪表识别问题提供了新的解决思路。 展开更多
关键词 目标检测 全局注意力机制 空洞卷积 光学字符识别 数字式仪表
在线阅读 下载PDF
航空发动机涡轮叶片表面缺陷内窥视觉SH+YOLOv8检测识别研究
6
作者 邹佳明 刘桂雄 黎文富 《中国测试》 北大核心 2026年第2期121-127,共7页
航空发动机涡轮叶片(aero-engine turbine blades,ATB)表面缺陷直接关系发动机运行安全、服役寿命。传统人工检测方法存在准确性不稳定、效率低、劳动强度大等问题。该文提出一种结合SH(switchable atrous convolution+high-level scree... 航空发动机涡轮叶片(aero-engine turbine blades,ATB)表面缺陷直接关系发动机运行安全、服役寿命。传统人工检测方法存在准确性不稳定、效率低、劳动强度大等问题。该文提出一种结合SH(switchable atrous convolution+high-level screening-feature fusion pyramid networks)与YOLOv8的ATB表面缺陷检测识别方法。在骨干网络中引入SAConv以增强多尺度特征提取能力;在颈部网络中嵌入HS-FPN以提升特征融合与缺陷表征能力。基于自建涡轮叶片内窥图像数据集开展实验,结果显示改进后SH+YOLOv8模型在F1-score、mAP@0.5上分别达到0.93、0.948,其中mAP@0.5相较原始YOLOv8提升0.64%,能满足工程应用精度需求。研究表明该方法在复杂工况下具备良好适应性、鲁棒性,对航空发动机关键部件智能检测具有参考价值。 展开更多
关键词 航空发动机涡轮叶片 表面缺陷检测 YOLOv8 可切换空洞卷积 特征融合
在线阅读 下载PDF
基于无监督学习的古建筑景深估计方法研究
7
作者 郭祯霞 胡立华 +2 位作者 朵安鹏 阴文庄 胡建华 《计算机与数字工程》 2026年第1期237-242,共6页
针对结构复杂、纹理重复的对象,目前无监督学习的单目深度估计算法存在轮廓畸变、细节模糊以及“孔洞”现象等问题。基于SC-Depth模型,提出一种结合注意力和多尺度特征融合的景深估计模型,优化不同尺度特征的提取和融合。以颐和园景区... 针对结构复杂、纹理重复的对象,目前无监督学习的单目深度估计算法存在轮廓畸变、细节模糊以及“孔洞”现象等问题。基于SC-Depth模型,提出一种结合注意力和多尺度特征融合的景深估计模型,优化不同尺度特征的提取和融合。以颐和园景区图像为数据集对象,相较于目前的无监督深度估计算法,该模型深度估计的准确率在不同阈值下分别达到了93.2%,96.3%,98.2%,可视化深度图显示边缘更加锐利,细节更加清晰,进一步验证了模型的有效性。 展开更多
关键词 单目深度估计 无监督学习 通道注意力 空洞卷积
在线阅读 下载PDF
基于ASPP-UNet的地震波阻抗反演方法
8
作者 岳碧波 颜鹏 +1 位作者 杜彦志 周强 《石油地球物理勘探》 北大核心 2026年第1期1-16,共16页
深度学习以其强大的非线性映射问题处理能力而在地震波阻抗反演中得到了广泛的关注。常规深度学习地震波阻抗反演方法存在对标记数据过于依赖,尤其当训练测井数据不足时存在反演模型局部特征的提取能力下降、精度不足的问题。为此,提出... 深度学习以其强大的非线性映射问题处理能力而在地震波阻抗反演中得到了广泛的关注。常规深度学习地震波阻抗反演方法存在对标记数据过于依赖,尤其当训练测井数据不足时存在反演模型局部特征的提取能力下降、精度不足的问题。为此,提出了一种基于空洞空间金字塔池化的U-Net网络(ASPP-UNet)地震波阻抗反演方法,利用金字塔池化方法增强U-Net网络的多尺度特征提取能力,据此利用地震记录数据和少数测井数据构建训练集。为了验证所提方法的有效性,将其应用在Marmousi2和SEAM两种公开测试数据的地震波阻抗反演中,每组测试试验均与CNN、U-Net、Attention-UNet三种深度学习地震波阻抗反演结果进行对比。实验结果均表明,在同等实验条件下,该方法得到的单道波阻抗反演结果高频细节成分更丰富,反演波阻抗剖面在层间及断层处纵向连接平滑;反演结果对标记数据的依赖性低,在远离训练测井位置处信息丢失最少,表现为反演结果剖面的道间横向连续性好,各项统计指标均优于其他三种对比方法。为进一步验证所提方法的可行性,将其应用于四川省东部实际勘探数据地震波阻抗反演,其准确度均优于上述三种对比方法,所得波阻抗剖面与实际地质特征更吻合,波阻抗误差最小。 展开更多
关键词 波阻抗反演 ASPP-UNet 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
基于改进DBNet的碑帖文本检测算法
9
作者 王景玉 《计算机应用文摘》 2026年第4期79-84,共6页
针对碑帖文本图像中噪声干扰严重、文本区域难以准确检测的问题,提出了一种基于改进DBNet的碑帖文本检测算法。首先,设计了特征提取模块FEM(Feature Extraction Module),通过引入空洞卷积替代标准卷积,以提取更多语义特征信息。同时,在... 针对碑帖文本图像中噪声干扰严重、文本区域难以准确检测的问题,提出了一种基于改进DBNet的碑帖文本检测算法。首先,设计了特征提取模块FEM(Feature Extraction Module),通过引入空洞卷积替代标准卷积,以提取更多语义特征信息。同时,在特征融合部分加入了CBAM(Convolutional Block Attention Module)注意力模块,以获得更加鲁棒的多尺度融合特征图。最后,使用收敛速度更快的tanh函数优化原网络中的可微二值化函数。实验结果表明,该改进算法在准确率、召回率和F1值方面分别比DBNet网络提升了5.1%,3.3%和4.8%;模型大小为60.4 MB,FPS为34,满足实时性要求,且漏检率和错检率显著降低,验证了该算法的有效性。 展开更多
关键词 碑帖文本检测 DBNet 空洞卷积 CBAM 特征融合
在线阅读 下载PDF
ACM-DeepLabV3+:通过轻量级网络设计增强自动驾驶实时语义分割
10
作者 蔡思静 周光明 +1 位作者 曾健 蒋煜焜 《工业控制计算机》 2026年第2期102-104,共3页
语义分割是实现自动驾驶系统场景解析的关键技术,为了增强自动驾驶实时性,提出了轻量级分割网络:ACM-DeepLabV3+模型。首先,利用轻量化的MobileNetV2提取特征。其次,设计非对称空洞卷积模块ACBA,强化特征提取。最后,通过中间层融合以增... 语义分割是实现自动驾驶系统场景解析的关键技术,为了增强自动驾驶实时性,提出了轻量级分割网络:ACM-DeepLabV3+模型。首先,利用轻量化的MobileNetV2提取特征。其次,设计非对称空洞卷积模块ACBA,强化特征提取。最后,通过中间层融合以增强空间位置信息恢复能力。在Cityscapes数据集训练模型,实验结果表明,ACM-DeepLabV3+模型的推理速度为49.85 fps,比改进前提升20.7 fps,平均交并比mIoU为66.93%,比DeepLabV3+下降1.32%。说明ACM-DeepLabV3+模型增强了分割实时性且很好地平衡了分割精度与速度。 展开更多
关键词 语义分割 轻量化 非对称空洞卷积 中间层融合
在线阅读 下载PDF
基于模块化AI模组的火灾图像智能检测
11
作者 杨涛 汪友杰 王伟 《齐鲁工业大学学报》 2026年第1期57-64,共8页
火灾监测对减少生命财产损失至关重要,但传统方法在复杂环境中存在实时性与准确性不足的问题。本文提出一种基于改进YOLOv5s的轻量化火灾图像检测算法,结合边缘计算技术优化监测系统。通过引入卷积块注意力模块(CBAM)增强特征学习能力,... 火灾监测对减少生命财产损失至关重要,但传统方法在复杂环境中存在实时性与准确性不足的问题。本文提出一种基于改进YOLOv5s的轻量化火灾图像检测算法,结合边缘计算技术优化监测系统。通过引入卷积块注意力模块(CBAM)增强特征学习能力,采用多孔空间金字塔池化(ASPP)扩大模型感受野,并利用EIoU Loss损失函数加速收敛、提升回归精度。实验表明,改进后模型的火灾识别率提高至94%,精确率与召回率分别达到94.2%和92.4%。通过将系统搭载在模块化AI模组上,直接处理视频数据,避免了云端传输延迟,显著提升了检测实时性。该方法为复杂场景下的火灾监测提供了高效解决方案,对提升应急响应能力具有重要意义。 展开更多
关键词 边缘计算 火灾监测 神经网络 卷积块注意力模块 多孔空间金字塔池化
在线阅读 下载PDF
基于UMS-YOLO v7的面向样本不均衡的水下生物多尺度目标检测方法 被引量:5
12
作者 张明华 黄基萍 +2 位作者 宋巍 肖启华 赵丹枫 《农业机械学报》 北大核心 2025年第1期388-396,409,共10页
针对水下目标检测面临着生物尺度变化大以及样本不均衡的问题,本文提出一种水下生物多尺度目标检测方法(Underwater multi-scale-YOLO v7,UMS-YOLO v7)。首先,设计一种由可切换空洞卷积组成的特征提取模块,该模块可在不同大小的感受野... 针对水下目标检测面临着生物尺度变化大以及样本不均衡的问题,本文提出一种水下生物多尺度目标检测方法(Underwater multi-scale-YOLO v7,UMS-YOLO v7)。首先,设计一种由可切换空洞卷积组成的特征提取模块,该模块可在不同大小的感受野上捕获多尺度目标特征,使得提取的特征信息更加全面;其次,使用轻量级的上采样算子融合上下文信息,提高模型对目标的特征学习能力;最后,通过结合Wise-IoU和归一化Wasserstein距离两种相似性度量,提高了不同尺度目标的定位精度,同时降低了多尺度样本分布不均衡对模型的影响。实验结果表明,该模型相较于当前其他模型在检测精度方面表现出明显的提升,在RUOD和DUO数据集上平均精度均值分别达到64.5%和68.9%。与YOLO v7模型相比,UMS-YOLO v7提高了多种尺度目标检测精度,在DUO数据集上,针对大、中、小3种尺度目标平均精度均值分别提升8.3、4.8、12.5个百分点,其中小目标提升效果最为显著。与现有的其他模型相比,改进的模型具有更高的检测精度,更适用于水下生物多尺度目标检测任务,并且针对不同数据分布的样本具有泛化性和鲁棒性。 展开更多
关键词 水下生物 多尺度目标检测 YOLO v7 空洞卷积 上采样算子 相似性度量
在线阅读 下载PDF
一种基于ASPPUnet的道路裂缝检测模型 被引量:1
13
作者 曹一冰 张江水 +1 位作者 张政 赵鑫科 《测绘科学技术学报》 2025年第1期49-56,共8页
为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深... 为了更加精确高效地对道路裂缝进行分割提取,提出一种基于多尺度特征与上下文信息融合的ASPPUnet道路裂缝检测模型。ASPPUnet通过U形编码解码器进行多尺度特征的提取,通过引入ASPP模块进行不同范围上下文信息的融合;同时模型还引入了深度可分离卷积模块,用以实现模型的轻量化;采用融合Dice和交叉熵的损失函数,均衡模型的查全率和查准率;采用动态数据集增广方法,使得模型在小数据集上也能实现良好的检测效果。通过与Unet等模型的实验对比可以看出,ASPPUnet拥有更好的检测效果和可塑性,具有较好的应用价值。 展开更多
关键词 裂缝检测 图像分割 深度可分离卷积 损失函数 ASPP模块 Unet模型
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法 被引量:1
14
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
基于形状流和多尺度特征融合的腺体分割
15
作者 林嘉雯 陈苏苏 +2 位作者 林智明 李笠 翁谦 《中国生物医学工程学报》 北大核心 2025年第1期52-65,共14页
睑板腺成像技术广泛应用于干眼症的分型诊断、管理与个性化治疗中,但仅靠眼科医生进行直接观察和定性评估,评价主观且可重复性低。为提高眼科医生的诊断效率,研究者们提出了一系列基于U-Net的红外睑板腺图像腺体分割方法,但在图像边缘... 睑板腺成像技术广泛应用于干眼症的分型诊断、管理与个性化治疗中,但仅靠眼科医生进行直接观察和定性评估,评价主观且可重复性低。为提高眼科医生的诊断效率,研究者们提出了一系列基于U-Net的红外睑板腺图像腺体分割方法,但在图像边缘、出现反光点以及腺体密集区域,分割结果仍不理想。考虑到红外睑板腺图像成像与腺体分布的特点,提出基于形状流和多尺度特征融合的腺体分割模型SS-UNet,引入空洞卷积模块以增强模型的特征提取能力,设计形状流辅助分支以充分学习腺体的形状信息,采用多尺度特征融合模块以获得粗细各异腺体的特征表示。为验证模型的有效性,使用由福州大学附属省立医院眼科收集的包含203幅红外睑板腺图像的全标注数据集在同等实验环境下与其他先进分割模型开展对比实验,并进行模块消融分析,同时展示了可视化结果。实验表明,SS-UNet的Acc、Dice、IoU等指标分别达到了94.62%、80.94%和68.17%,相较于基准网络U-Net分别提升了0.36%、1.41%和1.95%。研究表明,SS-UNet能够充分运用腺体的形状与尺度等信息,解决腺体粘连、漏检等错误分割问题,有效提高分割精度,为辅助临床诊断提供客观依据。 展开更多
关键词 睑板腺功能障碍 腺体分割 空洞卷积 形状流 多尺度特征融合
暂未订购
基于改进SN-RetinaNet的车辆目标检测方法
16
作者 陈鑫影 吕硕 胡明捷 《大连交通大学学报》 2025年第4期147-154,共8页
针对复杂交通场景下密集车辆检测存在的目标遮挡、尺度变化大等难题,提出一种基于改进RetinaNet的车辆检测算法SN-RetinaNet。该方法首先在特征提取网络中引入可切换空洞卷积模块,通过动态调整感受野增强多尺度特征提取能力;其次结合神... 针对复杂交通场景下密集车辆检测存在的目标遮挡、尺度变化大等难题,提出一种基于改进RetinaNet的车辆检测算法SN-RetinaNet。该方法首先在特征提取网络中引入可切换空洞卷积模块,通过动态调整感受野增强多尺度特征提取能力;其次结合神经架构搜索技术优化特征金字塔网络结构,提升算法对不同尺度目标的适应性;最后提出一种基于统计先验的锚框比例优化策略。在SODA10M数据集上的试验结果表明,此方法平均检测精度(mAP)达到48.7%,较基准方法提升3.7个百分点。研究结果为智能交通系统中的车辆检测任务提供了有效的解决方案。 展开更多
关键词 目标检测 可切换空洞卷积 特征金字塔网络 神经架构搜索
在线阅读 下载PDF
基于多尺度注意力U-Net的医学肝脏计算机断层扫描图片分割算法 被引量:5
17
作者 金涛 王震 李昭蒂 《哈尔滨工程大学学报》 北大核心 2025年第3期529-539,共11页
针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区... 针对传统肝脏分割方法十分依赖医生的经验,并且分割过程耗时,易出错的现象,本文提出适用于临床情景中医学肝脏计算机断层扫描的分割方法。基于多尺度残差混合注意力U-Net将多尺度注意力机制模块引入U-Net网络。该模块可以抑制不相关的区域,从多个角度提取图像特征,并突出显示分割任务;在标准卷积层中添加残差结构可以有效地避免梯度爆炸并增加网络深度;使用混合空洞注意力常规层来替换“U”形网络的底部,以获得上下文信息,避免空间信息的丢失。试验结果表明:在LiTS17和SLiver07数据集上与其他方法相比,本文方法具有更好的性能和最高的分割精度。 展开更多
关键词 神经网络 深度学习 语义分割 肝脏分割 医学图像 注意力机制 空洞卷积
在线阅读 下载PDF
基于扩张重参数化和空洞卷积架构的步态识别方法 被引量:3
18
作者 霍丽娜 薛乐仁 +3 位作者 戴钰俊 赵新宇 王世行 王威 《计算机应用》 北大核心 2025年第4期1285-1292,共8页
步态识别旨在通过人们的步行姿态进行身份识别。针对步态识别中有效感受野(ERF)与人体轮廓区域匹配不佳的问题,提出一种基于空洞卷积的步态识别方法DilatedGait。首先,采用空洞卷积扩大神经元感受野,缓解下采样和模型深度增加导致的分... 步态识别旨在通过人们的步行姿态进行身份识别。针对步态识别中有效感受野(ERF)与人体轮廓区域匹配不佳的问题,提出一种基于空洞卷积的步态识别方法DilatedGait。首先,采用空洞卷积扩大神经元感受野,缓解下采样和模型深度增加导致的分辨率下降,以提高轮廓结构的辨识度;其次,提出扩张重参数化模块(DRM),通过重参数化方法融合多尺度卷积核参数,优化ERF聚焦范围,使模型捕获更多的全局上下文信息;最后,通过特征映射提取判别性步态特征。在户外数据集Gait3D和GREW上的实验结果表明,对比目前的先进方法GaitBase,DilatedGait在Gait3D的Rank-1和平均逆负惩罚(mINP)上分别提升了9.0和14.2个百分点,在GREW的Rank-1和Rank-5上分别提升了11.6和8.8个百分点。可见,DilatedGait消除了复杂协变量带来的不利影响,能进一步提升户外场景下步态识别的准确率。 展开更多
关键词 步态识别 有效感受野 重参数化 空洞卷积 步态轮廓序列
在线阅读 下载PDF
一种高效的无人机航拍小目标检测算法 被引量:2
19
作者 高卫峰 易宇轩 +3 位作者 黄玲玲 李龙跃 李宏 谢晋 《控制与决策》 北大核心 2025年第8期2525-2533,共9页
无人机航拍图像具有尺度差异大、背景干扰和目标模糊等特点,给小目标检测带来诸多挑战.针对这些问题,提出一种高效的无人机航拍小目标检测算法.首先利用空洞卷积增大感受野、保持细节分辨率的特点,设计并行空洞卷积模块;其次设计注意力... 无人机航拍图像具有尺度差异大、背景干扰和目标模糊等特点,给小目标检测带来诸多挑战.针对这些问题,提出一种高效的无人机航拍小目标检测算法.首先利用空洞卷积增大感受野、保持细节分辨率的特点,设计并行空洞卷积模块;其次设计注意力上下采样分支模块,利用闸门机制对提取到的特征进行选择,强化特征表达;最后结合小目标检测头设计并行空洞卷积注意力金字塔网络,对多尺度特征进行特征融合.在VisDrone2023数据集和DOTA数据集上,所提出算法在小目标检测的平均准确率均值均优于其他主流算法,相较于基线方法在平均准确率均值上提升7.3%,参数量减少0.58 M,FPS提升11.2,达到43.5,验证了所提算法的高效性.在复杂场景ExDark数据集上,所提出算法在平均准确率均值上优于其他低光增强模型和暗检测器,相较于PE-YOLO在平均准确率均值上提升2.4%,验证了所提算法的鲁棒性和实用性. 展开更多
关键词 无人机航拍图像 小目标检测 空洞卷积 注意力机制 金字塔网络 多尺度特征融合
原文传递
光场角度线索表征的语义分割研究 被引量:1
20
作者 程欣怡 贾晨 +1 位作者 张梓轩 石凡 《中国图象图形学报》 北大核心 2025年第4期1130-1140,共11页
目的当前的光场语义分割方法局限于单一物体,手工特征表达鲁棒性差且缺乏高层角度语义信息,针对上述不足,提出了一种适用于静态图像的端到端语义分割网络,充分挖掘了深度卷积神经网络对光场图像特征的表征潜力,探索了空间和角度结构关... 目的当前的光场语义分割方法局限于单一物体,手工特征表达鲁棒性差且缺乏高层角度语义信息,针对上述不足,提出了一种适用于静态图像的端到端语义分割网络,充分挖掘了深度卷积神经网络对光场图像特征的表征潜力,探索了空间和角度结构关系以解决过分割和欠分割问题。方法从多尺度光场宏像素图像构造出发,基于多种骨干网络设计,提出了一个高效角度特征提取器(angular feature extractor,AFE)与空洞空间金字塔池化(atrous spatial pyramid pooling,ASPP)结合的光场语义分割模型。其中,在编码器模块中采用ASPP以高效地提取并融合宏像素图像中的多尺度空间特征,提高模型对复杂场景的适应能力;在解码器中设计AFE用于提取宏像素图像中的角度结构线索,减少特征在连续下采样过程中造成的角度信息丢失。结果通过在LF Dataset开源数据集上与7种光场最佳方法(state-of-the-art,SOTA)进行实验,利用ResNet101作为骨干网络时所提模型在测试集上实现了88.80%的平均交并比(mean intersection over union,mIoU),在所有对比方法中是最佳的。结论本文所提模型在提升语义分割性能方面具有可行性和有效性,能够更加精确地捕捉到图像中细微变化的信息,实现更精确的边界分割,为光场技术在场景理解中的应用提供了新的研究方向。 展开更多
关键词 语义分割 光场成像 宏像素图像 角度线索 空洞卷积
原文传递
上一页 1 2 12 下一页 到第
使用帮助 返回顶部