期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
Foreground Segmentation Network with Enhanced Attention
1
作者 姜锐 朱瑞祥 +1 位作者 蔡萧萃 苏虎 《Journal of Shanghai Jiaotong university(Science)》 EI 2023年第3期360-369,共10页
Moving object segmentation (MOS) is one of the essential functions of the vision system of all robots,including medical robots. Deep learning-based MOS methods, especially deep end-to-end MOS methods, are actively inv... Moving object segmentation (MOS) is one of the essential functions of the vision system of all robots,including medical robots. Deep learning-based MOS methods, especially deep end-to-end MOS methods, are actively investigated in this field. Foreground segmentation networks (FgSegNets) are representative deep end-to-endMOS methods proposed recently. This study explores a new mechanism to improve the spatial feature learningcapability of FgSegNets with relatively few brought parameters. Specifically, we propose an enhanced attention(EA) module, a parallel connection of an attention module and a lightweight enhancement module, with sequentialattention and residual attention as special cases. We also propose integrating EA with FgSegNet_v2 by taking thelightweight convolutional block attention module as the attention module and plugging EA module after the twoMaxpooling layers of the encoder. The derived new model is named FgSegNet_v2 EA. The ablation study verifiesthe effectiveness of the proposed EA module and integration strategy. The results on the CDnet2014 dataset,which depicts human activities and vehicles captured in different scenes, show that FgSegNet_v2 EA outperformsFgSegNet_v2 by 0.08% and 14.5% under the settings of scene dependent evaluation and scene independent evaluation, respectively, which indicates the positive effect of EA on improving spatial feature learning capability ofFgSegNet_v2. 展开更多
关键词 human-computer interaction moving object segmentation foreground segmentation network enhanced attention convolutional block attention module
原文传递
基于双重信息注意力机制的电力设备热成像超分辨率重建
2
作者 赵洪山 李忠航 +2 位作者 林诗雨 王晓盼 杨伟新 《中国电机工程学报》 北大核心 2026年第4期1384-1395,I0007,共13页
针对当前电力设备红外图像分辨率低和温度分布模糊问题,提出一种基于局部和全局信息注意力生成对抗网络(local and global information attention generative adversarial network,LGIA-GAN)的超分辨率重建方法。首先,使用门控权重单元... 针对当前电力设备红外图像分辨率低和温度分布模糊问题,提出一种基于局部和全局信息注意力生成对抗网络(local and global information attention generative adversarial network,LGIA-GAN)的超分辨率重建方法。首先,使用门控权重单元融合多种卷积输出构建细节增强融合卷积,增加重要信息在输出特征图的占比;其次,搭建双注意力模块,对图像长距离像素依赖关系建模并捕获空间和通道维度信息;然后,构造生成对抗网络,使网络关注电力设备红外图像局部纹理细节和全局轮廓信息;最后,通过实验证明,LGIA-GAN在数据集上的峰值信噪比和结构相似度分别为30.266dB和0.9197,重建时间为0.120s,明显优于其他几种GAN算法,并在主观视觉上重建效果更好。所提方法能够有效提升电力设备热成像分辨率,对电力设备故障诊断具有支撑作用。 展开更多
关键词 电力设备红外图像 超分辨率重建 细节增强融合卷积 双注意力模块 局部和全局信息
原文传递
基于可变形卷积与Transformer的遥感影像变化检测方法
3
作者 苏志鹏 王欢 潘清莹 《遥感信息》 北大核心 2026年第1期155-162,共8页
针对当前遥感影像变化检测方法在复杂场景下全局建模能力不足、小目标检测效果差等问题,提出一种基于可变形卷积与Transformer的混合网络模型。首先,设计差异增强模块,通过通道注意力机制突出双时相影像的特征差异;其次,采用可变形卷积... 针对当前遥感影像变化检测方法在复杂场景下全局建模能力不足、小目标检测效果差等问题,提出一种基于可变形卷积与Transformer的混合网络模型。首先,设计差异增强模块,通过通道注意力机制突出双时相影像的特征差异;其次,采用可变形卷积改进ResNet18主干网络,增强对多尺度目标的特征提取能力;最后,引入Transformer编码-解码结构,建立全局上下文依赖关系。在LEVIR-CD和CDD数据集上的实验结果表明,该方法在F1分数和IoU指标上分别达到90.55%、80.98%和94.25%、89.57%,显著优于对比方法。消融实验证实各模块的有效性,其中可变形卷积使IoU提升1.86个百分点,差异增强模块使IoU提升0.71个百分点。该方法为提升复杂场景下的变化检测精度提供了有效解决方案。 展开更多
关键词 变化检测 可变形卷积 差异增强模块 TRANSFORMER
在线阅读 下载PDF
时空双重提取与频域增强的飞行轨迹预测
4
作者 骆晓宁 王燕妮 谷卓 《计算机系统应用》 2026年第1期228-236,共9页
为有效应对飞行轨迹预测中存在的复杂时空特性以及时域波动对预测精度带来的挑战,提出融合时空双重提取与频域增强的飞行轨迹预测方法.该方法结合时间卷积网络(TCN)与iTransformer模型旨在同时捕捉飞行轨迹序列中的局部时序特征与全局... 为有效应对飞行轨迹预测中存在的复杂时空特性以及时域波动对预测精度带来的挑战,提出融合时空双重提取与频域增强的飞行轨迹预测方法.该方法结合时间卷积网络(TCN)与iTransformer模型旨在同时捕捉飞行轨迹序列中的局部时序特征与全局变量交互关系,从而在不同层次和粒度上实现对数据特征的双重提取,有效挖掘其潜在的时空关联性.随后引入频域增强通道注意力机制(FECAM),通过离散余弦变换将轨迹特征转化为频域,并应用通道注意力机制强化转化后的频域信息,以减少时域波动带来的影响.实验基于三维飞行轨迹数据集,在爬升、巡航及降落阶段,该方法的平均绝对误差分别为1.15、0.15和0.82.结果表明相较于现有方法,所提方法在预测精度和稳定性方面均具有明显优势. 展开更多
关键词 飞行轨迹预测 时空双重特征提取模块 频域增强通道注意力机制 iTransformer 时间卷积网络
在线阅读 下载PDF
基于多尺度增强生成对抗网络的行人异常行为检测
5
作者 冯爽爽 范莎 邓超 《计算机工程与应用》 北大核心 2026年第4期190-200,共11页
针对行人异常行为检测中存在样本不均衡、目标尺度变化较大和背景干扰的问题,提出了一种基于多尺度增强生成对抗网络的行人异常行为检测方法。利用改进的U-Net作为生成器的主干网络,将卷积块注意力模块嵌入生成器的解码过程,降低背景的... 针对行人异常行为检测中存在样本不均衡、目标尺度变化较大和背景干扰的问题,提出了一种基于多尺度增强生成对抗网络的行人异常行为检测方法。利用改进的U-Net作为生成器的主干网络,将卷积块注意力模块嵌入生成器的解码过程,降低背景的干扰,实现对检测目标的特征提取和重构。在生成器的跳跃跨接中引入多尺度特征融合增强模块细化对不同目标的表达能力,并结合记忆模块设计多尺度记忆特征增强模块提高对正常行为的重构表现。进一步对损失函数进行改进,结合异常得分,完成对行人异常行为的检测。在UCSD Ped2、CUHK Avenue、Shanghai Tech三个数据集上测得该算法的AUC分别为98.6%、88.7%和77.3%,实验结果表明了该算法在不同场景中针对行人异常行为检测具有良好的检测效果。 展开更多
关键词 行人异常行为检测 生成对抗网络 卷积块注意力模块 多尺度增强模块 异常得分
在线阅读 下载PDF
基于局部边缘信息增强的芯片表面缺陷级联检测模型
6
作者 傅呈辉 迟荣华 +1 位作者 杨宏恩 李红旭 《半导体技术》 北大核心 2026年第3期270-279,297,共11页
为解决芯片表面缺陷检测中高精度与高实时性难以兼顾、小目标缺陷特征提取不足的问题,提出一种基于局部边缘信息增强的芯片表面缺陷级联检测模型。该模型构建50层残差网络(ResNet50)与目标检测模型的级联网络以快速筛除无缺陷样本,改进E... 为解决芯片表面缺陷检测中高精度与高实时性难以兼顾、小目标缺陷特征提取不足的问题,提出一种基于局部边缘信息增强的芯片表面缺陷级联检测模型。该模型构建50层残差网络(ResNet50)与目标检测模型的级联网络以快速筛除无缺陷样本,改进EfficientDet-D3高效检测模型得到基于跨层增强(CLE)机制的EfficientDet-CLE模型,设计局部边缘增强模块(LEEM)强化精细特征提取,并采用内容感知特征重组(CARAFE)上采样算子优化双向特征金字塔网络(BiFPN)特征融合。实验结果显示,改进后的模型在芯片数据集上的平均精度均值(mAP)达92.63%、每秒帧率(FPS)为113 f/s,相较于基准模型分别提高了5.5%和45 f/s,假接受率(FAR)、假拒绝率(FRR)分别降低了0.011%和0.088%。该模型实现了检测精度与速度的良好平衡,为半导体制造提供了高效、可靠的缺陷检测方案,具有重要的工程应用价值。 展开更多
关键词 缺陷检测 EfficientDet-D3 局部边缘信息增强模块 内容感知特征重组(CARAFE) 卷积神经网络(CNN)
原文传递
Using Hybrid Penalty and Gated Linear Units to Improve Wasserstein Generative Adversarial Networks for Single-Channel Speech Enhancement
7
作者 Xiaojun Zhu Heming Huang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第6期2155-2172,共18页
Recently,speech enhancement methods based on Generative Adversarial Networks have achieved good performance in time-domain noisy signals.However,the training of Generative Adversarial Networks has such problems as con... Recently,speech enhancement methods based on Generative Adversarial Networks have achieved good performance in time-domain noisy signals.However,the training of Generative Adversarial Networks has such problems as convergence difficulty,model collapse,etc.In this work,an end-to-end speech enhancement model based on Wasserstein Generative Adversarial Networks is proposed,and some improvements have been made in order to get faster convergence speed and better generated speech quality.Specifically,in the generator coding part,each convolution layer adopts different convolution kernel sizes to conduct convolution operations for obtaining speech coding information from multiple scales;a gated linear unit is introduced to alleviate the vanishing gradient problem with the increase of network depth;the gradient penalty of the discriminator is replaced with spectral normalization to accelerate the convergence rate of themodel;a hybrid penalty termcomposed of L1 regularization and a scale-invariant signal-to-distortion ratio is introduced into the loss function of the generator to improve the quality of generated speech.The experimental results on both TIMIT corpus and Tibetan corpus show that the proposed model improves the speech quality significantly and accelerates the convergence speed of the model. 展开更多
关键词 Speech enhancement generative adversarial networks hybrid penalty gated linear units multi-scale convolution
在线阅读 下载PDF
自适应卷积约束与全局上下文推理的墓室壁画修复 被引量:1
8
作者 吴萌 郭歌 +2 位作者 孙增国 路智勇 张倩文 《中国图象图形学报》 北大核心 2025年第3期737-754,共18页
目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复... 目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复杂病害,修复时会出现内容缺失、结构错乱等问题。对此,提出一种自适应卷积约束与全局上下文推理的墓室壁画修复。方法基于端到端的编码器—解码器架构,首先设计多尺度增强卷积模块,从频域和空域联合分析图像特性来充分捕获全局结构和局部纹理;同时在修复路径中加入融合差分卷积的增强激活单元来引入边缘先验信息,提高模型的绘制精度。其次,考虑到纹理和结构在绘制过程中的模式差异,在编码器—解码器间设计基于注意力交互引导的多尺度特征聚合模块,来加强全局稀疏信息的表征能力和相关性,并自适应选择增强有效特征。此外,为了获得真实准确的结果,在特征传递过程中利用自动掩码更新迭代来预测复杂缺失信息,引导解码器精确绘制多样化的损伤区域。结果本文采用客观评价指标峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity index,SSIM)和学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)在章怀太子墓“马球图”数据集上进行3类模拟病害和真实病害修复实验,并与6种主流方法进行比较。实验结果表明,本文方法修复的壁画图像在主观视觉和客观评价上均有明显提升。相较于指标排名第2的模型,对于随机缺失区域的壁画修复,峰值信噪比和结构相似性的均值分别达到31.7602dB和0.9577,各指标的样本均值分别提升了2.3653 dB、0.0128和12.75%。结论本文提出的图像修复模型可以有效修复多种复杂病害,可为手工绘制专家的物理修复提供参考,进一步促进了数字文化遗产的可持续研究与保护。 展开更多
关键词 壁画修复 多尺度增强卷积模块 多尺度特征聚合模块 增强激活单元 差分卷积 病害修复
原文传递
结合并联Transformer和残差U-Net网络的水下图像增强 被引量:1
9
作者 陈清江 李宗莹 《电子科技》 2025年第8期57-65,共9页
针对光在水中传播时被吸收,水下图像存在颜色失真、对比度低和细节模糊等问题,文中设计了一个基于并联Transformer和残差卷积的U-Net网络进行水下图像增强。在新U-Net结构中,在编码和解码部分分别置入混合卷积Transformer块(Hybrid Conv... 针对光在水中传播时被吸收,水下图像存在颜色失真、对比度低和细节模糊等问题,文中设计了一个基于并联Transformer和残差卷积的U-Net网络进行水下图像增强。在新U-Net结构中,在编码和解码部分分别置入混合卷积Transformer块(Hybrid Convolution Transformer Block,HCTB)。综合了Transformer的捕获全局信息能力和卷积块捕获局部信息能力,并且在跳跃连接部分搭建了若干平行注意模块(Parallel Attention Module,PAM)来提取更重要的像素和通道信息。采用现有UIEB(Underwater Image Enhancement Benchmark dataset)配对数据集对网络进行训练。为验证所提算法的有效性,选取不同偏色程度的水下图像进行实验与测试。实验结果表明,所提模型较其他先进模型的峰值信噪比PSNR(Peak Single-to-Ratio)值提升了4.3%,获得了较好的主观和客观评价结果,有效提升了水下图像的增强水平。 展开更多
关键词 水下图像增强 TRANSFORMER 残差卷积 U-Net网络 平行注意模块 通道注意 像素注意 卷积神经网络 深度学习
在线阅读 下载PDF
基于改进YOLOv7的煤矿输送带上异物检测方法
10
作者 王媛彬 王小龙 +1 位作者 王旭 郭亚茹 《煤炭科学技术》 北大核心 2025年第11期201-215,共15页
矿井输送带异物检测对于保障煤矿安全生产和提升自动化水平具有重要意义。然而,受井下光照不足、强点光源干扰以及背景复杂等因素影响,传统机器视觉方法在异物识别中存在检测精度低、漏检率高等问题,尤其在面对多尺度及小尺寸异物目标... 矿井输送带异物检测对于保障煤矿安全生产和提升自动化水平具有重要意义。然而,受井下光照不足、强点光源干扰以及背景复杂等因素影响,传统机器视觉方法在异物识别中存在检测精度低、漏检率高等问题,尤其在面对多尺度及小尺寸异物目标时效果不佳,同时有限的异物样本也制约了模型的训练效果。为此,提出一种融合特征增强结构与聚焦线性注意力机制的改进型YOLOv7异物检测算法。首先,在主干网络中引入构建的特征增强模块,通过多尺度并行结构与可切换空洞卷积扩展感受野,增强模型对小目标异物的特征提取能力;其次,融合聚焦线性注意力机制,有效抑制复杂背景干扰,提升模型对关键异物区域的关注力与判别能力;然后,设计高效动态蛇形卷积模块,以适应条状异物的几何特性,并提升特征融合阶段的语义表达能力;此外,采用具有方向感知能力的SIOU损失函数,增强边界框的拟合精度与训练收敛效率;最后,引入迁移学习策略,在通用数据集上进行预训练,并迁移至煤矿输送带异物检测任务中,以缓解小样本数据带来的训练难题。在CUMT-BELT数据集上的试验结果表明,本文提出的算法检测精度达到了89.3%,相较于基线模型YOLOv7提升了9.3%。同时,研究提出的算法在检测精度、召回率和mAP@0.5等指标上均显著优于其他主流的检测方法,尤其在多尺度、小目标及条状异物检测任务中表现出更强的鲁棒性与适应性,验证了所提方法在复杂矿井场景下的有效性与实用性。 展开更多
关键词 异物检测 YOLOv7 特征增强模块 聚焦线性注意力 高效动态蛇形卷积 SIOU
在线阅读 下载PDF
基于生成式对抗网络的多帧压缩视频增强方法
11
作者 胡锐 程家亮 《苏州科技大学学报(自然科学版)》 2025年第4期46-52,共7页
视频已逐渐成为互联网流量的主要组成部分,为了降低存储与传输的成本,通常会对视频进行压缩,以减小其文件大小,这将导致视频的主观品质降低,并产生不自然的块状效应。现有以增强视频PSNR为导向的视频增强方法往往会造成过于模糊平滑的结... 视频已逐渐成为互联网流量的主要组成部分,为了降低存储与传输的成本,通常会对视频进行压缩,以减小其文件大小,这将导致视频的主观品质降低,并产生不自然的块状效应。现有以增强视频PSNR为导向的视频增强方法往往会造成过于模糊平滑的结果,并不符合人的主观体验。为了缓解该问题,本文提出一种基于生成式对抗网络的多帧压缩视频增强方法,以提高多种压缩程度下视频的感知质量。该方法通过包含可变形卷积和注意力模块的对齐融合模块高效地聚合相邻帧的时空信息,其中可变形卷积核能够适应性地掌握卷积核的采样点,更好地捕捉视频中物体的运动信息;建立在通道注意力机制上的注意力单元,可对不同帧的特征进行重要性区分,为不同通道赋予不同权重,从而提高特征表示的区分性。同时引入对抗训练,重建更具纹理细节的高清图像。实验结果表明,所提方法具有良好的感知质量增强性能,与其他方法相比更具优越性,实现了明显的压缩视频质量增强效果。 展开更多
关键词 视频增强 生成式对抗网络 可变形卷积 注意力模块
在线阅读 下载PDF
FA-CGRNet:无创高血糖预测的分类模型
12
作者 王蕾 赵康 殷秀强 《计算机与现代化》 2025年第10期44-50,共7页
现有的血糖检测方法多具创伤性,带来诸多不便和潜在风险。若能通过可穿戴设备获取生理数据及用户自输入的饮食数据,实时预测用户是否为高血糖,将能显著简化血糖检测过程。为了提高预测的精确度,本文提出一种基于深度学习的时间序列分类... 现有的血糖检测方法多具创伤性,带来诸多不便和潜在风险。若能通过可穿戴设备获取生理数据及用户自输入的饮食数据,实时预测用户是否为高血糖,将能显著简化血糖检测过程。为了提高预测的精确度,本文提出一种基于深度学习的时间序列分类模型—FA-CGRNet。首先,对生理数据进行降噪、重采样等预处理,提取其统计特征。随后,设计残差卷积网络,通过卷积和残差连接实现特征的提取和融合,同时利用特征增强模块计算特征权重,对特征进行筛选。最后,采用LSTM模型提取时间序列的长期依赖特征,以充分捕捉时序特征。在杜克大学BIG IDEAs实验室发布的公开数据集上进行测试,实验结果表明,在无创血糖检测领域,本文提出的特征提取方法和网络模型,与现有的时间序列分类模型相比,能更好地区分正负例,加权F1分数提高了6.1%以上,AUC提高了2.5%以上。 展开更多
关键词 无创高血糖预测 残差卷积 长短期记忆网络 特征增强模块 神经网络
在线阅读 下载PDF
基于改进YOLOv8n的手机屏幕瑕疵检测算法:PGS-YOLO 被引量:2
13
作者 周思瑜 徐慧英 +4 位作者 朱信忠 黄晓 盛轲 曹雨淇 陈晨 《计算机工程》 北大核心 2025年第5期326-339,共14页
手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况,提出... 手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况,提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头,并结合SeaAttention注意力模块,有效提升对小目标的探测能力;将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块,在保证精度的同时降低模型的参数量,提高瑕疵检测的速度与效率。实验结果表明,在北京大学手机屏幕表面瑕疵数据集中,相较于YOLOv8n,PGS-YOLO算法的mAP@0.5提升了2.5百分点,mAP@0.5∶0.95提升了2.2百分点,在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测,还能对小瑕疵保持一定的准确度。此外,检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时,参数量仅为2.0×10^(6),小于YOLOv8n,满足工业场景对手机屏幕瑕疵检测的需求。 展开更多
关键词 YOLOv8n模型 手机屏幕瑕疵检测 小目标检测 部分卷积 GhostNetV2轻量化模块 挤压增强轴向注意力
在线阅读 下载PDF
基于Ghost卷积与自适应注意力的点云分类 被引量:2
14
作者 舒密 王占刚 《现代电子技术》 北大核心 2025年第6期106-112,共7页
点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,... 点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,提出一种基于点云Transformer的轻量级特征增强融合分类网络EFF-LPCT。EFF-LPCT使用一维化Ghost卷积对原始网络进行重构,以降低计算复杂度和内存要求;引入自适应支路权重,以实现注意力层级间的多尺度特征融合;利用多个通道注意力模块增强特征的通道交互信息,以提高模型分类效果。在ModelNet40数据集进行的实验结果表明,EFF-LPCT在达到93.3%高精度的同时,相较于点云Transformer减少了1.11 GFLOPs的浮点计算量和0.86×10^(6)的参数量。 展开更多
关键词 点云分类 Transformer网络 Ghost卷积 特征增强融合模块 ECA通道注意力 特征学习
在线阅读 下载PDF
结合多尺度信息和特征增强的息肉分割方法 被引量:1
15
作者 汪琴韵 于瓅 《新疆师范大学学报(自然科学版)》 2025年第1期1-10,共10页
计算机辅助诊断技术在结肠息肉图像分割中具有十分重要的作用。本研究针对结肠息肉分割存在的边缘检测分割比较复杂、息肉与正常组织对比度较低等问题,使用DeepLabv3+模型进行息肉分割并对其进行改进。该模型将残差网络作为主干网络进... 计算机辅助诊断技术在结肠息肉图像分割中具有十分重要的作用。本研究针对结肠息肉分割存在的边缘检测分割比较复杂、息肉与正常组织对比度较低等问题,使用DeepLabv3+模型进行息肉分割并对其进行改进。该模型将残差网络作为主干网络进行特征信息提取,引入特征强化模块对低层次特征进行处理,并加入混合注意力机制对高层次特征进行关键信息的捕捉。得到改进模型在Kvasir-SEG与CVC-ClinicDB两个数据集上的mIoU为82.19%和90.40%.实验结果表明,改进的模型息肉分割效果优于初始DeepLabv3+模型,在息肉分割的精度以及边缘分割上有一定提升。 展开更多
关键词 DeepLabv3+ 息肉分割 混合注意力 特征增强 残差网络
在线阅读 下载PDF
基于AOD-Net改进的多尺度图像去雾算法
16
作者 王超 王婷 +1 位作者 王少军 杨万扣 《计算机工程》 北大核心 2025年第7期305-313,共9页
经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式... 经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式,减少了冗余参数量,加快了计算速度并有效地减少了模型的内存占用量,从而提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,更好地捕捉图像的细节信息,提升了网络对图像细节的处理能力,解决了原算法去雾时存在的细节模糊问题;最后在网络结构中加入金字塔池化模块,用于整合图像不同区域的上下文信息,扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低照度增强模块,通过明确预测噪声实现去噪的目标,从而恢复曝光不足的图像。在低光去雾图像中,峰值信噪比(PSNR)和结构相似性(SSIM)指标均有显著提升,处理后的图片具有更高的整体自然度。实验结果表明:与经典AOD-Net去雾的结果相比,改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡;在RESIDE的SOTS数据集中的室外和室内场景,相较于经典AOD-Net,改进算法的PSNR分别提升了4.5593 dB和4.0656 dB,SSIM分别提升了0.0476和0.0874。 展开更多
关键词 多尺度网络结构 深度可分离卷积 金字塔池化模块 低照度增强模块 图像去雾
在线阅读 下载PDF
基于YOLOv8n改进的PCB缺陷检测算法 被引量:1
17
作者 喻聪 《实验室研究与探索》 北大核心 2025年第6期117-124,共8页
针对PCB生产中的漏孔、鼠咬等微小缺陷检测问题,提出一种基于YOLOv8n改进的YOLOv8n-CSOW算法。通过在Backbone中增加空间深度转换卷积模块以增强特征捕获能力;在Neck部分,采用C2f-ODconv模块替换原始C2f模块强化特征精确匹配。同时,引... 针对PCB生产中的漏孔、鼠咬等微小缺陷检测问题,提出一种基于YOLOv8n改进的YOLOv8n-CSOW算法。通过在Backbone中增加空间深度转换卷积模块以增强特征捕获能力;在Neck部分,采用C2f-ODconv模块替换原始C2f模块强化特征精确匹配。同时,引入上下文增强模块强化特征表征。将边界框(BBox)损失函数优化为动态聚焦的WIoUv2函数,增强模型对微小缺陷的敏感度。实验结果表明,改进算法在某大学公开数据集上平均检测精度较原始YOLOv8n提升1.4个百分点,且优于主流目标检测算法,具备显著的工业检测应用价值。 展开更多
关键词 印刷电路板检测 上下文增强模块 空间深度转换卷积 全维动态卷积
在线阅读 下载PDF
基于多尺度卷积神经网络的屋顶光伏建筑轮廓提取方法研究
18
作者 胡家宇 白建波 +1 位作者 肖宇航 严家乐 《可再生能源》 北大核心 2025年第7期887-895,共9页
针对我国整县分布式光伏的推进,屋顶光伏可利用潜力评估成为政策落实的前提条件。高效准确获取区域内屋顶的轮廓,是评估区域内光伏可利用潜力的最关键因素。现有屋顶光伏建筑物轮廓提取方法忽略了图像的多尺度特征,导致提取建筑物轮廓... 针对我国整县分布式光伏的推进,屋顶光伏可利用潜力评估成为政策落实的前提条件。高效准确获取区域内屋顶的轮廓,是评估区域内光伏可利用潜力的最关键因素。现有屋顶光伏建筑物轮廓提取方法忽略了图像的多尺度特征,导致提取建筑物轮廓模糊及精度不高等弊端。文章提出了多尺度增强卷积耦合注意力调节的建筑物轮廓提取方法。首先,利用多扩张率的空洞卷积构造多尺度增强卷积模块,并将其融入到U_Net网络中,用来采集不同感受野下的建筑特征,这样提取的结果能更全面地表达建筑物轮廓的整体和细节特征;然后,将注意力机制引入到U_Net网络中参与跳跃连接,更为精确地提取建筑物轮廓;最后,利用交叉熵损失函数和Dice系数损失函数,构造复合损失函数,训练所提模型,提取建筑物轮廓。实验结果显示,与其他建筑物轮廓提取算法相比,所提算法不仅对建筑物轮廓的提取精度较高,而且对不同尺度的建筑物轮廓提取也具有较好的效果,说明所提算法能够有效提升建筑物轮廓提取精度,提高光伏可利用潜力评估效率。在分布式光伏整县推进背景下,该方法对于推动GIS及人工智能技术在光伏资源评估中的应用具有重要的参考价值。 展开更多
关键词 屋顶光伏 建筑物轮廓提取 多尺度增强卷积模块 注意力机制
在线阅读 下载PDF
多尺度门控时空增强的唇语识别方法
19
作者 马金林 郭兆伟 +1 位作者 马自萍 吕鑫 《计算机辅助设计与图形学学报》 北大核心 2025年第7期1228-1238,共11页
针对唇语识别模型中的普通卷积对唇部形变缺乏鲁棒性和不能有效地提取时间信息的问题,提出时空增强与多尺度时间卷积网络(MSTCN)结合的唇语识别方法.首先设计沙漏型卷积块(FCB),增强网络对唇部形变的鲁棒性;然后使用门控时移融合(GSF)... 针对唇语识别模型中的普通卷积对唇部形变缺乏鲁棒性和不能有效地提取时间信息的问题,提出时空增强与多尺度时间卷积网络(MSTCN)结合的唇语识别方法.首先设计沙漏型卷积块(FCB),增强网络对唇部形变的鲁棒性;然后使用门控时移融合(GSF)模块提高前端网络的时间信息提取能力;再基于FCB和GSF设计混合3D和2D卷积的时空增强网络STABNet;最后将STABNet作为前端网络,MSTCN作为后端网络,设计唇语识别模型.在LRW数据集上的实验结果表明,与基线模型相比,所提方法的准确率提升4.15个百分点,达到89.45%,而模型的参数量仅增加3.17M.在GRID数据集上准确率达到97.45%,超过大部分对比模型. 展开更多
关键词 唇语识别 多尺度时间卷积网络 时空增强 门控时移融合模块
在线阅读 下载PDF
DN-Net:密集嵌套网络的遥感建筑物提取
20
作者 刘毅 刘涛 +1 位作者 高天迎 李国燕 《自然资源遥感》 北大核心 2025年第6期77-87,共11页
建筑物提取的目的是从遥感图像中分割出建筑物像素,在城市规划、城市动态监测等应用中起着至关重要的作用。针对遥感建筑物提取时出现空洞、误检和漏检等问题,提出一种密集嵌套网络(densely nested network, DN-Net)。DN-Net中子网络结... 建筑物提取的目的是从遥感图像中分割出建筑物像素,在城市规划、城市动态监测等应用中起着至关重要的作用。针对遥感建筑物提取时出现空洞、误检和漏检等问题,提出一种密集嵌套网络(densely nested network, DN-Net)。DN-Net中子网络结合改进残差卷积模块将遥感建筑物进行粗略轮廓提取;为精准定位建筑物的位置,引入坐标注意力模块(coordinate attention module, CAM),有效减少误检现象;为了解决遥感建筑物提取时出现空洞现象,采取级联卷积模块(cascade convolutional module, CCM),凭借不同的大小的卷积核提取更丰富的细节信息,从而精准提取遥感建筑物。选取WHU数据集进行了试验和精度评估,在WHU的验证集上,交并比和F1分数分别达到了89.20%和94.29%;在测试集上,分别为89.85%和94.65%。结果表明:DN-Net显著提升建筑物提取精度,使得提取出的建筑物的边界更加完整和精细,表现出对不同大小建筑物的良好提取能力。 展开更多
关键词 建筑物提取 改进残差卷积模块 坐标注意力模块 级联卷积模块
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部