期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
Human Activity Recognition Using a CNN with an Enhanced Convolutional Block Attention Module
1
作者 HU Biling TONG Yu 《Wuhan University Journal of Natural Sciences》 2026年第1期10-24,共15页
WiFi-based human activity recognition(HAR)provides a non-intrusive approach for ubiquitous monitoring;however,achieving both high accuracy and robustness simultaneously remains a significant challenge.This paper propo... WiFi-based human activity recognition(HAR)provides a non-intrusive approach for ubiquitous monitoring;however,achieving both high accuracy and robustness simultaneously remains a significant challenge.This paper proposes a Convolutional Neural Network with Enhanced Convolutional Block Attention Module(CNN-ECBAM)framework.The approach systematically converts raw Channel State Information(CSI)into pseudo-color images,effectively preserving essential signal characteristics for deep neural network processing.The core innovation is an Enhanced Convolutional Block Attention Module(ECBAM),tailored to CSI data characteristics,which integrates Efficient Channel Attention(ECA)and Multi-Scale Spatial Attention(MSSA).By employing learnable adaptive fusion weights,it achieves dynamic synergy between channel and spatial features,enabling the network to capture highly discriminative spatiotemporal patterns.The ECBAM module is integrated into a unified Convolutional Neural Network(CNN)to form the overall CNN-ECBAM model.Experimental results on the UT-HAR and NTU-Fi_HAR datasets demonstrate that CNN-ECBAM achieves competitive performance in recognition accuracy and outperforms mainstream baseline models.Specifically,it attains 99.20%accuracy on UT-HAR(surpassing ResNet-18 at 98.60%)and achieves 100%accuracy on NTU-Fi_HAR(exceeding GAF-CNN at 99.62%).These results validate the effectiveness of the proposed method for high-precision and reliable WiFi-based HAR. 展开更多
关键词 human activity recognition deep learning channel state information enhanced convolutional Block Attention module(ECBAM) pseudo-color images
原文传递
Foreground Segmentation Network with Enhanced Attention
2
作者 姜锐 朱瑞祥 +1 位作者 蔡萧萃 苏虎 《Journal of Shanghai Jiaotong university(Science)》 EI 2023年第3期360-369,共10页
Moving object segmentation (MOS) is one of the essential functions of the vision system of all robots,including medical robots. Deep learning-based MOS methods, especially deep end-to-end MOS methods, are actively inv... Moving object segmentation (MOS) is one of the essential functions of the vision system of all robots,including medical robots. Deep learning-based MOS methods, especially deep end-to-end MOS methods, are actively investigated in this field. Foreground segmentation networks (FgSegNets) are representative deep end-to-endMOS methods proposed recently. This study explores a new mechanism to improve the spatial feature learningcapability of FgSegNets with relatively few brought parameters. Specifically, we propose an enhanced attention(EA) module, a parallel connection of an attention module and a lightweight enhancement module, with sequentialattention and residual attention as special cases. We also propose integrating EA with FgSegNet_v2 by taking thelightweight convolutional block attention module as the attention module and plugging EA module after the twoMaxpooling layers of the encoder. The derived new model is named FgSegNet_v2 EA. The ablation study verifiesthe effectiveness of the proposed EA module and integration strategy. The results on the CDnet2014 dataset,which depicts human activities and vehicles captured in different scenes, show that FgSegNet_v2 EA outperformsFgSegNet_v2 by 0.08% and 14.5% under the settings of scene dependent evaluation and scene independent evaluation, respectively, which indicates the positive effect of EA on improving spatial feature learning capability ofFgSegNet_v2. 展开更多
关键词 human-computer interaction moving object segmentation foreground segmentation network enhanced attention convolutional block attention module
原文传递
基于双重信息注意力机制的电力设备热成像超分辨率重建
3
作者 赵洪山 李忠航 +2 位作者 林诗雨 王晓盼 杨伟新 《中国电机工程学报》 北大核心 2026年第4期1384-1395,I0007,共13页
针对当前电力设备红外图像分辨率低和温度分布模糊问题,提出一种基于局部和全局信息注意力生成对抗网络(local and global information attention generative adversarial network,LGIA-GAN)的超分辨率重建方法。首先,使用门控权重单元... 针对当前电力设备红外图像分辨率低和温度分布模糊问题,提出一种基于局部和全局信息注意力生成对抗网络(local and global information attention generative adversarial network,LGIA-GAN)的超分辨率重建方法。首先,使用门控权重单元融合多种卷积输出构建细节增强融合卷积,增加重要信息在输出特征图的占比;其次,搭建双注意力模块,对图像长距离像素依赖关系建模并捕获空间和通道维度信息;然后,构造生成对抗网络,使网络关注电力设备红外图像局部纹理细节和全局轮廓信息;最后,通过实验证明,LGIA-GAN在数据集上的峰值信噪比和结构相似度分别为30.266dB和0.9197,重建时间为0.120s,明显优于其他几种GAN算法,并在主观视觉上重建效果更好。所提方法能够有效提升电力设备热成像分辨率,对电力设备故障诊断具有支撑作用。 展开更多
关键词 电力设备红外图像 超分辨率重建 细节增强融合卷积 双注意力模块 局部和全局信息
原文传递
基于改进BIT的耕地变化检测算法
4
作者 徐世亮 赖民权 刘继忠 《新疆大学学报(自然科学版中英文)》 2026年第2期144-155,共12页
耕地“非农化”严重威胁全球粮食安全与生态稳定.遥感变化检测技术因具有大范围动态监测优势,已成为识别耕地“非农化”过程的核心手段.然而,现有方法在处理复杂耕地场景时,受限于多尺度特征表征能力,难以在提取破碎耕地边缘细节的同时... 耕地“非农化”严重威胁全球粮食安全与生态稳定.遥感变化检测技术因具有大范围动态监测优势,已成为识别耕地“非农化”过程的核心手段.然而,现有方法在处理复杂耕地场景时,受限于多尺度特征表征能力,难以在提取破碎耕地边缘细节的同时兼顾大范围地块的全局语义一致性,从而导致边缘模糊与局部特征丢失.针对上述问题,本文提出一种基于改进双时相图像Transformer(Bitemporal Image Transformer,BIT)的耕地变化检测算法Far-CDNet.首先,引入并联普通卷积及多种差分卷积的细节增强卷积模块,并通过动态加权和残差连接强化特征提取网络的边缘细节表征能力.其次,将BIT模块中语义标记器的普通卷积替换为深度可分离卷积,以增强局部特征捕获能力并生成具有更高层语义的输出特征.最后,增加一条残差分支,进一步融合Transformer前后的局部及全局信息.实验结果表明,改进后的模型F1分数为79.18%,IoU为69.32%,相较于BIT模型,F1分数提升4.17%,IoU提升4.24%. 展开更多
关键词 变化检测 非农化 双时相图像Transformer 细节特征增强卷积模块 TRANSFORMER
在线阅读 下载PDF
基于可变形卷积与Transformer的遥感影像变化检测方法
5
作者 苏志鹏 王欢 潘清莹 《遥感信息》 北大核心 2026年第1期155-162,共8页
针对当前遥感影像变化检测方法在复杂场景下全局建模能力不足、小目标检测效果差等问题,提出一种基于可变形卷积与Transformer的混合网络模型。首先,设计差异增强模块,通过通道注意力机制突出双时相影像的特征差异;其次,采用可变形卷积... 针对当前遥感影像变化检测方法在复杂场景下全局建模能力不足、小目标检测效果差等问题,提出一种基于可变形卷积与Transformer的混合网络模型。首先,设计差异增强模块,通过通道注意力机制突出双时相影像的特征差异;其次,采用可变形卷积改进ResNet18主干网络,增强对多尺度目标的特征提取能力;最后,引入Transformer编码-解码结构,建立全局上下文依赖关系。在LEVIR-CD和CDD数据集上的实验结果表明,该方法在F1分数和IoU指标上分别达到90.55%、80.98%和94.25%、89.57%,显著优于对比方法。消融实验证实各模块的有效性,其中可变形卷积使IoU提升1.86个百分点,差异增强模块使IoU提升0.71个百分点。该方法为提升复杂场景下的变化检测精度提供了有效解决方案。 展开更多
关键词 变化检测 可变形卷积 差异增强模块 TRANSFORMER
在线阅读 下载PDF
时空双重提取与频域增强的飞行轨迹预测
6
作者 骆晓宁 王燕妮 谷卓 《计算机系统应用》 2026年第1期228-236,共9页
为有效应对飞行轨迹预测中存在的复杂时空特性以及时域波动对预测精度带来的挑战,提出融合时空双重提取与频域增强的飞行轨迹预测方法.该方法结合时间卷积网络(TCN)与iTransformer模型旨在同时捕捉飞行轨迹序列中的局部时序特征与全局... 为有效应对飞行轨迹预测中存在的复杂时空特性以及时域波动对预测精度带来的挑战,提出融合时空双重提取与频域增强的飞行轨迹预测方法.该方法结合时间卷积网络(TCN)与iTransformer模型旨在同时捕捉飞行轨迹序列中的局部时序特征与全局变量交互关系,从而在不同层次和粒度上实现对数据特征的双重提取,有效挖掘其潜在的时空关联性.随后引入频域增强通道注意力机制(FECAM),通过离散余弦变换将轨迹特征转化为频域,并应用通道注意力机制强化转化后的频域信息,以减少时域波动带来的影响.实验基于三维飞行轨迹数据集,在爬升、巡航及降落阶段,该方法的平均绝对误差分别为1.15、0.15和0.82.结果表明相较于现有方法,所提方法在预测精度和稳定性方面均具有明显优势. 展开更多
关键词 飞行轨迹预测 时空双重特征提取模块 频域增强通道注意力机制 iTransformer 时间卷积网络
在线阅读 下载PDF
基于多尺度增强生成对抗网络的行人异常行为检测
7
作者 冯爽爽 范莎 邓超 《计算机工程与应用》 北大核心 2026年第4期190-200,共11页
针对行人异常行为检测中存在样本不均衡、目标尺度变化较大和背景干扰的问题,提出了一种基于多尺度增强生成对抗网络的行人异常行为检测方法。利用改进的U-Net作为生成器的主干网络,将卷积块注意力模块嵌入生成器的解码过程,降低背景的... 针对行人异常行为检测中存在样本不均衡、目标尺度变化较大和背景干扰的问题,提出了一种基于多尺度增强生成对抗网络的行人异常行为检测方法。利用改进的U-Net作为生成器的主干网络,将卷积块注意力模块嵌入生成器的解码过程,降低背景的干扰,实现对检测目标的特征提取和重构。在生成器的跳跃跨接中引入多尺度特征融合增强模块细化对不同目标的表达能力,并结合记忆模块设计多尺度记忆特征增强模块提高对正常行为的重构表现。进一步对损失函数进行改进,结合异常得分,完成对行人异常行为的检测。在UCSD Ped2、CUHK Avenue、Shanghai Tech三个数据集上测得该算法的AUC分别为98.6%、88.7%和77.3%,实验结果表明了该算法在不同场景中针对行人异常行为检测具有良好的检测效果。 展开更多
关键词 行人异常行为检测 生成对抗网络 卷积块注意力模块 多尺度增强模块 异常得分
在线阅读 下载PDF
基于局部边缘信息增强的芯片表面缺陷级联检测模型
8
作者 傅呈辉 迟荣华 +1 位作者 杨宏恩 李红旭 《半导体技术》 北大核心 2026年第3期270-279,297,共11页
为解决芯片表面缺陷检测中高精度与高实时性难以兼顾、小目标缺陷特征提取不足的问题,提出一种基于局部边缘信息增强的芯片表面缺陷级联检测模型。该模型构建50层残差网络(ResNet50)与目标检测模型的级联网络以快速筛除无缺陷样本,改进E... 为解决芯片表面缺陷检测中高精度与高实时性难以兼顾、小目标缺陷特征提取不足的问题,提出一种基于局部边缘信息增强的芯片表面缺陷级联检测模型。该模型构建50层残差网络(ResNet50)与目标检测模型的级联网络以快速筛除无缺陷样本,改进EfficientDet-D3高效检测模型得到基于跨层增强(CLE)机制的EfficientDet-CLE模型,设计局部边缘增强模块(LEEM)强化精细特征提取,并采用内容感知特征重组(CARAFE)上采样算子优化双向特征金字塔网络(BiFPN)特征融合。实验结果显示,改进后的模型在芯片数据集上的平均精度均值(mAP)达92.63%、每秒帧率(FPS)为113 f/s,相较于基准模型分别提高了5.5%和45 f/s,假接受率(FAR)、假拒绝率(FRR)分别降低了0.011%和0.088%。该模型实现了检测精度与速度的良好平衡,为半导体制造提供了高效、可靠的缺陷检测方案,具有重要的工程应用价值。 展开更多
关键词 缺陷检测 EfficientDet-D3 局部边缘信息增强模块 内容感知特征重组(CARAFE) 卷积神经网络(CNN)
原文传递
TungNetV2:轻量级多尺度融合的钨矿石X射线图像分类网络
9
作者 朱建勇 张志 +1 位作者 杨文龙 杨辉 《中南大学学报(自然科学版)》 北大核心 2026年第2期488-504,共17页
提出了一种轻量级多尺度融合的钨矿石X射线图像分类网络——TungNetV2,该模型基于MobileNetV2架构,通过三阶段优化实现矿石分类性能的突破。首先,在步长为2的倒残差结构中,采用空间与通道重构卷积替换升维卷积,结合通道扩展因子压缩与... 提出了一种轻量级多尺度融合的钨矿石X射线图像分类网络——TungNetV2,该模型基于MobileNetV2架构,通过三阶段优化实现矿石分类性能的突破。首先,在步长为2的倒残差结构中,采用空间与通道重构卷积替换升维卷积,结合通道扩展因子压缩与残差连接构建SRC-Resblock模块,显著降低特征冗余并提升计算效率;其次,在步长为1的倒残差结构及网络末端嵌入高效多尺度注意力机制,自适应融合多尺度空间与通道特征,强化图像关键区域聚焦能力;再次,设计特征增强模块,通过空洞卷积与全局池化协同优化多尺度特征表达,缓解注意力机制的局部特征过拟合问题;最后,在包含5753张图像的钨矿石X射线数据集上进行仿真实验。研究结果表明:TungNetV2测试集准确率达91.03%,较MobileNetV2提升2.86个百分点,单图推理时间仅为23.06 ms。与MobileNetV3、ShuffleNetV2、RepVit等模型对比,TungNetV2在准确率、F_(1)分数等指标上均具显著优势。本文所提方法为工业场景下钨矿石的实时分选提供了高精度、低延迟的解决方案。 展开更多
关键词 钨矿石 X射线图像分类 轻量级网络 空间与通道重构卷积 高效多尺度注意力机制 特征增强模块
在线阅读 下载PDF
一种改进YOLOv11的绝缘子缺陷检测算法
10
作者 吕相霖 宋运 +5 位作者 林家兴 田力 谢峰 卫科 王光祥 孙伟 《四川电力技术》 2026年第1期81-88,共8页
针对现有绝缘子缺陷检测模型在复杂场景下适应性不足、特征表达能力弱及背景干扰导致的精度下降问题,提出了一种结合移位卷积模块、空间增强注意力模块检测头和三重注意力机制模块的改进YOLOv11-SST算法。首先,通过在骨干部分引入三重... 针对现有绝缘子缺陷检测模型在复杂场景下适应性不足、特征表达能力弱及背景干扰导致的精度下降问题,提出了一种结合移位卷积模块、空间增强注意力模块检测头和三重注意力机制模块的改进YOLOv11-SST算法。首先,通过在骨干部分引入三重注意力机制,优化特征提取网络对局部细节与全局语义的协同感知能力;其次,在颈部网络中嵌入移位卷积模块,通过特征图空间偏移策略增强跨尺度特征的空间关联性,在减少冗余计算的同时有效提升小尺寸缺陷目标的定位精度;最后,设计了空间增强注意力检测头模块,结合辅助监督与自适应特征校准机制,强化模型对多尺度缺陷特征的学习鲁棒性。通过实验表明,所提出的YOLOv11-SST算法在电力巡检数据集上的平均检测精度均值达到90.6%,较基准模型提升了2.2个百分点,且单帧推理速度减少了1.4 ms。 展开更多
关键词 缺陷检测 三重注意力机制 移位卷积 空间增强注意力模块检测头
在线阅读 下载PDF
Using Hybrid Penalty and Gated Linear Units to Improve Wasserstein Generative Adversarial Networks for Single-Channel Speech Enhancement
11
作者 Xiaojun Zhu Heming Huang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第6期2155-2172,共18页
Recently,speech enhancement methods based on Generative Adversarial Networks have achieved good performance in time-domain noisy signals.However,the training of Generative Adversarial Networks has such problems as con... Recently,speech enhancement methods based on Generative Adversarial Networks have achieved good performance in time-domain noisy signals.However,the training of Generative Adversarial Networks has such problems as convergence difficulty,model collapse,etc.In this work,an end-to-end speech enhancement model based on Wasserstein Generative Adversarial Networks is proposed,and some improvements have been made in order to get faster convergence speed and better generated speech quality.Specifically,in the generator coding part,each convolution layer adopts different convolution kernel sizes to conduct convolution operations for obtaining speech coding information from multiple scales;a gated linear unit is introduced to alleviate the vanishing gradient problem with the increase of network depth;the gradient penalty of the discriminator is replaced with spectral normalization to accelerate the convergence rate of themodel;a hybrid penalty termcomposed of L1 regularization and a scale-invariant signal-to-distortion ratio is introduced into the loss function of the generator to improve the quality of generated speech.The experimental results on both TIMIT corpus and Tibetan corpus show that the proposed model improves the speech quality significantly and accelerates the convergence speed of the model. 展开更多
关键词 Speech enhancement generative adversarial networks hybrid penalty gated linear units multi-scale convolution
在线阅读 下载PDF
自适应卷积约束与全局上下文推理的墓室壁画修复 被引量:1
12
作者 吴萌 郭歌 +2 位作者 孙增国 路智勇 张倩文 《中国图象图形学报》 北大核心 2025年第3期737-754,共18页
目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复... 目的墓室壁画作为地下文物,由于环境湿度、地仗沉降等因素,局部区域出现了脱落、裂缝、霉变等多种病害,导致画面部分缺失。但现有深度学习的修复方法通常在单一维度或固定区域进行信息重建,无法充分捕获稀疏的壁画特征和修复多样化的复杂病害,修复时会出现内容缺失、结构错乱等问题。对此,提出一种自适应卷积约束与全局上下文推理的墓室壁画修复。方法基于端到端的编码器—解码器架构,首先设计多尺度增强卷积模块,从频域和空域联合分析图像特性来充分捕获全局结构和局部纹理;同时在修复路径中加入融合差分卷积的增强激活单元来引入边缘先验信息,提高模型的绘制精度。其次,考虑到纹理和结构在绘制过程中的模式差异,在编码器—解码器间设计基于注意力交互引导的多尺度特征聚合模块,来加强全局稀疏信息的表征能力和相关性,并自适应选择增强有效特征。此外,为了获得真实准确的结果,在特征传递过程中利用自动掩码更新迭代来预测复杂缺失信息,引导解码器精确绘制多样化的损伤区域。结果本文采用客观评价指标峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity index,SSIM)和学习感知图像块相似度(learned perceptual image patch similarity,LPIPS)在章怀太子墓“马球图”数据集上进行3类模拟病害和真实病害修复实验,并与6种主流方法进行比较。实验结果表明,本文方法修复的壁画图像在主观视觉和客观评价上均有明显提升。相较于指标排名第2的模型,对于随机缺失区域的壁画修复,峰值信噪比和结构相似性的均值分别达到31.7602dB和0.9577,各指标的样本均值分别提升了2.3653 dB、0.0128和12.75%。结论本文提出的图像修复模型可以有效修复多种复杂病害,可为手工绘制专家的物理修复提供参考,进一步促进了数字文化遗产的可持续研究与保护。 展开更多
关键词 壁画修复 多尺度增强卷积模块 多尺度特征聚合模块 增强激活单元 差分卷积 病害修复
原文传递
结合并联Transformer和残差U-Net网络的水下图像增强 被引量:1
13
作者 陈清江 李宗莹 《电子科技》 2025年第8期57-65,共9页
针对光在水中传播时被吸收,水下图像存在颜色失真、对比度低和细节模糊等问题,文中设计了一个基于并联Transformer和残差卷积的U-Net网络进行水下图像增强。在新U-Net结构中,在编码和解码部分分别置入混合卷积Transformer块(Hybrid Conv... 针对光在水中传播时被吸收,水下图像存在颜色失真、对比度低和细节模糊等问题,文中设计了一个基于并联Transformer和残差卷积的U-Net网络进行水下图像增强。在新U-Net结构中,在编码和解码部分分别置入混合卷积Transformer块(Hybrid Convolution Transformer Block,HCTB)。综合了Transformer的捕获全局信息能力和卷积块捕获局部信息能力,并且在跳跃连接部分搭建了若干平行注意模块(Parallel Attention Module,PAM)来提取更重要的像素和通道信息。采用现有UIEB(Underwater Image Enhancement Benchmark dataset)配对数据集对网络进行训练。为验证所提算法的有效性,选取不同偏色程度的水下图像进行实验与测试。实验结果表明,所提模型较其他先进模型的峰值信噪比PSNR(Peak Single-to-Ratio)值提升了4.3%,获得了较好的主观和客观评价结果,有效提升了水下图像的增强水平。 展开更多
关键词 水下图像增强 TRANSFORMER 残差卷积 U-Net网络 平行注意模块 通道注意 像素注意 卷积神经网络 深度学习
在线阅读 下载PDF
基于改进YOLOv7的煤矿输送带上异物检测方法
14
作者 王媛彬 王小龙 +1 位作者 王旭 郭亚茹 《煤炭科学技术》 北大核心 2025年第11期201-215,共15页
矿井输送带异物检测对于保障煤矿安全生产和提升自动化水平具有重要意义。然而,受井下光照不足、强点光源干扰以及背景复杂等因素影响,传统机器视觉方法在异物识别中存在检测精度低、漏检率高等问题,尤其在面对多尺度及小尺寸异物目标... 矿井输送带异物检测对于保障煤矿安全生产和提升自动化水平具有重要意义。然而,受井下光照不足、强点光源干扰以及背景复杂等因素影响,传统机器视觉方法在异物识别中存在检测精度低、漏检率高等问题,尤其在面对多尺度及小尺寸异物目标时效果不佳,同时有限的异物样本也制约了模型的训练效果。为此,提出一种融合特征增强结构与聚焦线性注意力机制的改进型YOLOv7异物检测算法。首先,在主干网络中引入构建的特征增强模块,通过多尺度并行结构与可切换空洞卷积扩展感受野,增强模型对小目标异物的特征提取能力;其次,融合聚焦线性注意力机制,有效抑制复杂背景干扰,提升模型对关键异物区域的关注力与判别能力;然后,设计高效动态蛇形卷积模块,以适应条状异物的几何特性,并提升特征融合阶段的语义表达能力;此外,采用具有方向感知能力的SIOU损失函数,增强边界框的拟合精度与训练收敛效率;最后,引入迁移学习策略,在通用数据集上进行预训练,并迁移至煤矿输送带异物检测任务中,以缓解小样本数据带来的训练难题。在CUMT-BELT数据集上的试验结果表明,本文提出的算法检测精度达到了89.3%,相较于基线模型YOLOv7提升了9.3%。同时,研究提出的算法在检测精度、召回率和mAP@0.5等指标上均显著优于其他主流的检测方法,尤其在多尺度、小目标及条状异物检测任务中表现出更强的鲁棒性与适应性,验证了所提方法在复杂矿井场景下的有效性与实用性。 展开更多
关键词 异物检测 YOLOv7 特征增强模块 聚焦线性注意力 高效动态蛇形卷积 SIOU
在线阅读 下载PDF
基于生成式对抗网络的多帧压缩视频增强方法
15
作者 胡锐 程家亮 《苏州科技大学学报(自然科学版)》 2025年第4期46-52,共7页
视频已逐渐成为互联网流量的主要组成部分,为了降低存储与传输的成本,通常会对视频进行压缩,以减小其文件大小,这将导致视频的主观品质降低,并产生不自然的块状效应。现有以增强视频PSNR为导向的视频增强方法往往会造成过于模糊平滑的结... 视频已逐渐成为互联网流量的主要组成部分,为了降低存储与传输的成本,通常会对视频进行压缩,以减小其文件大小,这将导致视频的主观品质降低,并产生不自然的块状效应。现有以增强视频PSNR为导向的视频增强方法往往会造成过于模糊平滑的结果,并不符合人的主观体验。为了缓解该问题,本文提出一种基于生成式对抗网络的多帧压缩视频增强方法,以提高多种压缩程度下视频的感知质量。该方法通过包含可变形卷积和注意力模块的对齐融合模块高效地聚合相邻帧的时空信息,其中可变形卷积核能够适应性地掌握卷积核的采样点,更好地捕捉视频中物体的运动信息;建立在通道注意力机制上的注意力单元,可对不同帧的特征进行重要性区分,为不同通道赋予不同权重,从而提高特征表示的区分性。同时引入对抗训练,重建更具纹理细节的高清图像。实验结果表明,所提方法具有良好的感知质量增强性能,与其他方法相比更具优越性,实现了明显的压缩视频质量增强效果。 展开更多
关键词 视频增强 生成式对抗网络 可变形卷积 注意力模块
在线阅读 下载PDF
FA-CGRNet:无创高血糖预测的分类模型
16
作者 王蕾 赵康 殷秀强 《计算机与现代化》 2025年第10期44-50,共7页
现有的血糖检测方法多具创伤性,带来诸多不便和潜在风险。若能通过可穿戴设备获取生理数据及用户自输入的饮食数据,实时预测用户是否为高血糖,将能显著简化血糖检测过程。为了提高预测的精确度,本文提出一种基于深度学习的时间序列分类... 现有的血糖检测方法多具创伤性,带来诸多不便和潜在风险。若能通过可穿戴设备获取生理数据及用户自输入的饮食数据,实时预测用户是否为高血糖,将能显著简化血糖检测过程。为了提高预测的精确度,本文提出一种基于深度学习的时间序列分类模型—FA-CGRNet。首先,对生理数据进行降噪、重采样等预处理,提取其统计特征。随后,设计残差卷积网络,通过卷积和残差连接实现特征的提取和融合,同时利用特征增强模块计算特征权重,对特征进行筛选。最后,采用LSTM模型提取时间序列的长期依赖特征,以充分捕捉时序特征。在杜克大学BIG IDEAs实验室发布的公开数据集上进行测试,实验结果表明,在无创血糖检测领域,本文提出的特征提取方法和网络模型,与现有的时间序列分类模型相比,能更好地区分正负例,加权F1分数提高了6.1%以上,AUC提高了2.5%以上。 展开更多
关键词 无创高血糖预测 残差卷积 长短期记忆网络 特征增强模块 神经网络
在线阅读 下载PDF
基于改进YOLOv8n的手机屏幕瑕疵检测算法:PGS-YOLO 被引量:2
17
作者 周思瑜 徐慧英 +4 位作者 朱信忠 黄晓 盛轲 曹雨淇 陈晨 《计算机工程》 北大核心 2025年第5期326-339,共14页
手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况,提出... 手机屏幕作为人机交互的主窗口,已成为影响用户体验和终端整体性能的重要因素。因此,市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求,针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况,提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头,并结合SeaAttention注意力模块,有效提升对小目标的探测能力;将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块,在保证精度的同时降低模型的参数量,提高瑕疵检测的速度与效率。实验结果表明,在北京大学手机屏幕表面瑕疵数据集中,相较于YOLOv8n,PGS-YOLO算法的mAP@0.5提升了2.5百分点,mAP@0.5∶0.95提升了2.2百分点,在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测,还能对小瑕疵保持一定的准确度。此外,检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时,参数量仅为2.0×10^(6),小于YOLOv8n,满足工业场景对手机屏幕瑕疵检测的需求。 展开更多
关键词 YOLOv8n模型 手机屏幕瑕疵检测 小目标检测 部分卷积 GhostNetV2轻量化模块 挤压增强轴向注意力
在线阅读 下载PDF
基于Ghost卷积与自适应注意力的点云分类 被引量:2
18
作者 舒密 王占刚 《现代电子技术》 北大核心 2025年第6期106-112,共7页
点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,... 点云Transformer网络在提取三维点云的局部特征和携带的多级自注意力机制方面展现出了卓越的特征学习能力。然而,多级自注意力层对计算和内存资源的要求极高,且未充分考虑特征融合中层级间以及通道间的区分度与关联性。为解决上述问题,提出一种基于点云Transformer的轻量级特征增强融合分类网络EFF-LPCT。EFF-LPCT使用一维化Ghost卷积对原始网络进行重构,以降低计算复杂度和内存要求;引入自适应支路权重,以实现注意力层级间的多尺度特征融合;利用多个通道注意力模块增强特征的通道交互信息,以提高模型分类效果。在ModelNet40数据集进行的实验结果表明,EFF-LPCT在达到93.3%高精度的同时,相较于点云Transformer减少了1.11 GFLOPs的浮点计算量和0.86×10^(6)的参数量。 展开更多
关键词 点云分类 Transformer网络 Ghost卷积 特征增强融合模块 ECA通道注意力 特征学习
在线阅读 下载PDF
结合多尺度信息和特征增强的息肉分割方法 被引量:1
19
作者 汪琴韵 于瓅 《新疆师范大学学报(自然科学版)》 2025年第1期1-10,共10页
计算机辅助诊断技术在结肠息肉图像分割中具有十分重要的作用。本研究针对结肠息肉分割存在的边缘检测分割比较复杂、息肉与正常组织对比度较低等问题,使用DeepLabv3+模型进行息肉分割并对其进行改进。该模型将残差网络作为主干网络进... 计算机辅助诊断技术在结肠息肉图像分割中具有十分重要的作用。本研究针对结肠息肉分割存在的边缘检测分割比较复杂、息肉与正常组织对比度较低等问题,使用DeepLabv3+模型进行息肉分割并对其进行改进。该模型将残差网络作为主干网络进行特征信息提取,引入特征强化模块对低层次特征进行处理,并加入混合注意力机制对高层次特征进行关键信息的捕捉。得到改进模型在Kvasir-SEG与CVC-ClinicDB两个数据集上的mIoU为82.19%和90.40%.实验结果表明,改进的模型息肉分割效果优于初始DeepLabv3+模型,在息肉分割的精度以及边缘分割上有一定提升。 展开更多
关键词 DeepLabv3+ 息肉分割 混合注意力 特征增强 残差网络
在线阅读 下载PDF
基于AOD-Net改进的多尺度图像去雾算法
20
作者 王超 王婷 +1 位作者 王少军 杨万扣 《计算机工程》 北大核心 2025年第7期305-313,共9页
经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式... 经典AOD-Net(All in One Dehazing Network)去雾后的图像存在细节清晰度不足、明暗反差过大和画面昏暗等问题。为了解决这些图像去雾问题,提出一种在AOD-Net基础上改进的多尺度算法。改进的网络结构采用深度可分离卷积替换传统卷积方式,减少了冗余参数量,加快了计算速度并有效地减少了模型的内存占用量,从而提高了算法去雾效率;同时采用多尺度结构在不同尺度上对雾图进行分析和处理,更好地捕捉图像的细节信息,提升了网络对图像细节的处理能力,解决了原算法去雾时存在的细节模糊问题;最后在网络结构中加入金字塔池化模块,用于整合图像不同区域的上下文信息,扩展了网络的感知范围,从而提高网络模型获取有雾图像全局信息的能力,进而改善图像色调失真、细节丢失等问题。此外,引入一个低照度增强模块,通过明确预测噪声实现去噪的目标,从而恢复曝光不足的图像。在低光去雾图像中,峰值信噪比(PSNR)和结构相似性(SSIM)指标均有显著提升,处理后的图片具有更高的整体自然度。实验结果表明:与经典AOD-Net去雾的结果相比,改进算法能够更好地恢复图像的细节和结构,使得去雾后的图像更自然,饱和度和对比度也更加平衡;在RESIDE的SOTS数据集中的室外和室内场景,相较于经典AOD-Net,改进算法的PSNR分别提升了4.5593 dB和4.0656 dB,SSIM分别提升了0.0476和0.0874。 展开更多
关键词 多尺度网络结构 深度可分离卷积 金字塔池化模块 低照度增强模块 图像去雾
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部