期刊文献+
共找到298篇文章
< 1 2 15 >
每页显示 20 50 100
RFLE-Net:Refined Feature Extraction and Low-Loss Feature Fusion Method in Semantic Segmentation of Medical Images
1
作者 Fan Zhang Zihao Zhang +5 位作者 Huifang Hou Yale Yang Kangzhan Xie Chao Fan Xiaozhen Ren Quan Pan 《Journal of Bionic Engineering》 2025年第3期1557-1572,共16页
The application of transformer networks and feature fusion models in medical image segmentation has aroused considerable attention within the academic circle.Nevertheless,two main obstacles persist:(1)the restrictions... The application of transformer networks and feature fusion models in medical image segmentation has aroused considerable attention within the academic circle.Nevertheless,two main obstacles persist:(1)the restrictions of the Transformer network in dealing with locally detailed features,and(2)the considerable loss of feature information in current feature fusion modules.To solve these issues,this study initially presents a refined feature extraction approach,employing a double-branch feature extraction network to capture complex multi-scale local and global information from images.Subsequently,we proposed a low-loss feature fusion method-Multi-branch Feature Fusion Enhancement Module(MFFEM),which realizes effective feature fusion with minimal loss.Simultaneously,the cross-layer cross-attention fusion module(CLCA)is adopted to further achieve adequate feature fusion by enhancing the interaction between encoders and decoders of various scales.Finally,the feasibility of our method was verified using the Synapse and ACDC datasets,demonstrating its competitiveness.The average DSC(%)was 83.62 and 91.99 respectively,and the average HD95(mm)was reduced to 19.55 and 1.15 respectively. 展开更多
关键词 Multi-organ medical image segmentation Fine-grained dual branch feature extractor Low-Loss feature fusion module
在线阅读 下载PDF
Digital modulation classification using multi-layer perceptron and time-frequency features
2
作者 Yuan Ye Mei Wenbo 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第2期249-254,共6页
Considering that real communication signals corrupted by noise are generally nonstationary, and timefrequency distributions are especially suitable for the analysis of nonstationary signals, time-frequency distributio... Considering that real communication signals corrupted by noise are generally nonstationary, and timefrequency distributions are especially suitable for the analysis of nonstationary signals, time-frequency distributions are introduced for the modulation classification of communication signals: The extracted time-frequency features have good classification information, and they are insensitive to signal to noise ratio (SNR) variation. According to good classification by the correct rate of a neural network classifier, a multilayer perceptron (MLP) classifier with better generalization, as well as, addition of time-frequency features set for classifying six different modulation types has been proposed. Computer simulations show that the MLP classifier outperforms the decision-theoretic classifier at low SNRs, and the classification experiments for real MPSK signals verify engineering significance of the MLP classifier. 展开更多
关键词 Digital modulation classification Time-frequency feature Time-frequency distribution multi-layer perceptron.
在线阅读 下载PDF
A Robust Rating Prediction Model for Recommendation Systems Based on Fake User Detection and Multi-Layer Feature Fusion
3
作者 Zhigeng Han Ting Zhou +2 位作者 Geng Chen Jian Chen Chunshuo Fu 《Big Data Mining and Analytics》 2025年第2期292-309,共18页
The effectiveness of recommendation systems heavily relies on accurately predicting user ratings for items based on user preferences and item attributes derived from ratings and reviews.However,the increasing presence... The effectiveness of recommendation systems heavily relies on accurately predicting user ratings for items based on user preferences and item attributes derived from ratings and reviews.However,the increasing presence of fake user data in these ratings and reviews poses significant challenges,hindering feature extraction,diminishing rating prediction accuracy,and eroding user trust in the system.To tackle this issue,we propose a robust rating prediction model for recommendation systems that integrates fake user detection and multi-layer feature fusion.Our model utilizes a GraphSAGE-based submodel to filter out fake user data from rating data and review texts.To strengthen fake user detection,we enhance GraphSAGE by selecting aggregation neighbors based on the collusion fraud degree among users,and employ an attention mechanism to weigh the contribution of each neighbor during representation aggregation.Furthermore,we introduce a multi-layer feature fusion submodel to integrate diverse features extracted from the filtered ratings and reviews.For deep feature extraction from review texts,we implement a temporal attention mechanism to analyze the relevance of reviews over time.For shallow feature extraction from rating data,we incorporate trust evaluation mechanism and cloud model to assess the influence of trusted neighbors’ratings.In our evaluation,we compare our model against six baseline models for fake user detection and four rating prediction models across five datasets.The results demonstrate that our model exhibits significant performance advantages in both fake user detection and rating prediction. 展开更多
关键词 recommendation system rating prediction fake user detection multi-layer feature fusion Graph Neural Network(GNN)
原文传递
FIBTNet:Building Change Detection for Remote Sensing Images Using Feature Interactive Bi-Temporal Network
4
作者 Jing Wang Tianwen Lin +1 位作者 Chen Zhang Jun Peng 《Computers, Materials & Continua》 SCIE EI 2024年第9期4621-4641,共21页
In this paper,a feature interactive bi-temporal change detection network(FIBTNet)is designed to solve the problem of pseudo change in remote sensing image building change detection.The network improves the accuracy of... In this paper,a feature interactive bi-temporal change detection network(FIBTNet)is designed to solve the problem of pseudo change in remote sensing image building change detection.The network improves the accuracy of change detection through bi-temporal feature interaction.FIBTNet designs a bi-temporal feature exchange architecture(EXA)and a bi-temporal difference extraction architecture(DFA).EXA improves the feature exchange ability of the model encoding process through multiple space,channel or hybrid feature exchange methods,while DFA uses the change residual(CR)module to improve the ability of the model decoding process to extract different features at multiple scales.Additionally,at the junction of encoder and decoder,channel exchange is combined with the CR module to achieve an adaptive channel exchange,which further improves the decision-making performance of model feature fusion.Experimental results on the LEVIR-CD and S2Looking datasets demonstrate that iCDNet achieves superior F1 scores,Intersection over Union(IoU),and Recall compared to mainstream building change detectionmodels,confirming its effectiveness and superiority in the field of remote sensing image change detection. 展开更多
关键词 Change detection change residual module feature exchange mechanism feature fusion
在线阅读 下载PDF
基于改进Swin Transformer的人脸活体检测 被引量:2
5
作者 王旭光 卜辰宇 时泽宇 《中国测试》 北大核心 2025年第6期31-39,共9页
随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型... 随着人脸识别技术的发展,人脸活体检测作为人脸识别系统的安全保障变得更加重要。但当前主流的人脸活体检测模型仅针对特定的检测场景及欺诈攻击方式,面对未知攻击的鲁棒性和泛化能力较差。为此,该文提出一种改进的Swin Transformer模型,即CDCSwin-T(central difference convolution Swin Transformer)模型。该模型以Swin Transformer为主干,利用其滑动窗口注意力机制提取人脸全局信息,同时引入中心差分卷积(central difference convolution,CDC)模块提取人脸局部信息,加强主干模型捕获真假人脸差异的能力,从而增强其面对未知攻击的鲁棒性;另外在主干模型中引入瓶颈注意力模块,引导模型关注人脸关键信息,加速模型训练;最终将主干模型不同阶段的多尺度信息进行自适应融合,进一步提升该文模型的泛化能力。CDCSwin-T模型在OULU-NPU数据集4个协议上的平均分类错误率(ACER)分别为0.2%,1.1%,(1.1±0.6)%,(2.8±1.4)%,在CASIA-MFSD和REPLAYATTACK数据集跨库测试上的半错误率(HTER)分别为14.1%,22.9%,均优于当前的主流模型,表明其面对未知攻击的鲁棒性和泛化能力均有所提升。 展开更多
关键词 人脸活体检测 Swin Transformer 瓶颈注意力模块 特征融合
在线阅读 下载PDF
基于多尺度特征融合SSDLite的光伏组件缺陷检测 被引量:1
6
作者 项新建 汤卉 +3 位作者 肖家乐 王世乾 张颖超 王磊 《太阳能学报》 北大核心 2025年第1期669-675,共7页
为了应对光伏组件缺陷检测中人工检测速度缓慢以及使用YOLO等深度学习模型时速度较慢且硬件成本高的问题,提出一种基于SSDLite的多层特征融合轻量化目标检测方法。该方法采用MobileNetV2作为SSDLite模型的骨干网络,并从中提取3个不同层... 为了应对光伏组件缺陷检测中人工检测速度缓慢以及使用YOLO等深度学习模型时速度较慢且硬件成本高的问题,提出一种基于SSDLite的多层特征融合轻量化目标检测方法。该方法采用MobileNetV2作为SSDLite模型的骨干网络,并从中提取3个不同层次的特征层进行特征融合。针对不同缺陷的尺寸特点,对模型中的先验框的大小也进行了重新设计。在MobileNetV2的瓶颈结构中引入CBAM注意力机制,以提高模型的检测精度。相比传统的SSDLite模型,该文模型平均精度从65.8%提高至72.4%,虽然速度略微下降,但已基本满足实际应用的需求。 展开更多
关键词 光伏组件 目标检测 深度学习 SSDLite 多层特征融合 MobileNetV2
原文传递
基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别 被引量:3
7
作者 毛清华 苏毅楠 +3 位作者 贺高峰 翟姣 王荣泉 尚新芒 《工矿自动化》 北大核心 2025年第1期11-20,103,共11页
针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换... 针对煤矿带式输送机场景存在尘雾干扰严重、背景环境复杂、人员尺度多变且易遮挡等因素导致人员入侵危险区域识别准确率不高等问题,提出一种基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别系统。改进YOLOv8模型通过替换主干网络C2f模块为C2fER模块,加强模型的细节特征提取能力,提升模型对小目标人员的识别性能;通过在颈部网络引入特征强化加权双向特征金字塔网络(FE-BiFPN)结构,提高模型的特征融合能力,从而提升模型对多尺度人员目标的识别效果;通过引入分离增强注意力模块(SEAM)增强模型在复杂背景下对局部特征的关注度,提升模型对遮挡目标人员的识别能力;通过引入WIoU损失函数增强训练效果,提升模型识别准确率。消融实验结果表明:改进YOLOv8模型的准确率较基线模型YOLOv8s提升2.3%,mAP@0.5提升3.4%,识别速度为104帧/s。人员识别实验结果表明:与YOLOv10m,YOLOv8s-CA、YOLOv8s-SPDConv和YOLO8n模型相比,改进YOLOv8模型对小目标、多尺度目标、遮挡目标的识别效果均更佳,识别准确率为90.2%,mAP@0.5为87.2%。人员入侵危险区域实验结果表明:井下人员入侵带式输送机危险区域智能识别系统判别人员入侵危险区域的平均准确率为93.25%,满足识别需求。 展开更多
关键词 煤矿带式输送机 人员入侵危险区域 YOLOv8模型 遮挡目标检测 小目标检测 多尺度融合 C2fER模块 特征强化加权双向特征金字塔网络结构
在线阅读 下载PDF
融合多特征的水声通信信号调制识别方法
8
作者 王洋 沈同圣 +3 位作者 汪涛 乔钢 周锋 刘峰 《声学学报》 北大核心 2025年第5期1338-1348,共11页
针对水声通信信号的特征易受信道噪声和多径效应等复杂水声环境的影响导致识别率较低的问题,提出了一种融合多特征的水声通信调制识别方法。首先,为获取抗噪性能更强的信号特征,设计了小波时频特征与平方功率谱、自相关谱的最强两谱线... 针对水声通信信号的特征易受信道噪声和多径效应等复杂水声环境的影响导致识别率较低的问题,提出了一种融合多特征的水声通信调制识别方法。首先,为获取抗噪性能更强的信号特征,设计了小波时频特征与平方功率谱、自相关谱的最强两谱线特征相融合的方法;其次,基于迁移学习理论构建轻量化网络模型,以时频特征完成2FSK和4FSK信号的识别;最后,设计粒子群优化的支持向量机,根据最强两谱线特征实现对非频移键控信号(包括BPSK、QPSK、DSSS和OFDM信号)的识别。仿真结果表明该方法对水声信道和环境噪声具有良好的泛化能力,海试数据验证了该方法的识别率优于现有的神经网络模型。 展开更多
关键词 水声通信 调制识别 多特征融合 轻量化网络
原文传递
融合注意力机制和快速网络的口罩人脸检测算法 被引量:1
9
作者 兰红 王恪 陈子怡 《微电子学与计算机》 2025年第5期81-92,共12页
口罩人脸检测是智能监控系统中的关键部分,在城市管理和公共卫生安全等方面有着重要意义。针对口罩人脸检测在处理光照条件、遮挡等问题的图像时出现的漏检和检测不准确问题,提出了FSR-YOLOv8口罩人脸检测算法。该算法通过在骨干网络中... 口罩人脸检测是智能监控系统中的关键部分,在城市管理和公共卫生安全等方面有着重要意义。针对口罩人脸检测在处理光照条件、遮挡等问题的图像时出现的漏检和检测不准确问题,提出了FSR-YOLOv8口罩人脸检测算法。该算法通过在骨干网络中融合了优化的FasterNeXt,从而提高了检测速度和减少了参数量。同时,通过在特征融合点间加入改进的SPCBAM注意力机制,模型能更有效地提取关键特征,减少背景干扰。此外,构建了RFB_HDC_BD模块显著提高了特征语义信息的利用率。在同等情况下,FSR-YOLOv8优于YOLOv8以及其他主流算法。该模型在公开的AIZOO数据集上的m_(AP)值达到了96.2%,在自制数据集上的m_(AP)值达到了89.2%,且模型参数量相比于YOLOv8模型降低了16%,参数量减低的同时具有较高的精确度。 展开更多
关键词 口罩人脸检测 注意力机制 快速网络 特征融合模块 YOLOv8n
在线阅读 下载PDF
CSD-YOLOv8的输电线路故障目标检测
10
作者 马旭 王锐 +6 位作者 邓军 常驰 郝帅 李添麒 刘峥岐 李国亮 赵晴 《西安科技大学学报》 北大核心 2025年第2期383-392,共10页
针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入... 针对无人机巡检输电线路过程中待检测目标受复杂背景干扰、故障目标部分遮挡以及目标多尺度造成传统算法难以准确检测的问题,提出一种基于CSD-YOLOv8的输电线路故障目标检测方法。首先,以YOLOv8网络作为基础框架,并在其主干网络中引入空间金字塔池化将不同尺度特征进行融合;然后,在检测网络头部中引入深度可分离卷积,并将其与交叉卷积连接模块结合,实现对部分遮挡目标的准确检测;此外,设计基于通道注意力机制的特征融合模块对不同层级特征进行加权融合,提高复杂背景下故障目标特征信息提取能力;最后,利用某电力巡检部门近5年的巡检数据对所提出算法进行验证。结果表明:相比于4种经典对比算法,所提方法在对12种故障类型检测效果的综合指标最好,平均检测精度为94.7%,召回率为93.0%。与此同时,所提算法具有较好的实时性,对于分辨率为1280×720的图像检测速度为45帧/s,为输电线路的智能巡检奠定了坚实的理论基础。 展开更多
关键词 YOLOv8 多尺度检测 通道注意力机制 特征融合 深度可分离模块
在线阅读 下载PDF
基于多类特征融合的动态足迹检索方法
11
作者 朱明 骆刚 +3 位作者 傅枭鑫 王年 鲁玺龙 张艳 《刑事技术》 2025年第2期141-147,共7页
足迹特征作为人体的生物特征之一,在身份识别领域有着重要的地位。针对不同人之间的足迹有着相似性的问题,本文将动态足迹作为研究对象,提出了一种基于多类特征融合的动态足迹检索方法。首先,采用卷积神经网络提取动态足迹的帧级特征;然... 足迹特征作为人体的生物特征之一,在身份识别领域有着重要的地位。针对不同人之间的足迹有着相似性的问题,本文将动态足迹作为研究对象,提出了一种基于多类特征融合的动态足迹检索方法。首先,采用卷积神经网络提取动态足迹的帧级特征;然后,特征融合模块通过一个可训练的权重矩阵与帧级特征进行运算,从而得到融合后动态足迹完整的表观特征;其次,通过时空融合模块的时间聚合支路提取帧级特征内长期的时间特征,再通过正交融合的计算方法将长期的时间特征与帧级特征融合,形成时空特征;最后,将表观特征和时空特征融合进行动态足迹的检索。在200人的动态足迹数据集上与现有深度学习算法进行了对比实验,实验结果表明,该方法获得了更好的检索效果,其中Rank1和mAP分别为85.39%、55.28%。 展开更多
关键词 足迹检索 特征融合模块 时空特征融合模块 动态足迹 深度学习 神经网络 图像检索
在线阅读 下载PDF
基于孪生网络的特征融合位移RGB-T目标跟踪
12
作者 李海燕 曹永辉 +1 位作者 郎恂 李海江 《湖南大学学报(自然科学版)》 北大核心 2025年第4期68-78,共11页
为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多... 为解决现有目标跟踪算法深层次特征提取困难、不能充分利用跨模态信息以及目标特征表示较弱等问题,提出了基于孪生网络的特征融合位移RGB-T目标跟踪算法.首先,基于可见光模态SiameseRPN++的目标跟踪框架,扩展设计红外模态分支,以获得多模态目标跟踪框架,设计了改进步长的ResNet50作为特征提取网络,有效挖掘目标的深层次特征.随后,设计特征交互学习模块,利用一种模态的判别信息引导另一种模态的目标外观特征学习,挖掘特征空间和通道中的跨模态信息,增强网络对前景信息的关注.然后,设计多模特征融合模块计算输入的可见光图像和红外图像的特征融合度,对不同模态的重要特征进行空间融合以去除冗余信息,并采用级联融合策略重建多模态图像,增强目标特征表示.最后,设计特征空间位移模块,分割红外模态分支的特征图并向四个不同方向移位,增强热源目标特征的边缘表示.在两个RGB-T数据集上的实验验证了提出算法的有效性,消融实验证明了设计的单个模块的优越性. 展开更多
关键词 RGB-T跟踪 多模特征融合模块 特征空间位移模块 特征交互学习模块
在线阅读 下载PDF
噪声背景下梅尔频率倒谱系数与多注意力网络在电机故障诊断中的应用
13
作者 宋恩哲 朱仁杰 +2 位作者 靖海国 姚崇 柯赟 《哈尔滨工程大学学报》 北大核心 2025年第3期475-485,共11页
针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模... 针对电机实际工作过程中存在噪声干扰导致故障诊断精度下降的问题,本文提出了一种基于梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络的故障诊断方法。通过梅尔频率倒谱系数动态特征提取噪声信号中的低频信息,并结合卷积注意力模块的自适应调节能力及多特征融合策略进一步减少噪声对故障诊断的干扰。通过电机台架数据验证了该方法在噪声条件下诊断的可行性,然而该方法受梅尔频率倒谱系数参数与网络结构的直接影响,因此具体分析了不同参数条件对抗噪性能的影响。实验结果表明:在信噪比-10 dB噪声背景下,梅尔频率倒谱系数动态特征与多注意力融合卷积神经网络相结合的故障诊断方法仍保持90%以上的诊断精度。 展开更多
关键词 电机 故障诊断 噪声环境 梅尔频率倒谱系数 卷积神经网络 多尺度 卷积注意力模块 特征融合
在线阅读 下载PDF
基于Transformer两阶段策略的古代服饰线图提取
14
作者 周蓬勃 冯龙 +1 位作者 武浩东 寇宇帆 《西北大学学报(自然科学版)》 北大核心 2025年第1期75-84,共10页
古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第... 古代服饰线图提取旨在精确获取轮廓与形状信息,以助于再创作和传统服饰保护。但现有方法增加网络以提高泛化性,导致参数量大增。为此,提出了基于Transformer的两阶段边缘检测方法,旨在解决图像局部信息丢失以及模型参数量大的问题。第一阶段将图像分割成16×16粗粒度补丁,利用编码器进行全局自注意力计算以捕获补丁间依赖;第二阶段采用8×8细粒度无重叠滑动窗口覆盖图像,通过局部编码器计算窗口内注意力有效捕捉细微边缘且降低成本。设计了轻量特征融合模块,支持全局与局部特征的高效整合。实验结果表明,该方法在古代服饰和公共数据集上边缘轮廓信息提取效果优于现有方法,ODS指标平均提升15.9%。虽然OIS和AP未超过Informative Drawing,但在模型体量和耗时方面具有明显优势。 展开更多
关键词 边缘检测 TRANSFORMER 轻量特征融合模块
在线阅读 下载PDF
多尺度融合增强与注意力机制结合的图像语义分割
15
作者 刘书刚 杜昊东 王洪涛 《计算机应用与软件》 北大核心 2025年第6期225-233,278,共10页
针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特... 针对当前图像语义分割中分割效率不高与分割边界不连续问题,提出一种多尺度融合增强与注意力机制结合的语义分割算法。该算法对原有DeepLabv3+网络结构进行改进,在编码器部分提出一种特征提取增强网络结构,充分利用相邻层各个尺度的特征信息进行融合,在解码器末端使用改进的轻量化卷积注意力模块,使得对于物体边界分割更加充分。通过在Pascal VOC2007和Cityscapes数据集上进行实验验证,结果表明该方法较原有网络的精确度有显著的提高。 展开更多
关键词 语义分割 特征融合增强 注意力模块 编码器 上采样
在线阅读 下载PDF
基于改进TransUNet的肺部图像分割
16
作者 石勇涛 邱康齐 +1 位作者 柳迪 杜威 《现代电子技术》 北大核心 2025年第15期27-36,共10页
语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度... 语义分割作为肺部影像分析的关键步骤,其准确率直接关系进一步的图像分析和治疗决策。面对肺部器官不规则外形、模糊边界以及噪声等问题,传统分割方法存在边界分割精确度不高、易出现误差等问题。针对这些挑战,文中提出一种基于多尺度边缘特征融合的神经网络(MSB-AffTransU2Net)用于肺部图像的分割。首先,替换了TransUNet中的编解码器,采用U2-Net的RSU模块来增强特征提取的性能;然后,使用注意力特征融合机制替换原本的Concat方法,以减少模型参数并且提升特征的融合效果;接着,加入了多尺度特征提取器以及边界引导的上下文聚合模块,以融合提取更加精确的肺部边缘特征;最后,为优化模型损失函数,采纳了Dice损失与交叉熵损失,创建了一个新颖的损失函数。在COVID-19 Radiography Database的COVID类数据集上验证了所提算法的有效性。实验结果证明,MSB-AffTransU2Net在COVID数据集上的前景交并比(pIoU)和平均准确率(mAcc)与TransUNet算法相比,分别提高了3.03%和0.72%,证明了所提算法的有效性。 展开更多
关键词 COVID-19 肺部图像分割 TransUNet 边缘特征 边界引导的上下文聚合模块 注意力特征融合
在线阅读 下载PDF
全尺寸扩散模型的自适应特征医学图像融合
17
作者 邸敬 石淑慧 +2 位作者 王鹤然 梁婵 朱云龙 《生物医学工程学杂志》 北大核心 2025年第5期871-882,共12页
针对医学图像融合细节信息缺失、目标边界模糊以及结构层次不清晰等问题,本文提出了一种全尺寸扩散模型的自适应特征医学图像融合网络。首先,利用基于核的显著图生成区域级特征图,以增强图像的局部特征和边界细节;随后,通过全尺寸扩散... 针对医学图像融合细节信息缺失、目标边界模糊以及结构层次不清晰等问题,本文提出了一种全尺寸扩散模型的自适应特征医学图像融合网络。首先,利用基于核的显著图生成区域级特征图,以增强图像的局部特征和边界细节;随后,通过全尺寸扩散特征提取网络进行全局特征提取,并设计了多尺度去噪U型网络,充分提取跨层信息,再引入多尺度特征集成模块,增强编码器抽样的纹理细节和结构信息;最后,通过自适应融合规则将区域级特征图、全局特征图和源图像进行逐层次融合,增强细节信息保留。为验证方法的有效性,本文将所提模型在公开的哈佛(Harvard)数据集和腹部数据集上进行了验证,通过与其他九种代表性的图像融合方法对比,本文方法在七项评价指标上均有不同幅度的提升。研究结果说明,本文方法能充分提取医学图像的全局与局部特征,增强纹理细节和目标边界清晰度,生成对比度高且信息丰富的融合图像,为后续临床诊断提供更可靠的支持。 展开更多
关键词 医学图像融合 全尺寸扩散模型 多尺度去噪U型网络 多尺度特征集成模块 自适应融合规则
原文传递
基于深度学习的车道线检测算法
18
作者 岳永恒 赵志浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期22-30,共9页
针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现... 针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现图像的多尺度特征提取;接着,网络框架中设计多尺度空间注意力模块,且引入SimAM轻量级注意力机制,以增强对目标特征的聚焦能力;然后,设计自适应特征融合模块,通过智能调整不同尺度特征图的融合权重,对PANet输出的特征图进行跨尺度融合,以提升网络对复杂特征的提取能力。在TuSimple数据集上的实验结果表明,所提算法的检测精度为96.84%,较原算法提升了1.02个百分点,优于传统的主流算法;在CULane数据集上的实验结果表明,所提算法的F_(1)值为72.74%,优于传统的主流算法,较原算法提升了4.34个百分点,尤其在强光和阴影等极端场景下的检测性能提升显著,说明所提算法在复杂场景下具有优异的检测能力;实时性测试结果显示,所提算法的推理速度达118.0 f/s,满足智能车辆的实时性需求。 展开更多
关键词 车道线检测 深度学习 多尺度空间注意力机制 自适应特征融合
在线阅读 下载PDF
基于特征分治与融合的铁路扣件轻量化实时检测模型
19
作者 鄢化彪 林初欣 +3 位作者 黄绿娥 李东丽 刘词波 徐方奇 《北京交通大学学报》 北大核心 2025年第3期56-67,共12页
为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景... 为解决嵌入式设备实时处理海量铁路扣件视觉图像数据时无法兼顾精确度与检测速度的问题,提出一种基于特征分治与融合的轻量化实时检测模型.首先,利用基于空间与通道特征的分治混合注意力模块强化模型的特征提取能力,降低图像中复杂背景对目标的干扰;其次,提出一种二重分治特征融合方法,提升对不同大小目标的检测能力,同时在检测头(YOLO Head)的代价体构建方面,引入可变焦距损失函数(Varifocal Loss,VFL)代替YOLOX-Nano检测头的二值交叉熵损失函数,提高轻量化实时检测的精度;再次,使用随机Alpha-IoU(RAL)损失函数动态调整参数,延缓算法的收敛速度从而优化模型的训练曲线,避免模型训练过程陷入局部最优解;最后,采集10233个检测目标并划分为6种类型,选择YOLOX-Nano、Faster R-CNN及YOLOv8n等主流目标检测模型作为对比进行实验.实验结果表明:所提模型的每秒帧数(Frames Per Second,FPS)为60.24,平均精度(Average Precision,AP)为83.40%,较基线模型提高了3.24%;参数量为2.31 M,较YOLOX-Tiny减少54.08%,浮点数计算量为1.99 G,较YOLOX-Tiny减少69.15%.研究成果可为轻量级实时检测模型与计算系统提供参考. 展开更多
关键词 轻量级嵌入式系统 分治混合注意力模块 分治特征融合 代价体构建
在线阅读 下载PDF
基于GASF-ViT-HFF的CFRP-PMI夹层结构材料损伤分类
20
作者 李伟 徐琛琪 +3 位作者 蒋鹏 刘鹏 夏金磊 段博文 《无损检测》 2025年第11期75-81,共7页
对于CFRP-PMI夹层结构材料损伤的分类,传统分类方法的精度较低。为提升分类精度,提出基于格拉姆角场(GASF)增强时间序列特征,并结合改进自适应特征融合模块(HFF)的视觉转换器(ViT)模型(GASF-ViT-HFF)。针对一维时间序列数据特征不明显... 对于CFRP-PMI夹层结构材料损伤的分类,传统分类方法的精度较低。为提升分类精度,提出基于格拉姆角场(GASF)增强时间序列特征,并结合改进自适应特征融合模块(HFF)的视觉转换器(ViT)模型(GASF-ViT-HFF)。针对一维时间序列数据特征不明显的问题,采用GASF来增强时间序列数据的特征表达,然后将其输入到ViT模型中对数据进行分类,并且在ViT模型中插入HFF模块来增强数据的特征融合。试验结果表明,该模型性能优越、分类准确率高且稳定性良好,可作为CFRP-PMI夹层材料损伤分类的一种有效方法。 展开更多
关键词 CFRP-PMI夹层材料 格拉姆角场 视觉变换器 自适应特征融合模块 损伤分类
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部