期刊文献+
共找到3,546篇文章
< 1 2 178 >
每页显示 20 50 100
Scale transform algorithm used in FMCW SAR data processing 被引量:1
1
作者 Jiang Zhihong Kan Huangfu Wan Jianwei 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第4期745-750,共6页
The frequency-modulated continuous-wave (FMCW) synthetic aperture radar (SAR) is a light-weight, cost-effective, high-resolution imaging radar, which is suitable for a small flight platform. The signal model is de... The frequency-modulated continuous-wave (FMCW) synthetic aperture radar (SAR) is a light-weight, cost-effective, high-resolution imaging radar, which is suitable for a small flight platform. The signal model is derived for FMCW SAR used in unmanned aerial vehicles (UAV) reconnaissance and remote sensing. An appropriate algorithm is proposed. The algorithm performs the range cell migration correction (RCMC) for continuous nonchirped raw data using the energy invariance of the scaling of a signal in the scale domain. The azimuth processing is based on step transform without geometric resampling operation. The complete derivation of the algorithm is presented. The algorithm performance is shown by simulation results. 展开更多
关键词 FMCW SAR radar imaging scale transform step transform
在线阅读 下载PDF
Preliminary Application of Scale Transformation Stochastic Resonance in Dual-Sequence Frequency Hopping System 被引量:1
2
作者 LIU Guangkai SUN Huixian +3 位作者 QUAN Houde CUI Peizhang ZHU Shilei CHI Kuo 《Journal of Shanghai Jiaotong university(Science)》 EI 2019年第6期775-781,共7页
Aiming at the detection failure of strong noise interference in the dual channel of the dual-sequence frequency hopping(DSFH),the scale transformation stochastic resonance(STSR)is applied for the first time,and the ou... Aiming at the detection failure of strong noise interference in the dual channel of the dual-sequence frequency hopping(DSFH),the scale transformation stochastic resonance(STSR)is applied for the first time,and the output signal to noise ratio(SNR)is raised effectively,at the same time,the symbol reception is completed for DSFH at low input SNR.Firstly,the radio frequency(RF)and intermediate frequency(IF)signals are analyzed based on the super-heterodyne reception of DSFH;secondly,the equations of probability density function(PDF),output power spectrum and SNR of the STSR output are derived for the IF signal;finally,the algorithm of the optimal matching STSR is proposed with the optimal matching parameters.The simulation results show that the algorithm can effectively solve the detection failure,as the global output SNR of DSFH is strongly improved that the output SNR can reach-17.72 d B when the input SNR is-20 d B after the processing of the optimal matching STSR. 展开更多
关键词 the dual-sequence frequency hopping(DSFH) detection of weak signal scale transformation stochastic resonance(STSR) the optimal matching stochastic resonance
原文传递
Estimation of Scale Transformation for Approximate Periodic Time Series with Long-Term Trend
3
作者 Shujin WU 《Journal of Mathematical Research with Applications》 CSCD 2021年第3期238-258,共21页
Approximate periodic time series means it has an approximate periodic trend.The so-called approximate periodicity refers that it looks like having periodicity,however the length of each period is not constant such as ... Approximate periodic time series means it has an approximate periodic trend.The so-called approximate periodicity refers that it looks like having periodicity,however the length of each period is not constant such as sunspot data.Approximate periodic time series has a wide application prospect in modelling social economic phenomenon.As for approximate periodic time series,the key problem is to depict its approximate periodic trend because it can be dealt as an ordinary time series only if its approximate periodic trend has been depicted.However,there is little study on depicting approximate periodic trend.In the paper,the authors first establish some necessary theories,especially bring forward the concept of shape-retention transformation with lengthwise compression and obtain necessary and sufficient condition for linear shape-retention transformation with lengthwise compression,then basing on the theories the authors present a method to estimate scale transformation,which can model approximate periodic trend very clearly.At last,a simulated example is analyzed by this presented method.The results show that the presented method is very effective and very powerful. 展开更多
关键词 time series approximate periodicity scale transformation shape-retention transformation with lengthwise compression
原文传递
Solving Schrodinger Equation with Non-Uniform Grids by Scale Transformation Method
4
作者 马玉涛 刘理天 李志坚 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2000年第9期853-856,共4页
A new scale transformation method is used in solving the Schrodinger equation. With it, the uniform grids in the discretization in conventional metho d are changed into non-uniform grids. Consequently, in some cases, ... A new scale transformation method is used in solving the Schrodinger equation. With it, the uniform grids in the discretization in conventional metho d are changed into non-uniform grids. Consequently, in some cases, the computing quantity will be greatly reduced at keeping the required accuracy. The calcul ation of the quantized inversion layer in MOS structure is used to demonstrate t he efficiency of the new method. 展开更多
关键词 SCHRODINGER EQUATION non-umiform grids
在线阅读 下载PDF
基于时序二维变换和多尺度Transformer的电能质量扰动分类方法 被引量:1
5
作者 王守相 李慧强 +3 位作者 赵倩宇 郭陆阳 王同勋 王洋 《电力系统自动化》 北大核心 2025年第7期198-207,共10页
随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利... 随着新能源渗透率的不断提高,电网面临的电能质量扰动(PQD)问题变得更加复杂,基于一维PQD信号的传统分类方法难以同时提取并辨识周期性与趋势性扰动。针对此问题,提出了一种基于时序二维变换和多尺度Transformer的PQD分类方法。首先,利用时序二维变换将一维PQD时间序列转换为一组基于多个周期的二维张量,以实现在二维空间中深入挖掘PQD信号中所包含的特征信息。然后,通过多尺度Transformer编码器模块提取PQD信号的多尺度特征图,利用多尺度Transformer解码器模块对多尺度特征图进行拼接和特征融合,有效合并在不同尺度上提取的特征图。最后,通过全连接层和Softmax分类器完成PQD分类任务。为验证所提方法的有效性,建立了含24种PQD的数据集对模型进行测试,结果表明所提方法对PQD信号具有较高的分类准确率和噪声鲁棒性。 展开更多
关键词 电能质量 扰动 分类 时序二维变换 多尺度transformer 特征提取 特征融合
在线阅读 下载PDF
一种融合Transformer的多尺度结构图像去模糊方法
6
作者 郭业才 阳刚 毛湘南 《电光与控制》 北大核心 2025年第3期62-68,共7页
针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模... 针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模块利用双旁路结构将局部特征信息和全局特征信息有效地结合起来,同时简化Transformer以提升计算效率;其次,为了缓解卷积操作缺乏输入内容自适应的缺点,将通道注意力引入到特征融合模块中来动态地学习有用信息;最后,在基准数据集GoPro上,所提方法取得的峰值信噪比为31.87 dB,结构相似度为0.952。实验结果表明,所提方法与主流方法相比能够有效地复原图像细节特征,并且能够提升后续计算机视觉任务的鲁棒性。 展开更多
关键词 图像去模糊 多尺度结构 transformER 卷积神经网络 注意力机制
在线阅读 下载PDF
基于多尺度胶囊Swin Transformer的SAR图像目标识别方法 被引量:1
7
作者 侯宇超 王洁 +4 位作者 李洪涛 郝岩 段晓旗 黄凯文 田有亮 《通信学报》 北大核心 2025年第3期274-290,共17页
通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transfor... 通过协同胶囊单元的语义特征编码和Swin Transformer的上下文特征图建模优势相结合,提出了一种多尺度胶囊Swin Transformer网络(MSCSTN),将胶囊编码和Swin Transformer联合应用于SAR图像目标识别。该网络集成3个并行的胶囊Swin Transformer编码结构,融合后对输入图像进行分类。每个结构通过基于膨胀卷积切片划分的胶囊令牌编码器和三维胶囊Swin Transformer模块构建,能捕获更深层次、更广泛的语义特征。在运动和静止目标的获取与识别(MSTAR)数据集及FUSAR-Ship数据集上的实验结果表明,MSCSTN在各种测试条件下均优于其他方法。结果表明,MSCSTN展现了良好的识别性能、泛化能力和应用潜力。 展开更多
关键词 膨胀卷积切片分区 胶囊令牌编码器 三维胶囊Swin transformer模块 多尺度胶囊Swin transformer网络 SAR图像目标识别
在线阅读 下载PDF
融合通道注意力的跨尺度Transformer图像超分辨率重建
8
作者 李焱 董仕豪 +2 位作者 张家伟 赵茹 郑钰辉 《中国图象图形学报》 北大核心 2025年第3期784-797,共14页
目的针对在超分辨率任务中,Transformer模型存在特征提取模式单一、重建图像高频细节丢失和结构失真的问题,提出了一种融合通道注意力的跨尺度Transformer图像超分辨率重建模型。方法模型由4个模块组成:浅层特征提取、跨尺度深层特征提... 目的针对在超分辨率任务中,Transformer模型存在特征提取模式单一、重建图像高频细节丢失和结构失真的问题,提出了一种融合通道注意力的跨尺度Transformer图像超分辨率重建模型。方法模型由4个模块组成:浅层特征提取、跨尺度深层特征提取、多级特征融合以及高质量重建模块。浅层特征提取利用卷积处理早期图像,获得更稳定的输出;跨尺度深层特征提取利用跨尺度Transformer和强化通道注意力机制,扩大感受野并通过加权筛选提取不同尺度特征以便融合;多级特征融合模块利用强化通道注意力机制,实现对不同尺度特征通道权重的动态调整,促进模型对丰富上下文信息的学习,增强模型在图像超分辨率重建任务中的能力。结果在Set5、Set14、BSD100(Berkeley segmentation dataset 100)、Urban100(urban scene 100)和Manga109标准数据集上的模型评估结果表明,相较于SwinIR超分辨率模型,所提模型在峰值信噪比上提高了0.06~0.25 dB,且重建图像视觉效果更好。结论提出的融合通道注意力的跨尺度Transformer图像超分辨率重建模型,通过融合卷积特征与Transformer特征,并利用强化通道注意力机制减少图像中噪声和冗余信息,降低模型产生图像模糊失真的可能性,图像超分辨率性能有效提升,在多个公共实验数据集的测试结果验证了所提模型的有效性。 展开更多
关键词 图像超分辨率 跨尺度transformer 通道注意力机制 特征融合 深度学习
原文传递
MSMVT:多尺度和多视图Transformer半监督医学图像分割框架 被引量:3
9
作者 李飞翔 降爱莲 《计算机工程与应用》 北大核心 2025年第2期273-282,共10页
近年来,Transformer在众多监督式计算机视觉任务中取得了显著进展,然而由于高质量医学标注图像的缺乏,其在半监督图像分割领域的性能仍有待提高。为此,提出了一种基于多尺度和多视图Transformer的半监督医学图像分割框架:MSMVT(multi-sc... 近年来,Transformer在众多监督式计算机视觉任务中取得了显著进展,然而由于高质量医学标注图像的缺乏,其在半监督图像分割领域的性能仍有待提高。为此,提出了一种基于多尺度和多视图Transformer的半监督医学图像分割框架:MSMVT(multi-scale and multi-view transformer)。鉴于对比学习在Transformer的预训练中取得的良好效果,设计了一个基于伪标签引导的多尺度原型对比学习模块。该模块利用图像金字塔数据增强技术,为无标签图像生成富有语义信息的多尺度原型表示;通过对比学习,强化了不同尺度原型之间的一致性,从而有效缓解了由标签稀缺性导致的Transformer训练不足的问题。此外,为了增强Transformer模型训练的稳定性,提出了多视图一致性学习策略。通过弱扰动视图,以校正多个强扰动视图。通过最小化不同视图之间的输出差异性,使得模型能够对不同扰动保持多层次的一致性。实验结果表明,当仅采用10%的标注比例时,提出的MSMVT框架在ACDC、LIDC和ISIC三个公共数据集上的DSC图像分割性能指标分别达到了88.93%、84.75%和85.38%,优于现有的半监督医学图像分割方法。 展开更多
关键词 半监督医学图像分割 伪标签 transformER 多尺度 多视图
在线阅读 下载PDF
基于轻量级多尺度CNN-Transformer网络的鼻咽癌诊断方法
10
作者 任宇 杨鹏 +3 位作者 范小琴 汪天富 聂国辉 雷柏英 《中国生物医学工程学报》 北大核心 2025年第3期279-290,共12页
深度学习(DL)技术是辅助临床医生进行内窥镜图像中鼻咽癌(NPC)肿瘤物的诊断重要手段,但其面临两个挑战:1)图像局部区域的视觉信息相似而冗余,可能会导致低效的计算效率;2)全局信息和局部特征之间的长期的动态交互往往会导致无效的学习,... 深度学习(DL)技术是辅助临床医生进行内窥镜图像中鼻咽癌(NPC)肿瘤物的诊断重要手段,但其面临两个挑战:1)图像局部区域的视觉信息相似而冗余,可能会导致低效的计算效率;2)全局信息和局部特征之间的长期的动态交互往往会导致无效的学习,同时增加冗余计算。针对上述问题,提出了一种轻量级多尺度CNN-Transformer网络,称为L-MTransNet。该网络由多尺度的卷积神经网络(MCNN)块和具有动态卷积的多尺度CNN-Transformer(MTrans)构成。首先,MCNN用于提取内窥镜数据的多尺度的局部特征,降低局部信息的冗余;其次,为了在同一特征层级具有精细和粗糙的多尺度特征表示,并且重构每个多尺度局部特征间的全局关系,多路径视觉Transformer(MPViT)和动态卷积Transformer(TransNet)组成的MTrans模块被构建。其赋予网络较强的归纳偏置和全局信息交互能力,缓解特征的表示差异和提升融合效率。基于深圳市第二人民医院采集的300例患者的临床内窥镜数据集进行验证实验。结果证明,分类准确率为94.53%±0.35%,F1-评分为94.17%±0.34%,AUC达到98.61%±0.07%,同时具有较低的计算成本,参数为5.9 M,FLOPs为7.6 G。所提出的方法展现出了良好的效果,有望应用于内窥镜图像的NPC肿瘤早期筛查。 展开更多
关键词 鼻咽癌 轻量级 多尺度 transformER 动态卷积
暂未订购
基于Transformer全局-局部特征融合的RGB-D显著性检测 被引量:1
11
作者 宋梦柯 王芸 郑元超 《计算机应用与软件》 北大核心 2025年第3期176-182,共7页
现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融... 现有的RGB-D方法一般通过局部操作分别应用多尺度和多模态融合,但这无法捕获远程依赖性,因此对特征整体表征能力不足。针对此问题,提出一种全局-局部特征融合网络。在低层特征提取阶段,将两个分支特征直接融合;在高层特征提取阶段,将融合后特征送入Transformer编码器通过在所有位置同时整合多尺度和多模态的特征来进行充分的特征融合,获得全局特征依赖关系之后再送入主干网络提取全局—局部融合特征。同时提出双重注意力模块,用来增强两个分支特征的融合效果。在五个公开数据集上进行的实验表明,该网络在三个评价指标上均取得了较好的表现。 展开更多
关键词 RGB-D显著性检测 全局-局部特征 跨模态融合 多尺度 transformER
在线阅读 下载PDF
基于多尺度空间Transformer的肝脏分割方法
12
作者 丁厚林 张晓龙 +2 位作者 林晓丽 邓鹤 任宏伟 《计算机技术与发展》 2025年第2期1-8,共8页
肝脏器官尺度多样且与周围器官高度相似,很难从腹部计算机影像中准确分割出肝脏区域,现有的很多方法将CNN和Transformer相结合以得到图像局部和全局特征依赖关系,从而取得了更好的性能。然而,简单的组合方法忽视了图像分割中多尺度特征... 肝脏器官尺度多样且与周围器官高度相似,很难从腹部计算机影像中准确分割出肝脏区域,现有的很多方法将CNN和Transformer相结合以得到图像局部和全局特征依赖关系,从而取得了更好的性能。然而,简单的组合方法忽视了图像分割中多尺度特征融合和注意力机制的重要性,没有很好地解决肝脏分割问题。该文提出了一种用于肝脏分割的多尺度空间Transformer与交叉自注意机制的三维肝脏影像分割方法。该方法首先采用CNN和Transformer相结合的方式逐步提取不同尺度的特征信息使网络对肝脏及其周围组织的识别更加准确;接着利用多尺度空间Transformer对不同层次和尺度特征的图像在空间维度上融合,提高了网络对肝脏边缘的定位能力;最后在解码器中设计了交叉自注意引导融合模块减少噪声等不相关信息带来的干扰,提高分割质量。在LiTS、CHAOS、Sliver07和某医院MRI数据集上进行了对比和消融实验,实验结果表明,该方法相较于当前的主流网络具有更好的分割性能和临床应用前景。 展开更多
关键词 三维肝脏影像分割 深度学习 交叉自注意机制 多尺度空间transformer 多尺度特征融合
在线阅读 下载PDF
基于融合Swin Transformer网络的腰椎解剖区域自动分割方法
13
作者 张英迪 史泽林 +6 位作者 王欢 崔少千 张磊 刘嘉琛 单修祺 刘云鹏 赵恩波 《信息与控制》 北大核心 2025年第3期390-400,共11页
腰椎解剖区域自动分割在脊柱影像自动分析流程中发挥着重要作用。尽管经典的卷积神经网络能够捕捉影像全局特征,其局部先验和权重共享的特性限制了长距离建模的能力。为了解决以上问题,本文提出了一种用于腰椎解剖区域分割的Swin Transf... 腰椎解剖区域自动分割在脊柱影像自动分析流程中发挥着重要作用。尽管经典的卷积神经网络能够捕捉影像全局特征,其局部先验和权重共享的特性限制了长距离建模的能力。为了解决以上问题,本文提出了一种用于腰椎解剖区域分割的Swin Transformer融合网络,将Swin Transformer网络和多尺度空洞卷积融合作为编码器来得到全局和局部特征的层次化表达。设计了特征耦合模块,在通道和空间2个维度将来自Transformer模块和卷积模块的特征进行耦合,提高了模型的局部和长距离建模能力。为了解决开源数据缺乏的问题,提出了带有体素级标注的、包含663个腰椎椎骨计算断层成像的数据集。在此数据集上的实验表明提出的模型分割精度超过了典型医学图像分割方法,本文模型的骰子系数、Hausdorff距离和平均表面距离分别为88.24%、14.48和0.997。消融实验进一步验证了所提出模块的有效性。 展开更多
关键词 卷积神经网络 医学图像分割 transformER 多尺度特征提取
原文传递
融合多尺度特征Transformer的高分辨率遥感图像变化检测 被引量:2
14
作者 李健慷 张桂欣 +2 位作者 祝善友 徐永明 李湘雨 《遥感学报》 北大核心 2025年第1期266-278,共13页
为了加强变化检测中深度学习网络的语义信息提取能力,捕获更多高阶多尺度特征细节以及突出影像差异信息,本文提出一种融合孪生结构和多尺度特征Transformer的高分辨率遥感影像变化检测模型MFTSNet(Multi-scale Feature Transformer Siam... 为了加强变化检测中深度学习网络的语义信息提取能力,捕获更多高阶多尺度特征细节以及突出影像差异信息,本文提出一种融合孪生结构和多尺度特征Transformer的高分辨率遥感影像变化检测模型MFTSNet(Multi-scale Feature Transformer Siamese Network)。该模型设计了语义特征Transformer模块ST(Semantic feature Transformer module)捕获不同层级特征图的语义信息,引入置入Transformer模块GT(Grounding Transformer module)和映射Transformer模块RT(Rendering Transformer module)加强低层和高层语义信息的获取,发掘高阶多尺度特征细节信息以及不同空间位置和通道间的全局上下文关系,进一步提升变化检测精度,增强地物检测结果的完整性、区域内部以及边缘细节。将MFTSNet与另外8种变化检测模型在4个公开数据集上的变化检测结果进行对比,并通过消融实验、参数分析等手段验证MFTSNet中各模块的有效性。对比实验结果表明MFTSNet网络模型在4个数据集上的F1和交并比IoU分别至少提高了0.465%、0.113%、0.369%、2.13%和0.723%、0.188%、0.304%、2.962%。消融实验表明GT、RT、ST 3个模块共同作用可有效提升网络模型性能。参数分析表明MFTSNet模型中的特征信息长度L与编码器—解码器个数是两个重要的网络结构参数,L在CDD、WHU-CD数据实验中取16,在SYSU-CD、LEVIR-CD数据实验中取8,4个数据集上设置(EN,DN)为(1,2)时,MFTSNet模型的检测结果最优。 展开更多
关键词 高分辨率遥感 变化检测 深度学习 孪生网络 多尺度特征 transformER 语义信息 消融实验
原文传递
结合多尺度融合与注意力机制的混合Transformer注视估计模型
15
作者 彭黄果 陈亮 《科学技术与工程》 北大核心 2025年第29期12579-12585,共7页
基于外观的注视估计旨在从人脸图像中推测眼睛的注视方向,目前的模型在处理人脸图像时,难以提取局部和全局信息,容易受到背景、面部外貌等噪声干扰,导致预测精度下降。为此,提出了一种结合多尺度特征聚合和共享注意力机制的混合Transfor... 基于外观的注视估计旨在从人脸图像中推测眼睛的注视方向,目前的模型在处理人脸图像时,难以提取局部和全局信息,容易受到背景、面部外貌等噪声干扰,导致预测精度下降。为此,提出了一种结合多尺度特征聚合和共享注意力机制的混合Transformer模型。首先通过CBAM(convolutional block attention module)通道空间注意力结合ResNet进行初步特征提取,以增强模型对双眼区域的敏感性;接着,通过多尺度特征融合模块整合不同尺度的信息,在捕捉头部姿势和面部表情等粗粒度特征的同时,关注眼部等细粒度细节,提高模型对多层次特征的表达能力。为提取全局信息,使用添加位置编码的Transformer模块,以捕获图像中的全局依赖关系并建模空间位置信息,使模型能够更全面理解图像的结构和布局。最后,引入改进的共享注意力,利用图像之间的相似性减少对无关特征的关注。实验结果表明,提出的模型在MPIIFaceGaze和RT-Gene数据集上表现最好,平均角度误差分别降低0.11°和0.12°,显示出在注视估计任务中的显著优势。 展开更多
关键词 注视估计 多尺度特征 注意力 transformER
在线阅读 下载PDF
从放缩到重构的Swin Transformer图像矩形化网络
16
作者 杨利春 党建武 +2 位作者 王梦思 张天胤 田彬 《计算机工程与应用》 北大核心 2025年第12期258-266,共9页
图像矩形化旨在解决拼接后的图像所存在的边界不规则问题。现有的矩形化方法通过多步扭曲处理来实现图像的矩形化处理。但是这些方法仍然存在一定的内容失真及边界破损等问题。为了解决这些问题,提出了一种单步扭曲处理的图像矩形化解... 图像矩形化旨在解决拼接后的图像所存在的边界不规则问题。现有的矩形化方法通过多步扭曲处理来实现图像的矩形化处理。但是这些方法仍然存在一定的内容失真及边界破损等问题。为了解决这些问题,提出了一种单步扭曲处理的图像矩形化解决方案(IRFormer)。具体来说,结合了尺度放缩策略,构建了一个基于Swin Transformer架构的低分辨率单步扭曲分支;结合轻量化策略,构建了一个高分辨率重建及边界修复的分支。通过广泛的实验,验证了IRFormer在多种场景中均具有良好的矩形化表现,具有较高的内容保真性和边界完整性。在定性和定量比较中,IRFormer均展现出了最先进的矩形化性能。 展开更多
关键词 图像矩形化 单级网格预测 尺度放缩 Swin transformer 超分辨率重建
在线阅读 下载PDF
CATrans:基于跨尺度注意力Transformer的高分辨率遥感影像土地覆盖语义分割框架
17
作者 陈丽佳 陈宏辉 +3 位作者 谢艳秋 何天友 叶菁 吴林煌 《地球信息科学学报》 北大核心 2025年第7期1624-1637,共14页
【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力... 【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力,影响了推理分割质量。【方法】为了解决这一问题,本文提出了一种联合跨尺度注意力和语义视觉Transformer的遥感影像分割框架(Cross-scale Attention Transformer,CATrans),融合跨尺度注意力模块和语义视觉Transformer,提取上下文先验知识增强局部特征表示和分割性能。首先,跨尺度注意力模块通过空间和通道两个维度进行并行特征处理,分析浅层-深层和局部-全局特征之间的依赖关系,提升对遥感影像中不同粒度对象的注意力。其次,语义视觉Transformer通过空间注意力机制捕捉上下文语义信息,建模语义信息之间的依赖关系。【结果】本文在DeepGlobe、Inria Aerial和LoveDA数据集上进行对比实验,结果表明:CATrans的分割性能优于现有的WSDNet(Discrete Wavelet Smooth Network)和ISDNet(Integrating Shallow and Deep Network)等分割算法,分别取得了76.2%、79.2%、54.2%的平均交并比(Mean Intersection over Union,mIoU)和86.5%、87.8%、66.8%的平均F1得分(Mean F1 Score,mF1),推理速度分别达到38.1 FPS、13.2 FPS和95.22 FPS。相较于本文所对比的最佳方法WSDNet,mIoU和mF1在3个数据集中分别提升2.1%、4.0%、5.3%和1.3%、1.8%、5.6%,在每类地物的分割中都具有显著优势。【结论】本方法实现了高效率、高精度的高分辨率遥感影像语义分割。 展开更多
关键词 高分辨率 语义分割 跨尺度注意力 视觉transformer 上下文先验 空间注意力 语义信息
原文传递
基于跨尺度Transformer深度网络的森林地上生物量遥感估算
18
作者 赵晓辉 杨文清 袁强强 《测绘工程》 2025年第5期9-15,36,共8页
森林可以衡量生态系统的生产力和稳定性,对全球气候有重要影响,对森林地上生物量(AGB)的精确估计成为近年来碳循环、碳中和的关注热点。目前飞速发展的深度学习技术在森林地上生物量估计中展现出了良好性能,且适用性广,对数据要求低。... 森林可以衡量生态系统的生产力和稳定性,对全球气候有重要影响,对森林地上生物量(AGB)的精确估计成为近年来碳循环、碳中和的关注热点。目前飞速发展的深度学习技术在森林地上生物量估计中展现出了良好性能,且适用性广,对数据要求低。文中提出一种用于森林地上生物量估计的跨尺度Transformer深度网络,并且以芬兰地区为例,以哨兵一号与哨兵二号的月度卫星数据为研究对象,以机载激光雷达及航空影像数据为参考标签,验证了网络模型的有效性。实验结果表明,新的AGB估算模型平均RMSE减小约1.8,平均R^(2)提升约0.05。同时文中研究的跨尺度特征的有效性证明了跨尺度嵌入层可以帮助遥感影像的AGB预测。 展开更多
关键词 跨尺度 transformer机制 地上生物量 注意力机制
在线阅读 下载PDF
多维度聚合Transformer的图像超分辨率重建
19
作者 陈清江 陈鹏民 《光学精密工程》 北大核心 2025年第12期1955-1970,共16页
针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。... 针对现有基于Transformer的图像超分辨率网络中感受野尺度单一以及未充分挖掘额外维度信息等问题,本文提出了一种多维度聚合Transformer网络。首先,通过构建多尺度交互调制模块,从低分辨率图像中提取多尺度特征,以增强信息流的丰富性。其次,设计了空间-通道交互模块,并将其集成于Transformer层中,利用四种形式的注意力机制充分提取关键特征并实现特征融合,从而提升模型性能。最后,提出了特征重用Transformer模块,深入挖掘各层特征之间的关联,精准提取并高效重用重要特征,进一步加强模型表现。实验结果表明,在五个基准测试集上,所提方法优于其他先进算法。在不同放大倍数的超分辨率任务中,相较于基于Swin Transformer的图像恢复方法,峰值信噪比和结构相似度分别平均提升了约0.26 dB和0.0024,且重建效果更加清晰。该方法有效克服了现有方法的不足,在超分辨率任务中展现出显著的性能提升和应用潜力。 展开更多
关键词 图像超分辨率 transformER 注意力机制 特征交互 特征重用 多尺度
在线阅读 下载PDF
结合多尺度Transformer和小波特征的深度伪造检测
20
作者 朱鹏 杨高明 +1 位作者 宋一帆 李子龙 《哈尔滨商业大学学报(自然科学版)》 2025年第4期397-405,共9页
在社交媒体上传播的深度伪造内容不可避免地会受到压缩的影响,导致高频信息在频率域中被弱化等问题,增加了检测的难度.为此,针对压缩深度伪造内容提出了一种结合多尺度Transformer分支、深层小波特征提取分支和跨模态局部注意力融合模... 在社交媒体上传播的深度伪造内容不可避免地会受到压缩的影响,导致高频信息在频率域中被弱化等问题,增加了检测的难度.为此,针对压缩深度伪造内容提出了一种结合多尺度Transformer分支、深层小波特征提取分支和跨模态局部注意力融合模块的新型检测框架.本文方法利用多尺度Transformer,以捕捉不同尺度下的空间特征,并通过深层小波特征提取模块,在频率域中有效提取了受压缩影响较小的高频细粒度特征.为了高效融合空间域与频率域的信息,提出了跨模态局部注意力融合模块,该模块利用局部双重交叉注意力机制进行局部特征交互融合.实验结果显示,在FaceForensics++数据集的C23和C40压缩伪造数据检测中,C40压缩下准确率达到了87.09%、AUC为97.21%,C23压缩下准确率达到了97.65%、AUC为99.42%,显著优于同类算法. 展开更多
关键词 深度伪造检测 高频信息 多尺度transformer 深层小波特征 跨模态局部注意力
在线阅读 下载PDF
上一页 1 2 178 下一页 到第
使用帮助 返回顶部