期刊文献+
共找到2,000篇文章
< 1 2 100 >
每页显示 20 50 100
The Decline and Reinvention of Marketplace Culture:Civic Social Networks in the Spatial Transformation of Chengdu Teahouses
1
作者 Ding Ding Wang Hao 《Contemporary Social Sciences》 2025年第3期18-33,共16页
Chengdu teahouses,as core public spaces in marketplace society,have undergone transformative reconstruction-from“containers of everyday life”to“containers of commercial traffic and digital flows”-during the proces... Chengdu teahouses,as core public spaces in marketplace society,have undergone transformative reconstruction-from“containers of everyday life”to“containers of commercial traffic and digital flows”-during the process of modernization.Employing spatial archaeology as a methodology,combined with fieldwork and analysis of historical documents,this study systematically examines the diachronic evolution of architectural forms,functional orientations,and social networks within Chengdu teahouses.The study reveals the logic of spatial reconstruction under the interplay of multiple forces,including cultural heritage preservation,capital-driven development,and technological intervention.The findings identify three paradigms of spatial transformation in teahouses.First,heritage specimenization,which reinforces the continuity of collective memory through symbolic extraction but risks diminishing the vitality of everyday social interactions.Second,consumption upgrading,which caters to the demands of emerging groups through iterative business models yet necessitates vigilance against spatial differentiation eroding marketplace inclusivity.Third,digital parasitism,which expands communicative dimensions through technological empowerment but confronts the risk of flattening localized knowledge.These paradigms reflect both adaptive responses of traditional spaces to contemporary pressure and the tension of reconstruction imposed by instrumental rationality on marketplace networks.The study demonstrates that spatial transformation in Chengdu teahouses is not unidirectional alienation but rather a multifaceted configuration where the continuity of tradition coexists with innovative practices amid functional diversification.This research advocates for striking a balance between the preservation of traditional spaces and modern renewal and explores organic integration approaches for traditional and modern elements,thereby providing a theoretical framework and practical insights for the transformation of traditional public spaces. 展开更多
关键词 teahouse culture marketplace culture spatial transformation capital-driven development cultural heritage preservation
在线阅读 下载PDF
三维卷积与Transformer支持下联合空谱特征的高光谱影像分类 被引量:1
2
作者 何光 吴田军 《计算机工程与应用》 北大核心 2025年第2期259-272,共14页
由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取... 由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取全局上下文信息。如何实现CNN和Transformer的技术耦合并充分利用空间信息和光谱信息进行高光谱遥感影像分类是一个重要的待研问题。鉴于此,提出一种新的基于三维卷积和Transformer的高光谱遥感影像分类方法,尝试联合空谱特征实现解译能力的提升。使用主成分分析方法对高光谱遥感影像沿垂直方向降维;用非负矩阵分解算法对降维后遥感影像沿水平方向进行空间特征提取,将两种工具处理后遥感影像进行拼接,以充分保留信息;再用三维卷积核对拼接后遥感影像进行空间特征和光谱特征的综合提取;用Transformer的注意力机制对提取空间信息和光谱信息的遥感影像序列建立长距离依赖关系并使用多层感知机完成分类任务。实验表明,所提方法在WHU-Hi龙口、汉川、洪湖以及雄安新区马蹄湾村数据集上均表现出比对比方法更优异的分类性能,表明该方法具有一定的泛化性和稳健性。 展开更多
关键词 非负矩阵分解 特征融合 三维卷积 空谱联合 transformER 高光谱遥感影像分类
在线阅读 下载PDF
基于Swin-AK Transformer的智能手机拍摄图像质量评价方法
3
作者 侯国鹏 董武 +4 位作者 陆利坤 周子镱 马倩 柏振 郑晟辉 《光电工程》 北大核心 2025年第1期116-130,共15页
本文提出了一种基于双交叉注意力融合的Swin-AK Transformer(Swin Transformer based on alterable kernel convolution)和手工特征相结合的智能手机拍摄图像质量评价方法。首先,提取了影响图像质量的手工特征,这些特征可以捕捉到图像... 本文提出了一种基于双交叉注意力融合的Swin-AK Transformer(Swin Transformer based on alterable kernel convolution)和手工特征相结合的智能手机拍摄图像质量评价方法。首先,提取了影响图像质量的手工特征,这些特征可以捕捉到图像中细微的视觉变化;其次,提出了Swin-AK Transformer,增强了模型对局部信息的提取和处理能力。此外,本文设计了双交叉注意力融合模块,结合空间注意力和通道注意力机制,融合了手工特征与深度特征,实现了更加精确的图像质量预测。实验结果表明,在SPAQ和LIVE-C数据集上,皮尔森线性相关系数分别达到0.932和0.885,斯皮尔曼等级排序相关系数分别达到0.929和0.858。上述结果证明了本文提出的方法能够有效地预测智能手机拍摄图像的质量。 展开更多
关键词 图像质量评价 智能手机拍摄图像 Swin transformer 手工特征 空间注意力 通道注意力
在线阅读 下载PDF
CATrans:基于跨尺度注意力Transformer的高分辨率遥感影像土地覆盖语义分割框架
4
作者 陈丽佳 陈宏辉 +3 位作者 谢艳秋 何天友 叶菁 吴林煌 《地球信息科学学报》 北大核心 2025年第7期1624-1637,共14页
【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力... 【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力,影响了推理分割质量。【方法】为了解决这一问题,本文提出了一种联合跨尺度注意力和语义视觉Transformer的遥感影像分割框架(Cross-scale Attention Transformer,CATrans),融合跨尺度注意力模块和语义视觉Transformer,提取上下文先验知识增强局部特征表示和分割性能。首先,跨尺度注意力模块通过空间和通道两个维度进行并行特征处理,分析浅层-深层和局部-全局特征之间的依赖关系,提升对遥感影像中不同粒度对象的注意力。其次,语义视觉Transformer通过空间注意力机制捕捉上下文语义信息,建模语义信息之间的依赖关系。【结果】本文在DeepGlobe、Inria Aerial和LoveDA数据集上进行对比实验,结果表明:CATrans的分割性能优于现有的WSDNet(Discrete Wavelet Smooth Network)和ISDNet(Integrating Shallow and Deep Network)等分割算法,分别取得了76.2%、79.2%、54.2%的平均交并比(Mean Intersection over Union,mIoU)和86.5%、87.8%、66.8%的平均F1得分(Mean F1 Score,mF1),推理速度分别达到38.1 FPS、13.2 FPS和95.22 FPS。相较于本文所对比的最佳方法WSDNet,mIoU和mF1在3个数据集中分别提升2.1%、4.0%、5.3%和1.3%、1.8%、5.6%,在每类地物的分割中都具有显著优势。【结论】本方法实现了高效率、高精度的高分辨率遥感影像语义分割。 展开更多
关键词 高分辨率 语义分割 跨尺度注意力 视觉transformer 上下文先验 空间注意力 语义信息
原文传递
基于Transformer与图卷积网络的三维人体姿态估计
5
作者 王宇晶 包明明 刘星 《传感技术学报》 北大核心 2025年第9期1624-1630,共7页
提出了一种Transformer与图网络相结合的网络模型,用于对视觉传感器采集到的视频图像进行三维人体姿态估计。Transformer能够有效地从二维关键关节点中提取时空维度高相关性特征,而图网络则能够感知细节相关性特征,通过融合这两种网络结... 提出了一种Transformer与图网络相结合的网络模型,用于对视觉传感器采集到的视频图像进行三维人体姿态估计。Transformer能够有效地从二维关键关节点中提取时空维度高相关性特征,而图网络则能够感知细节相关性特征,通过融合这两种网络结构,提高了三维姿态估计的精度。在公开数据集Human3.6M上进行了仿真实验,验证了Transformer与图卷积融合算法的性能。实验结果显示,最终估计得到的三维人体关节点的平均关节点位置偏差(Mean Per Joint Position Error,MPJPE)为38.4 mm,相较于现有方法有一定提升,表明该方法具有较强的应用价值,可应用于许多下游相关工作中。 展开更多
关键词 三维人体姿态估计 transformER 图卷积 时空相关性
在线阅读 下载PDF
基于多尺度空间Transformer的肝脏分割方法
6
作者 丁厚林 张晓龙 +2 位作者 林晓丽 邓鹤 任宏伟 《计算机技术与发展》 2025年第2期1-8,共8页
肝脏器官尺度多样且与周围器官高度相似,很难从腹部计算机影像中准确分割出肝脏区域,现有的很多方法将CNN和Transformer相结合以得到图像局部和全局特征依赖关系,从而取得了更好的性能。然而,简单的组合方法忽视了图像分割中多尺度特征... 肝脏器官尺度多样且与周围器官高度相似,很难从腹部计算机影像中准确分割出肝脏区域,现有的很多方法将CNN和Transformer相结合以得到图像局部和全局特征依赖关系,从而取得了更好的性能。然而,简单的组合方法忽视了图像分割中多尺度特征融合和注意力机制的重要性,没有很好地解决肝脏分割问题。该文提出了一种用于肝脏分割的多尺度空间Transformer与交叉自注意机制的三维肝脏影像分割方法。该方法首先采用CNN和Transformer相结合的方式逐步提取不同尺度的特征信息使网络对肝脏及其周围组织的识别更加准确;接着利用多尺度空间Transformer对不同层次和尺度特征的图像在空间维度上融合,提高了网络对肝脏边缘的定位能力;最后在解码器中设计了交叉自注意引导融合模块减少噪声等不相关信息带来的干扰,提高分割质量。在LiTS、CHAOS、Sliver07和某医院MRI数据集上进行了对比和消融实验,实验结果表明,该方法相较于当前的主流网络具有更好的分割性能和临床应用前景。 展开更多
关键词 三维肝脏影像分割 深度学习 交叉自注意机制 多尺度空间transformer 多尺度特征融合
在线阅读 下载PDF
Person Re-Identification Based on Spatial Feature Learning and Multi-Granularity Feature Fusion
7
作者 DIAO Zijian CAO Shuai +4 位作者 LI Wenwei LIANG Jianan WEN Guilin HUANG Weici ZHANG Shouming 《Journal of Shanghai Jiaotong university(Science)》 2025年第2期363-374,共12页
In view of the weak ability of the convolutional neural networks to explicitly learn spatial invariance and the probabilistic loss of discriminative features caused by occlusion and background interference in pedestri... In view of the weak ability of the convolutional neural networks to explicitly learn spatial invariance and the probabilistic loss of discriminative features caused by occlusion and background interference in pedestrian re-identification tasks,a person re-identification method combining spatial feature learning and multi-granularity feature fusion was proposed.First,an attention spatial transformation network(A-STN)is proposed to learn spatial features and solve the problem of misalignment of pedestrian spatial features.Then the network was divided into a global branch,a local coarse-grained fusion branch,and a local fine-grained fusion branch to extract pedestrian global features,coarse-grained fusion features,and fine-grained fusion features,respectively.Among them,the global branch enriches the global features by fusing different pooling features.The local coarse-grained fusion branch uses an overlay pooling to enhance each local feature while learning the correlation relationship between multi-granularity features.The local fine-grained fusion branch uses a differential pooling to obtain the differential features that were fused with global features to learn the relationship between pedestrian local features and pedestrian global features.Finally,the proposed method was compared on three public datasets:Market1501,DukeMTMC-ReID and CUHK03.The experimental results were better than those of the comparative methods,which verifies the effectiveness of the proposed method. 展开更多
关键词 pedestrian re-identification spatial features attention spatial transformation network multi-branch network relation features
原文传递
From Spatial Domain to Patch-Based Models:A Comprehensive Review and Comparison of Multimodal Medical Image Denoising Algorithms
8
作者 Apoorav Sharma Ayush Dogra +2 位作者 Bhawna Goyal Archana Saini Vinay Kukreja 《Computers, Materials & Continua》 2025年第10期367-481,共115页
To enable proper diagnosis of a patient,medical images must demonstrate no presence of noise and artifacts.The major hurdle lies in acquiring these images in such a manner that extraneous variables,causing distortions... To enable proper diagnosis of a patient,medical images must demonstrate no presence of noise and artifacts.The major hurdle lies in acquiring these images in such a manner that extraneous variables,causing distortions in the form of noise and artifacts,are kept to a bare minimum.The unexpected change realized during the acquisition process specifically attacks the integrity of the image’s quality,while indirectly attacking the effectiveness of the diagnostic process.It is thus crucial that this is attended to with maximum efficiency at the level of pertinent expertise.The solution to these challenges presents a complex dilemma at the acquisition stage,where image processing techniques must be adopted.The necessity of this mandatory image pre-processing step underpins the implementation of traditional state-of-the-art methods to create functional and robust denoising or recovery devices.This article hereby provides an extensive systematic review of the above techniques,with the purpose of presenting a systematic evaluation of their effect on medical images under three different distributions of noise,i.e.,Gaussian,Poisson,and Rician.A thorough analysis of these methods is conducted using eight evaluation parameters to highlight the unique features of each method.The covered denoising methods are essential in actual clinical scenarios where the preservation of anatomical details is crucial for accurate and safe diagnosis,such as tumor detection in MRI and vascular imaging in CT. 展开更多
关键词 Image denoising MRI CT spatial domain filters transform domain
在线阅读 下载PDF
Human Motion Prediction Based on Multi-Level Spatial and Temporal Cues Learning
9
作者 Jiayi Geng Yuxuan Wu +5 位作者 Wenbo Lu Pengxiang Su Amel Ksibi Wei Li Zaffar Ahmed Shaikh Di Gai 《Computers, Materials & Continua》 2025年第11期3689-3707,共19页
Predicting human motion based on historical motion sequences is a fundamental problem in computer vision,which is at the core of many applications.Existing approaches primarily focus on encoding spatial dependencies a... Predicting human motion based on historical motion sequences is a fundamental problem in computer vision,which is at the core of many applications.Existing approaches primarily focus on encoding spatial dependencies among human joints while ignoring the temporal cues and the complex relationships across non-consecutive frames.These limitations hinder the model’s ability to generate accurate predictions over longer time horizons and in scenarios with complex motion patterns.To address the above problems,we proposed a novel multi-level spatial and temporal learning model,which consists of a Cross Spatial Dependencies Encoding Module(CSM)and a Dynamic Temporal Connection Encoding Module(DTM).Specifically,the CSM is designed to capture complementary local and global spatial dependent information at both the joint level and the joint pair level.We further present DTM to encode diverse temporal evolution contexts and compress motion features to a deep level,enabling the model to capture both short-term and long-term dependencies efficiently.Extensive experiments conducted on the Human 3.6M and CMU Mocap datasets demonstrate that our model achieves state-of-the-art performance in both short-term and long-term predictions,outperforming existing methods by up to 20.3% in accuracy.Furthermore,ablation studies confirm the significant contributions of the CSM and DTM in enhancing prediction accuracy. 展开更多
关键词 Human motion prediction spatial dependencies learning temporal context learning graph convolutional networks transformer
在线阅读 下载PDF
基于动态时空Transformer的城市蜂窝网络流量预测方法
10
作者 于江燕 王倩 +2 位作者 孟宪静 张瑞敏 耿蕾蕾 《计算机工程与应用》 北大核心 2025年第18期290-299,共10页
针对现有的城市蜂窝网络流量预测方法没有考虑到小区间空间相关性的动态性以及不同时间跨度下小区间空间相关性的多样性问题,提出基于动态时空Transformer的城市蜂窝网络流量预测模型(DSTTNet)。提出多尺度时间感知空间Transformer模块M... 针对现有的城市蜂窝网络流量预测方法没有考虑到小区间空间相关性的动态性以及不同时间跨度下小区间空间相关性的多样性问题,提出基于动态时空Transformer的城市蜂窝网络流量预测模型(DSTTNet)。提出多尺度时间感知空间Transformer模块MSTAST,通过分时间段建模小区间的空间相关性,实现小区间动态空间关系的捕获;通过引入多分支结构,在不同的分支上使用不同的时间段划分方式来捕获不同的空间相关性,从而提高空间相关性建模的准确性;基于MSTAST和时间Transformer模块构建时空序列建模模块来捕获城市蜂窝网络流量中的长时间依赖关系和动态空间依赖关系;还将MSTAST应用于特征融合模块,以提高模型对预测特征中远距离小区间全局空间关系的捕获能力。实验结果表明,在RMSE评价指标下,所提模型在SMS、Call、Internet三种网络流量数据集上分别提升了5.43%、4.30%、2.86%。 展开更多
关键词 蜂窝网络流量预测 时空数据挖掘 transformER 注意力机制 无线网络
在线阅读 下载PDF
基于时空Transformer的混合回报隐式Q学习人群导航
11
作者 周帅 符浩 刘伟 《计算机应用》 北大核心 2025年第11期3666-3673,共8页
在人群密集环境中,机器人执行人群导航任务时通常采用在线强化学习算法。然而,行人运动复杂多变的特性显著降低了在线强化学习的样本效率。针对这一问题,提出一种在离线强化学习(ORL)框架下的基于时空Transformer的混合回报隐式Q学习(ST... 在人群密集环境中,机器人执行人群导航任务时通常采用在线强化学习算法。然而,行人运动复杂多变的特性显著降低了在线强化学习的样本效率。针对这一问题,提出一种在离线强化学习(ORL)框架下的基于时空Transformer的混合回报隐式Q学习(STHRIQL)算法。首先,将蒙特卡洛(MC)回报机制融入隐式Q学习(IQL)算法中,旨在增强学习过程的收敛性;其次,进一步将时空Transformer模型整合至Actor-Critic中,以有效捕捉并解析离线人群导航数据集中机器人与行人之间高度动态且复杂的交互信息,从而优化算法的训练流程与效率;最后,通过仿真实验将所提算法与现有基于在线强化学习的人群导航算法进行对比,并根据评估机制进行定量与定性分析。实验结果显示,STHRIQL算法不仅在人群导航任务中展现出了优越的性能,而且相较于现有的在线人群导航算法,样本效率提升了30.5%~55.8%。STHRIQL算法可为提升机器人在复杂人群环境中的导航能力提供新的思路与解决方案。 展开更多
关键词 人群导航 深度强化学习 离线学习 神经网络 时空transformer
在线阅读 下载PDF
基于时空融合Transformer的航空发动机RUL预测
12
作者 王昱 杨晓庆 +1 位作者 李硕 张哲成 《振动与冲击》 北大核心 2025年第16期318-328,共11页
航空发动机数据呈现多变量、非线性和动态变化等复杂特征,且具有显著的时空关联性。大多数研究在分析数据时,往往局限于单一的多传感器尺度或时间尺度,且往往忽视数据间的长时依赖性,限制了其在航空发动机剩余使用寿命(remaining useful... 航空发动机数据呈现多变量、非线性和动态变化等复杂特征,且具有显著的时空关联性。大多数研究在分析数据时,往往局限于单一的多传感器尺度或时间尺度,且往往忽视数据间的长时依赖性,限制了其在航空发动机剩余使用寿命(remaining useful life,RUL)预测任务中的应用。为此,提出了一种时空融合Transformer网络模型。该模型在保留Transformer架构中的多头注意力机制和位置编码的优势以精准捕捉长时依赖特征的基础上,首先采用高效全连接网络替代原有的解码操作模块,匹配航空发动机RUL预测非线性回归问题属性的同时简化模型结构;然后,通过引入空间注意力机制模块,深入挖掘不同变量间的空间特征;最后,应用改进的赤池信息量准则对Transformer的重要超参数进行辨识,解决其超参数的选择难题。经C-MAPSS以及PHM08预测数据挑战赛两数据集的多组试验证实所提模型的有效性及其在预测精度方面的卓越表现。 展开更多
关键词 剩余使用寿命(RUL)预测 transformer神经网络 深度学习 赤池信息量准则 时空融合 空间注意力
在线阅读 下载PDF
基于Retinex理论的双重注意力Transformer的低光照图像增强
13
作者 李佳 王婷 +1 位作者 杨文杰 王弘扬 《计算机系统应用》 2025年第3期27-39,共13页
在低光照图像增强的研究中,虽然现有技术在提升图像亮度方面取得了进展,但细节恢复不足和颜色失真等问题仍然存在.为了解决这些问题,本文提出一种基于Retinex理论具有双重注意力的Transformer增强网络——DARFormer.该网络由光照估计网... 在低光照图像增强的研究中,虽然现有技术在提升图像亮度方面取得了进展,但细节恢复不足和颜色失真等问题仍然存在.为了解决这些问题,本文提出一种基于Retinex理论具有双重注意力的Transformer增强网络——DARFormer.该网络由光照估计网络和损坏修复网络两部分组成,旨在提升低光照图像的亮度,同时保留更多的细节并防止颜色失真.光照估计网络是基于图像先验来估计亮度映射项,用于低光照图像亮度增强;损坏修复网络则优化亮度增强后的图像质量,采用具有空间注意力和通道注意力的Transformer架构.在LOL_v1、LOL_v2和SID公开数据集上进行实验表明:与主流的增强方法相比,DARFormer在定量和定性指标上取得了更好的增强结果. 展开更多
关键词 图像增强 低照度图像 空间注意力 通道注意力 transformER
在线阅读 下载PDF
基于多尺度Transformer特征的道路场景语义分割网络
14
作者 彭洋 吴文欢 张淏坤 《华东交通大学学报》 2025年第2期110-118,共9页
道路场景中图像通常内容复杂,不同物体之间的尺度和形态差异较大,并且光照阴影等情况会让场景变得难以识别。而现有语义分割方法通常不能有效提取并充分融合多尺度语义特征,泛化能力和鲁棒性较差。文章提出了一种融合多尺度Transformer... 道路场景中图像通常内容复杂,不同物体之间的尺度和形态差异较大,并且光照阴影等情况会让场景变得难以识别。而现有语义分割方法通常不能有效提取并充分融合多尺度语义特征,泛化能力和鲁棒性较差。文章提出了一种融合多尺度Transformer特征的语义分割网络模型。首先,利用CSWin Transformer提取不同尺度的语义特征,并且引入特征细化模块(FRM)提升深层小尺度特征的语义辨析能力;其次,采用注意力聚合模块(AAM)对不同尺度特征分别进行聚合;最后,通过融合这些增强后的多尺度特征,进一步提升特征的语义表达能力,从而提高分割性能。实验结果表明:该网络模型在Cityscapes数据集上取得了82.3%的准确率,较SegNeXt和ConvNeXt分别提升了2.2个百分点和1.2个百分点;在目前最具挑战性的ADE20K数据集上取得了47.4%的准确率,较SegNeXt和ConvNeXt分别提升了3.2个百分点和1.8个百分点。所提出的融合多尺度Transformer特征模型不仅具有较高的语义分割精度,能准确预测道路场景图像的像素语义类别,而且具有较强的泛化性能和鲁棒性。 展开更多
关键词 语义分割 transformer特征 特征融合 空间期望最大化注意力 通道注意力
在线阅读 下载PDF
融合FPN与SFB的Swin Transformer图像去噪网络
15
作者 袁姮 华乾勇 《计算机系统应用》 2025年第10期32-43,共12页
为了提升图像去噪网络对局部与全局信息的捕捉能力,本文提出一种基于特征金字塔网络(feature pyramid network, FPN)和空间频率块(spatial frequency block, SFB)的Swin Transformer图像去噪网络(SwinFPSFNet).该网络由3个阶段组成:在... 为了提升图像去噪网络对局部与全局信息的捕捉能力,本文提出一种基于特征金字塔网络(feature pyramid network, FPN)和空间频率块(spatial frequency block, SFB)的Swin Transformer图像去噪网络(SwinFPSFNet).该网络由3个阶段组成:在浅层特征提取阶段,设计了特征金字塔网络以增强局部特征提取能力;在深层特征提取阶段,结合快速傅里叶卷积(fast Fourier convolution, FFC)设计空间频率块,用于同时捕捉全局与局部信息;最后,通过聚合浅层与深层特征,进一步增强网络去噪能力.此外,本文构建了一种高斯噪声退化模型并结合多种数据增强策略,以提升网络的泛化能力.在CBSD68、Kodak24和Urban100数据集上的实验结果表明,与当前主流去噪方法如BM3D、DnCNN、FFDNet、SwinIR等相比, SwinFPSFNet能够兼顾局部与全局信息,在噪声抑制和保留图像细节方面表现出显著优势. 展开更多
关键词 图像去噪 Swin transformer 特征金字塔网络 空间频率块
在线阅读 下载PDF
无人机场景下基于Transformer的轻量化行人重识别 被引量:1
16
作者 胡海峰 倪宗煜 +3 位作者 赵海涛 张红 沐勇 吴建盛 《南京邮电大学学报(自然科学版)》 北大核心 2024年第3期48-62,共15页
针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transfor... 针对无人机场景下行人重识别所呈现的多视角多尺度特点,以及传统的基于卷积神经网络的行人重识别算法受限于局部感受野结构和下采样操作,很难对行人图像的全局特征进行提取且图像空间特征分辨率不高。提出一种无人机场景下基于Transformer的轻量化行人重识别(Lightweight Transformer-based Person Re-Identification,LTReID)算法,利用多头多注意力机制从全局角度提取人体不同部分特征,使用Circle损失和边界样本挖掘损失,以提高图像特征提取和细粒度图像检索性能,并利用快速掩码搜索剪枝算法对Transformer模型进行训练后轻量化,以提高模型的无人机平台部署能力。更进一步,提出一种可学习的面向无人机场景的空间信息嵌入,在训练过程中通过学习获得优化的非视觉信息,以提取无人机多视角下行人的不变特征,提升行人特征识别的鲁棒性。最后,在实际的无人机行人重识别数据库中,讨论了在不同量级主干网和不同剪枝率情况下所提LTReID算法的行人重识别性能,并与多种行人重识别算法进行了性能对比,结果表明了所提算法的有效性和优越性。 展开更多
关键词 无人机场景 行人重识别 transformer轻量化 空间信息嵌入
在线阅读 下载PDF
引入Transformer的道路小目标检测 被引量:2
17
作者 李丽芬 黄如 《计算机工程与设计》 北大核心 2024年第1期95-101,共7页
针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transform... 针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transformer)模块捕获特征内部的相关性,获得上下文信息,提取更加全面丰富的特征;在网络特征融合部分嵌入改进后的空间金字塔池化模块,在保持较小计算量的同时增加特征图的感受野。实验结果表明,在KITTI数据集上,算法检测精度达到91.97%,与YOLOv4算法相比,mAP提高了2.53%,降低了小目标的漏检率。 展开更多
关键词 小目标检测 深度学习 YOLOv4算法 多尺度检测 transformER 空间金字塔池化 特征融合
在线阅读 下载PDF
面向弱纹理目标立体匹配的Transformer网络 被引量:1
18
作者 贾迪 蔡鹏 +2 位作者 吴思 王骞 宋慧伦 《中国图象图形学报》 CSCD 北大核心 2024年第8期2413-2425,共13页
目的近年来,采用神经网络完成立体匹配任务已成为计算机视觉领域的研究热点,目前现有方法存在弱纹理目标缺乏全局表征的问题,为此本文提出一种基于Transformer架构的密集特征提取网络。方法首先,采用空间池化窗口策略使得Transformer层... 目的近年来,采用神经网络完成立体匹配任务已成为计算机视觉领域的研究热点,目前现有方法存在弱纹理目标缺乏全局表征的问题,为此本文提出一种基于Transformer架构的密集特征提取网络。方法首先,采用空间池化窗口策略使得Transformer层可以在维持线性计算复杂度的同时,捕获广泛的上下文表示,弥补局部弱纹理导致的特征匮乏问题。其次,通过卷积与转置卷积实现重叠式块嵌入,使得所有特征点都尽可能多地捕捉邻近特征,便于细粒度匹配。再者,通过将跳跃查询策略应用于编码器和解码器间的特征融合部分,以此实现高效信息传递。最后,针对立体像对存在的遮挡情况,对固定区域内的匹配概率进行截断求和,输出更为合理的遮挡置信度。结果在Scene Flow数据集上进行了消融实验,实验结果表明,本文网络获得了0.33的绝对像素距离,0.92%的异常像素占比和98%的遮挡预测交并比。为了验证模型在实际路况场景下的有效性,在KITTI-2015数据集上进行了补充对比实验,本文方法获得了1.78%的平均异常值百分比,上述指标均优于STTR(stereo Transformer)等主流方法。此外,在KITTI-2015、MPI-Sintel(max planck institute sintel)和Middlebury-2014数据集的测试中,本文模型具备较强的泛化性。结论本文提出了一个纯粹的基于Transformer架构的密集特征提取器,使用空间池化窗口策略减小注意力计算的空间规模,并利用跳跃查询策略对编码器和解码器的特征进行了有效融合,可以较好地提高Transformer架构下的特征提取性能。 展开更多
关键词 立体匹配 弱纹理目标 transformER 空间池化窗口 跳跃查询 截断求和 Scene Flow KITTI-2015
原文传递
Sound Source Localization Based on SRP-PHAT Spatial Spectrum and Deep Neural Network 被引量:3
19
作者 Xiaoyan Zhao Shuwen Chen +1 位作者 Lin Zhou Ying Chen 《Computers, Materials & Continua》 SCIE EI 2020年第7期253-271,共19页
Microphone array-based sound source localization(SSL)is a challenging task in adverse acoustic scenarios.To address this,a novel SSL algorithm based on deep neural network(DNN)using steered response power-phase transf... Microphone array-based sound source localization(SSL)is a challenging task in adverse acoustic scenarios.To address this,a novel SSL algorithm based on deep neural network(DNN)using steered response power-phase transform(SRP-PHAT)spatial spectrum as input feature is presented in this paper.Since the SRP-PHAT spatial power spectrum contains spatial location information,it is adopted as the input feature for sound source localization.DNN is exploited to extract the efficient location information from SRP-PHAT spatial power spectrum due to its advantage on extracting high-level features.SRP-PHAT at each steering position within a frame is arranged into a vector,which is treated as DNN input.A DNN model which can map the SRP-PHAT spatial spectrum to the azimuth of sound source is learned from the training signals.The azimuth of sound source is estimated through trained DNN model from the testing signals.Experiment results demonstrate that the proposed algorithm significantly improves localization performance whether the training and testing condition setup are the same or not,and is more robust to noise and reverberation. 展开更多
关键词 Sound source localization microphone array steered response power-phase transform(srp-phat)spatial spectrum deep neural network
在线阅读 下载PDF
Air pollution effects of industrial transformation in the Yangtze River Delta from the perspective of spatial spillover 被引量:4
20
作者 CHEN Yufan XU Yong WANG Fuyuan 《Journal of Geographical Sciences》 SCIE CSCD 2022年第1期156-176,共21页
The Yangtze River Delta(YRD) is a region in China with a serious contradiction between economic growth and environmental pollution. Exploring the spatiotemporal effects and influencing factors of air pollution in the ... The Yangtze River Delta(YRD) is a region in China with a serious contradiction between economic growth and environmental pollution. Exploring the spatiotemporal effects and influencing factors of air pollution in the region is highly important for formulating policies to promote the high-quality development of urban industries. This study uses the spatial Durbin model(SDM) to analyze the local direct and spatial spillover effects of industrial transformation on air pollution and quantifies the contribution of each factor. From 2008 to 2018, there was a significant spatial agglomeration of industrial sulfur dioxide emissions(ISDE) in the YRD, and every 1% increase in ISDE led to a synchronous increase of 0.603% in the ISDE in adjacent cities. The industrial scale index(ISCI) and industrial structure index(ISTI), as the core factors of industrial transformation, significantly affect the emissions of sulfur dioxide in the YRD, and the elastic coefficients are 0.677 and-0.368, respectively. The order of the direct effect of the explanatory variables on local ISDE is ISCI>ISTI>foreign direct investment(FDI)>enterprise technological innovation(ETI)>environmental regulation(ER)> per capita GDP(PGDP). Similarly, the order of the spatial spillover effect of all variables on ISDE in adjacent cities is ISCI>PGDP>FDI>ETI>ISTI>ER, and the coefficients of the ISCI and ISTI are 1.531 and 0.113, respectively. This study contributes to the existing research that verifies the environmental Kuznets curve in the YRD, denies the pollution heaven hypothesis, indicates the Porter hypothesis, and provides empirical evidence for the formation mechanism of regional environmental pollution from a spatial spillover perspective. 展开更多
关键词 industrial agglomeration industrial structure adjustment industrial transformation air pollution spatial spillover effect spatial Durbin model
原文传递
上一页 1 2 100 下一页 到第
使用帮助 返回顶部