期刊文献+
共找到1,449篇文章
< 1 2 73 >
每页显示 20 50 100
Spatial-temporal Heterogeneity of Industrial Structure Transformation and Carbon Emission Effects in Xuzhou Metropolitan Area 被引量:3
1
作者 QIU Fangdao YUAN He +1 位作者 BAI Liangyu LI Fei 《Chinese Geographical Science》 SCIE CSCD 2017年第6期904-917,共14页
Employing decoupling index and industrial structure characteristic bias index methods, this study analyzed the spatial-temporal characteristics of industrial structure transformations and their resulting carbon emissi... Employing decoupling index and industrial structure characteristic bias index methods, this study analyzed the spatial-temporal characteristics of industrial structure transformations and their resulting carbon emissions in the Xuzhou Metropolitan Area from 2000 to 2014, with a focus on their relationships and driving factors. Our research indicates that carbon emission intensity from industrial structures in the Xuzhou Metropolitan Area at first showed an increasing trend, which then decreased. Furthermore, the relationship between emissions and industrial economic growth has been trending toward absolute decoupling. From the perspective of the center-periphery, the Xuzhou Metropolitan Area formed a concentric pattern, where both progress towards low emissions and the level of technological advancement gradually diminished from the center to the periphery. In terms of variation across provinces, the ISCB index in the eastern Henan has decreased the slowest, followed by the southern Shandong and the northern Anhui, with the northern Jiangsu ranking last. During this period, resource-and labor-intensive industries were the primary growth industries in the northern Anhui and the eastern Henan, while labor-intensive industries dominated the southern Shandong and capital-intensive industries dominated the northern Jiangsu. In terms of city types, the spatial pattern for industrial structure indicates that recession resource-based cities had higher carbon emission intensities than mature resource-based cities, followed by non-resource-based cities and regenerative resource-based cities. Generally, the industrial structure in the Xuzhou Metropolitan Area has transformed from being resource-intensive to capital-intensive, and has been trending toward technology-intensive as resource availability has been exploited to exhaustion and then been regenerated. Industrial structure has been the leading factor causing heterogeneity of carbon emission intensities between metropolitan cities. Therefore, the key to optimizing the industrial structure and layout of metropolitan areas is to promote industrial structure transformation and improve the system controlling collaborative industrial development between cities. 展开更多
关键词 industrial structure transformation industrial structure characteristic bias carbon emission effect spatial-temporal pattern Xuzhou Metropolitan Area
在线阅读 下载PDF
A Cross-Cultural Study on Transformational Leadership
2
作者 许薇 《海外英语》 2016年第13期136-137,共2页
This paper examines transformational leadership theory and the relationship between transformational leadership and group performance as well. Transformational leadership asks leaders to understand the needs of follow... This paper examines transformational leadership theory and the relationship between transformational leadership and group performance as well. Transformational leadership asks leaders to understand the needs of followers and motivate followers for their overall development, which brings benefits to a group. It is hoped that this paper can contribute to comparative studies on Transformational leadership in the U.S. and China. 展开更多
关键词 LEADERSHIP hoped LEADERSHIP encourage LIKELY BENEFITS validity SITUATIONS originally MOTIVATION
在线阅读 下载PDF
3D medical image segmentation using the serial-parallel convolutional neural network and transformer based on crosswindow self-attention 被引量:1
3
作者 Bin Yu Quan Zhou +3 位作者 Li Yuan Huageng Liang Pavel Shcherbakov Xuming Zhang 《CAAI Transactions on Intelligence Technology》 2025年第2期337-348,共12页
Convolutional neural network(CNN)with the encoder-decoder structure is popular in medical image segmentation due to its excellent local feature extraction ability but it faces limitations in capturing the global featu... Convolutional neural network(CNN)with the encoder-decoder structure is popular in medical image segmentation due to its excellent local feature extraction ability but it faces limitations in capturing the global feature.The transformer can extract the global information well but adapting it to small medical datasets is challenging and its computational complexity can be heavy.In this work,a serial and parallel network is proposed for the accurate 3D medical image segmentation by combining CNN and transformer and promoting feature interactions across various semantic levels.The core components of the proposed method include the cross window self-attention based transformer(CWST)and multi-scale local enhanced(MLE)modules.The CWST module enhances the global context understanding by partitioning 3D images into non-overlapping windows and calculating sparse global attention between windows.The MLE module selectively fuses features by computing the voxel attention between different branch features,and uses convolution to strengthen the dense local information.The experiments on the prostate,atrium,and pancreas MR/CT image datasets consistently demonstrate the advantage of the proposed method over six popular segmentation models in both qualitative evaluation and quantitative indexes such as dice similarity coefficient,Intersection over Union,95%Hausdorff distance and average symmetric surface distance. 展开更多
关键词 convolution neural network cross window self‐attention medical image segmentation transformer
在线阅读 下载PDF
Multivariate Time Series Anomaly Detection Based on Spatial-Temporal Network and Transformer in Industrial Internet of Things 被引量:2
4
作者 Mengmeng Zhao Haipeng Peng +1 位作者 Lixiang Li Yeqing Ren 《Computers, Materials & Continua》 SCIE EI 2024年第8期2815-2837,共23页
In the Industrial Internet of Things(IIoT),sensors generate time series data to reflect the working state.When the systems are attacked,timely identification of outliers in time series is critical to ensure security.A... In the Industrial Internet of Things(IIoT),sensors generate time series data to reflect the working state.When the systems are attacked,timely identification of outliers in time series is critical to ensure security.Although many anomaly detection methods have been proposed,the temporal correlation of the time series over the same sensor and the state(spatial)correlation between different sensors are rarely considered simultaneously in these methods.Owing to the superior capability of Transformer in learning time series features.This paper proposes a time series anomaly detection method based on a spatial-temporal network and an improved Transformer.Additionally,the methods based on graph neural networks typically include a graph structure learning module and an anomaly detection module,which are interdependent.However,in the initial phase of training,since neither of the modules has reached an optimal state,their performance may influence each other.This scenario makes the end-to-end training approach hard to effectively direct the learning trajectory of each module.This interdependence between the modules,coupled with the initial instability,may cause the model to find it hard to find the optimal solution during the training process,resulting in unsatisfactory results.We introduce an adaptive graph structure learning method to obtain the optimal model parameters and graph structure.Experiments on two publicly available datasets demonstrate that the proposed method attains higher anomaly detection results than other methods. 展开更多
关键词 Multivariate time series anomaly detection spatial-temporal network transformER
在线阅读 下载PDF
CHINESE CULTURE:CULTURAL TRANSFORMATION AND CROSS
5
作者 Ma feng Zhanna V.Kovaliv 《大观周刊》 2011年第20期243-243,241,共2页
在线阅读 下载PDF
基于多尺度与多级语义融合Transformer的人体姿态估计
6
作者 李俊 袁通达 陈黎 《武汉大学学报(理学版)》 北大核心 2025年第4期473-484,共12页
针对人体姿态估计任务中视觉Transformer模型存在的尺度多样性受限和近距离信息忽视问题,提出多尺度与多级语义融合Transformer(MMSF)模型。该模型通过引入关键点标记作为代理的交叉Transformer操作,实现了不同分辨率视觉信息的相互学习... 针对人体姿态估计任务中视觉Transformer模型存在的尺度多样性受限和近距离信息忽视问题,提出多尺度与多级语义融合Transformer(MMSF)模型。该模型通过引入关键点标记作为代理的交叉Transformer操作,实现了不同分辨率视觉信息的相互学习,提高了估计精度。同时,利用深度卷积和稠密连接复用标记技术,有效提取了含有多级语义信息的交叉标记,减少了编码器层堆叠,降低了模型复杂度。通过交叉标记与标准标记的交叉融合注意力操作,整合了多级语义信息,进一步增强了姿态估计效果。实验结果表明,在相同的条件下,MMSF模型在COCO数据集上达到了78.1%的平均精度,比TokenPose基准模型高2.3%;在MPII数据集上验证了其有效性,与近几年经典的基于Transformer的人体姿态估计方法相比取得了更好的性能。 展开更多
关键词 视觉transformer 人体姿态估计 深度卷积 标记融合 交叉注意力
原文传递
基于Transformer多分辨率特征融合的图像压缩感知重构
7
作者 熊承义 马帅 +2 位作者 高志荣 李帆 陈文旗 《中南民族大学学报(自然科学版)》 2025年第3期400-406,共7页
利用图像多分辨率特征的交叉融合,对于改善压缩感知图像的重构质量具有较好潜能.研究了一种基于Transformer多分辨率特征融合的图像压缩感知重构方法.输入图像的测量值首先经过初始重构,得到一组分辨率降维的低分辨率初始重构图像;然后... 利用图像多分辨率特征的交叉融合,对于改善压缩感知图像的重构质量具有较好潜能.研究了一种基于Transformer多分辨率特征融合的图像压缩感知重构方法.输入图像的测量值首先经过初始重构,得到一组分辨率降维的低分辨率初始重构图像;然后,采用两个通路并行提取不同分辨率图像的特征并进行交叉融合;最后,将输出的两路特征分别用于原始图像的重构及其降采样重构.采用Transformer网络执行多分辨率图像特征的交叉融合,以更好利用图像的远距离相关性.大量实验比较结果验证了所提出的方法在平衡网络复杂度和改进重构图像质量方面的有效性. 展开更多
关键词 多分辨率特征 压缩感知 交叉融合 transformer方法
在线阅读 下载PDF
基于双流特征交叉融合Efficient Transformer的人脸表情识别
8
作者 党宏社 孟饶辰 高宛蓉 《计算机工程与应用》 北大核心 2025年第15期251-257,共7页
面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet... 面部表情识别在人机交互等现实应用中得到了越来越多的重视。为解决传统方法中由于类间相似性和类内差异引起的识别准确率低等问题,提出了一种双流特征交叉融合Efficient Transformer识别人脸表情的方法。使用IResNet50和MobileFaceNet分别提取人脸表情的图像和关键点的多尺度特征,同时采用通道注意力机制来增强关键特征并减少参数量;引入了交叉融合高效多头自注意力机制(cross fusion efficient multi-head self-attention,CFEMSA),对相同尺度的双流特征进行交叉融合,以突出面部显著特征;最后采用特征金字塔结构对不同尺度的交叉融合结果进行多尺度融合,以提高识别的准确性。提出的方法在RAF-DB、AffecNet-7和AffecNet-8数据集上的识别准确率分别为91.82%、67.46%和63.65%,实验结果证明该方法有效缓解了类间相似性和类内差异所引起的识别准确率低的问题。 展开更多
关键词 面部表情识别 Efficient transformer 交叉融合 多尺度特征 特征融合
在线阅读 下载PDF
Detection of Mechanical Deformation in Old Aged Power Transformer Using Cross Correlation Co-Efficient Analysis Method 被引量:2
9
作者 Asif Islam Shahidul Islam Khan Aminul Hoque 《Energy and Power Engineering》 2011年第4期585-591,共7页
Detection of minor faults in power transformer active part is essential because minor faults may develop and lead to major faults and finally irretrievable damages occur. Sweep Frequency Response Analysis (SFRA) is an... Detection of minor faults in power transformer active part is essential because minor faults may develop and lead to major faults and finally irretrievable damages occur. Sweep Frequency Response Analysis (SFRA) is an effective low-voltage, off-line diagnostic tool used for finding out any possible winding displacement or mechanical deterioration inside the Transformer, due to large electromechanical forces occurring from the fault currents or due to Transformer transportation and relocation. In this method, the frequency response of a transformer is taken both at manufacturing industry and concern site. Then both the response is compared to predict the fault taken place in active part. But in old aged transformers, the primary reference response is unavailable. So Cross Correlation Co-Efficient (CCF) measurement technique can be a vital process for fault detection in these transformers. In this paper, theoretical background of SFRA technique has been elaborated and through several case studies, the effectiveness of CCF parameter for fault detection has been represented. 展开更多
关键词 Core Damage RADIAL DEFORMATION AXIAL DEFORMATION SWEEP Frequency Response Analysis cross Correlation Co-efficient Power transformer
暂未订购
基于视觉Transformer的运动特征选择融合微表情识别算法 被引量:1
10
作者 杜含月 张鹏 +3 位作者 林强 李晓桐 徐森 贲晛烨 《信号处理》 北大核心 2025年第2期267-278,共12页
微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,... 微表情识别旨在揭示目标对象隐藏的真实情感,其在人机交互、心理诊断以及意图预测等领域具有重要应用价值。然而,微表情表达强度微弱、时间短暂且面部运动单元间存在长距离依赖,使得传统卷积神经网络难以有效表征微表情动态特征。此外,微表情特征与受试者身份以及面部外观信息存在强耦合性,不利于分离和提取微表情语义信息。为了解决上述问题,本文提出了一种基于视觉Transformer和运动特征选择的微表情识别算法。首先,利用TVL1光流算法计算水平和垂直光流运动图,用以表征面部运动。随后,利用视觉Transformer网络编码微表情发生时面部运动单元间的运动依赖关系,为了进一步提升特征表达能力,本文设计了特征选择融合模块(Feature Selection Fusion Module,FSFM)以实现微表情关键的局部信息的有效获取,并引入空间一致性注意力模块(Spatial Consistency Attention Module,SCAM)以确保不同运动特征在空间分布上的一致性。此外,本文提出的交叉注意力融合模块(Cross Attention Fusion Module,CAFM)能够增强微表情语义信息的表征能力。与现有方法相比,本文所提出的算法在三个权威的微表情数据库上微表情识别任务中表现出显著的准确率提升,进一步验证了该方法的有效性与优越性。 展开更多
关键词 微表情识别 特征选择与融合 交叉注意力机制 视觉transformer
在线阅读 下载PDF
融合通道注意力的跨尺度Transformer图像超分辨率重建 被引量:1
11
作者 李焱 董仕豪 +2 位作者 张家伟 赵茹 郑钰辉 《中国图象图形学报》 北大核心 2025年第3期784-797,共14页
目的针对在超分辨率任务中,Transformer模型存在特征提取模式单一、重建图像高频细节丢失和结构失真的问题,提出了一种融合通道注意力的跨尺度Transformer图像超分辨率重建模型。方法模型由4个模块组成:浅层特征提取、跨尺度深层特征提... 目的针对在超分辨率任务中,Transformer模型存在特征提取模式单一、重建图像高频细节丢失和结构失真的问题,提出了一种融合通道注意力的跨尺度Transformer图像超分辨率重建模型。方法模型由4个模块组成:浅层特征提取、跨尺度深层特征提取、多级特征融合以及高质量重建模块。浅层特征提取利用卷积处理早期图像,获得更稳定的输出;跨尺度深层特征提取利用跨尺度Transformer和强化通道注意力机制,扩大感受野并通过加权筛选提取不同尺度特征以便融合;多级特征融合模块利用强化通道注意力机制,实现对不同尺度特征通道权重的动态调整,促进模型对丰富上下文信息的学习,增强模型在图像超分辨率重建任务中的能力。结果在Set5、Set14、BSD100(Berkeley segmentation dataset 100)、Urban100(urban scene 100)和Manga109标准数据集上的模型评估结果表明,相较于SwinIR超分辨率模型,所提模型在峰值信噪比上提高了0.06~0.25 dB,且重建图像视觉效果更好。结论提出的融合通道注意力的跨尺度Transformer图像超分辨率重建模型,通过融合卷积特征与Transformer特征,并利用强化通道注意力机制减少图像中噪声和冗余信息,降低模型产生图像模糊失真的可能性,图像超分辨率性能有效提升,在多个公共实验数据集的测试结果验证了所提模型的有效性。 展开更多
关键词 图像超分辨率 跨尺度transformer 通道注意力机制 特征融合 深度学习
原文传递
CATrans:基于跨尺度注意力Transformer的高分辨率遥感影像土地覆盖语义分割框架 被引量:1
12
作者 陈丽佳 陈宏辉 +3 位作者 谢艳秋 何天友 叶菁 吴林煌 《地球信息科学学报》 北大核心 2025年第7期1624-1637,共14页
【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力... 【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力,影响了推理分割质量。【方法】为了解决这一问题,本文提出了一种联合跨尺度注意力和语义视觉Transformer的遥感影像分割框架(Cross-scale Attention Transformer,CATrans),融合跨尺度注意力模块和语义视觉Transformer,提取上下文先验知识增强局部特征表示和分割性能。首先,跨尺度注意力模块通过空间和通道两个维度进行并行特征处理,分析浅层-深层和局部-全局特征之间的依赖关系,提升对遥感影像中不同粒度对象的注意力。其次,语义视觉Transformer通过空间注意力机制捕捉上下文语义信息,建模语义信息之间的依赖关系。【结果】本文在DeepGlobe、Inria Aerial和LoveDA数据集上进行对比实验,结果表明:CATrans的分割性能优于现有的WSDNet(Discrete Wavelet Smooth Network)和ISDNet(Integrating Shallow and Deep Network)等分割算法,分别取得了76.2%、79.2%、54.2%的平均交并比(Mean Intersection over Union,mIoU)和86.5%、87.8%、66.8%的平均F1得分(Mean F1 Score,mF1),推理速度分别达到38.1 FPS、13.2 FPS和95.22 FPS。相较于本文所对比的最佳方法WSDNet,mIoU和mF1在3个数据集中分别提升2.1%、4.0%、5.3%和1.3%、1.8%、5.6%,在每类地物的分割中都具有显著优势。【结论】本方法实现了高效率、高精度的高分辨率遥感影像语义分割。 展开更多
关键词 高分辨率 语义分割 跨尺度注意力 视觉transformer 上下文先验 空间注意力 语义信息
原文传递
基于前置归一化Transformer的融合多模态行人过街意图预测模型 被引量:1
13
作者 陈振东 刘广聪 叶振宇 《计算机应用研究》 北大核心 2025年第5期1378-1384,共7页
预测行人的过街意图是自动驾驶系统中的行人与车辆交互重要环节之一,目的在于提前预测出道路两侧行人的过街行为,作出减速或避让的决策。为了能够提升识别行人过街意图的准确性,受到前置归一化注意力机制的启发,提出了一种基于前置归一... 预测行人的过街意图是自动驾驶系统中的行人与车辆交互重要环节之一,目的在于提前预测出道路两侧行人的过街行为,作出减速或避让的决策。为了能够提升识别行人过街意图的准确性,受到前置归一化注意力机制的启发,提出了一种基于前置归一化注意力机制的行人过街意图预测模型,对行人不同模态特征进行提取并互补融合。该模型使用单模态特征增强模块(UFE)对单一模态进行关键特征提取,随后使用多模态特征交互模块(MFI)进行不同模态之间的特征融合。实验证明,在PIE和JAAD数据集上的准确率均达到91%,并且对模态信息的不同融合策略进行了广泛的消融实验,证明了其有效性,为自动驾驶系统提供更准确的行人过街意图预测。 展开更多
关键词 行人过街 意图预测 多模态融合 transformER
在线阅读 下载PDF
改进Transformer解码器的端到端语音识别 被引量:1
14
作者 胡恒博 牛铜 何振华 《计算机应用》 北大核心 2025年第S1期95-100,共6页
Transformer模型架构在序列到序列任务中可以很好地将注意力分散到整个输入上以学习长期依赖关系,然而,在语音识别中,文本输出和语音输入是单调对齐的。针对Transformer解码器无法较好地捕获局部特征以进行单调对齐的问题,提出一种改进... Transformer模型架构在序列到序列任务中可以很好地将注意力分散到整个输入上以学习长期依赖关系,然而,在语音识别中,文本输出和语音输入是单调对齐的。针对Transformer解码器无法较好地捕获局部特征以进行单调对齐的问题,提出一种改进的Transformer解码器。将Transformer解码器中的2种注意力机制拆分为2个单独模块,再使用交叉注意力进行更高效的局部特征捕获。在开源中文普通话AISHELL-1数据集上的实验结果表明,使用能够捕获局部特征的编码器时,该解码器相较于Transformer解码器有着更好的识别效果。具体地,当编码器为Conformer时,字错误率(CER)降低了16.19%,且收敛速度更快,而在使用了连接时序分类(CTC)进行辅助解码后,CER降低了5.08%,最终的CER为4.67%。 展开更多
关键词 交叉注意力 transformer解码器 Conformer编码器 语音识别 局部特征
在线阅读 下载PDF
Performance Comparison of Vision Transformer- and CNN-Based Image Classification Using Cross Entropy: A Preliminary Application to Lung Cancer Discrimination from CT Images
15
作者 Eri Matsuyama Haruyuki Watanabe Noriyuki Takahashi 《Journal of Biomedical Science and Engineering》 2024年第9期157-170,共14页
This study evaluates the performance and reliability of a vision transformer (ViT) compared to convolutional neural networks (CNNs) using the ResNet50 model in classifying lung cancer from CT images into four categori... This study evaluates the performance and reliability of a vision transformer (ViT) compared to convolutional neural networks (CNNs) using the ResNet50 model in classifying lung cancer from CT images into four categories: lung adenocarcinoma (LUAD), lung squamous cell carcinoma (LUSC), large cell carcinoma (LULC), and normal. Although CNNs have made significant advancements in medical imaging, their limited capacity to capture long-range dependencies has led to the exploration of ViTs, which leverage self-attention mechanisms for a more comprehensive global understanding of images. The study utilized a dataset of 748 lung CT images to train both models with standardized input sizes, assessing their performance through conventional metrics—accuracy, precision, recall, F1 score, specificity, and AUC—as well as cross entropy, a novel metric for evaluating prediction uncertainty. Both models achieved similar accuracy rates (95%), with ViT demonstrating a slight edge over ResNet50 in precision and F1 scores for specific classes. However, ResNet50 exhibited higher recall for LULC, indicating fewer missed cases. Cross entropy analysis showed that the ViT model had lower average uncertainty, particularly in the LUAD, Normal, and LUSC classes, compared to ResNet50. This finding suggests that ViT predictions are generally more reliable, though ResNet50 performed better for LULC. The study underscores that accuracy alone is insufficient for model comparison, as cross entropy offers deeper insights into the reliability and confidence of model predictions. The results highlight the importance of incorporating cross entropy alongside traditional metrics for a more comprehensive evaluation of deep learning models in medical image classification, providing a nuanced understanding of their performance and reliability. While the ViT outperformed the CNN-based ResNet50 in lung cancer classification based on cross-entropy values, the performance differences were minor and may not hold clinical significance. Therefore, it may be premature to consider replacing CNNs with ViTs in this specific application. 展开更多
关键词 Lung Cancer Classification Vision transformers Convolutional Neural Networks cross Entropy Deep Learning
暂未订购
CRAKUT:融合对比区域注意力机制与临床先验知识的U-Transformer用于放射学报告生成 被引量:1
16
作者 梁业东 朱雄峰 +3 位作者 黄美燕 张文聪 郭翰宇 冯前进 《南方医科大学学报》 北大核心 2025年第6期1343-1352,共10页
目的 提出一种对比区域注意力和先验知识融合的U型Transformer模型(CRAKUT),旨在解决文本分布不均衡、缺乏上下文临床知识以及跨模态信息转换等问题,提升生成报告的质量,辅助影像科医生诊断工作。方法 CRAKUT包括3个关键模块:对比注意... 目的 提出一种对比区域注意力和先验知识融合的U型Transformer模型(CRAKUT),旨在解决文本分布不均衡、缺乏上下文临床知识以及跨模态信息转换等问题,提升生成报告的质量,辅助影像科医生诊断工作。方法 CRAKUT包括3个关键模块:对比注意力图像编码器,利用数据集中常见的正常影像提取增强的视觉特征;外部知识注入模块,融合临床先验知识;U型Transformer,通过U型连接架构完成从视觉到语言的跨模态信息转换。在图像编码器中引入的对比区域注意力机制,通过强调正常与异常语义特征之间的差异,增强了异常区域的特征表示。此外,文本编码器中的临床先验知识注入模块结合了临床历史信息及由ChatGPT生成的知识图谱,从而提升了报告生成的上下文理解能力。U型Transformer在多模态编码器与报告解码器之间建立连接,融合多种类型的信息以生成最终的报告。结果 在2个公开的CXR数据集(IU-Xray和MIMIC-CXR)对CRAKUT模型进行评估,结果显示,CRAKUT在报告生成任务中实现了当前最先进的性能。在MIMIC-CXR数据集,CRAKUT取得了BLEU-4分数0.159、ROUGE-L分数0.353、CIDEr分数0.500;在IU-Xray数据集上,METEOR分数达到0.258,均优于以往模型的表现。结论 本文提出的方法在临床疾病诊断和报告生成中具有巨大的应用潜力。 展开更多
关键词 胸部X光 对比区域注意力 临床先验知识 跨模态交互 U-transformer模型
在线阅读 下载PDF
基于跨模态交互Transformer的多模态方面级情感分析 被引量:1
17
作者 甘卓浩 缪裕青 +2 位作者 刘同来 张万桢 周明 《计算机应用研究》 北大核心 2025年第9期2707-2713,共7页
针对现有多模态方面级情感分析模型存在的视觉信息提取不充分和方面情感语义缺失问题,提出一种基于跨模态交互Transformer的多模态方面级情感分析模型。该模型通过文本语义增强模块融合图像标题与原始文本以弥补情感语义缺失;利用依存... 针对现有多模态方面级情感分析模型存在的视觉信息提取不充分和方面情感语义缺失问题,提出一种基于跨模态交互Transformer的多模态方面级情感分析模型。该模型通过文本语义增强模块融合图像标题与原始文本以弥补情感语义缺失;利用依存句法分析与图卷积网络构建方面感知特征提取模块,捕获方面项与观点词间的长距离依赖;设计跨模态特征交互模块,结合top-n形容词-名词对分布约束策略及多模态融合Transfor-mer,实现图像与文本特征的深层交互。在Twitter-2015、Twitter-2017和ZOL三个数据集上的实验结果表明,CMIT模型在准确率和宏平均F 1值上均优于多个基准模型,验证了其有效性和泛化能力。 展开更多
关键词 多模态方面级情感分析 跨模态交互 transformER 图卷积网络 形容词-名词对
在线阅读 下载PDF
Application of the Cross Wavelet Transform to Solar Activity and Major Earthquakes Occurred in Chile
18
作者 Patricia Alejandra Larocca 《International Journal of Geosciences》 2016年第11期1310-1317,共9页
Historical earthquakes registered in Chile (from 1900 up to 2015) with epicenters located between 17?30'S and 56?0'S latitude and yearly mean total sunspot number have been considered in order to evaluate a si... Historical earthquakes registered in Chile (from 1900 up to 2015) with epicenters located between 17?30'S and 56?0'S latitude and yearly mean total sunspot number have been considered in order to evaluate a significant linkage between them. The occurrence of strong earthquakes along Chile and the sunspots activity are analyzed to inspect possible influence of solar cycles on earthquakes. The cross wavelet transform and wavelet coherence analysis were applied for sequences of sunspots and earthquakes activity. An 8 - 12 years modulation of earthquakes activity has been identified. 展开更多
关键词 cross Wavelet transform Earthquakes Activity Solar Activity Sunspots Number PERIODICITIES
在线阅读 下载PDF
基于CNN-Transformer交互融合网络的航空活塞发动机进排气故障诊断
19
作者 盛润 徐劲松 +1 位作者 韦宝涛 王博 《振动与冲击》 北大核心 2025年第21期258-269,共12页
针对航空活塞发动机振动信号中表征故障的关键特征易被噪声淹没,现有模型难以全面刻画复杂信号的挑战,提出了一种基于卷积神经网络(convolutional neural network,CNN)-Transformer交互融合网络的航空活塞发动机进排气故障诊断方法。首... 针对航空活塞发动机振动信号中表征故障的关键特征易被噪声淹没,现有模型难以全面刻画复杂信号的挑战,提出了一种基于卷积神经网络(convolutional neural network,CNN)-Transformer交互融合网络的航空活塞发动机进排气故障诊断方法。首先,设计的CNN-Transformer双分支并行结构充分发挥各自优势,分别从原始振动信号中提取局部细节特征和全局时序特征。在此基础上,引入交叉注意力特征交互融合模块,通过注意力权重分配动态关联两类特征的关键信息,实现局部与全局特征的深度融合。最终,全面刻画出表征发动机进排气故障的振动特征,从而实现高精度的故障诊断。试验结果表明,该模型在不同工况下的三个数据集上均实现了99.40%以上的测试准确率,即使在噪声干扰下依旧保持了良好的诊断性能,与现有的诊断模型相比,具有更强的泛化性和鲁棒性。 展开更多
关键词 航空活塞发动机 进排气故障 卷积神经网络(CNN) transformER 交叉注意力
在线阅读 下载PDF
引入Transformer的RGBT自适应融合视觉跟踪
20
作者 郭勇 谌海云 +1 位作者 陈建宇 肖章勇 《红外技术》 北大核心 2025年第8期998-1008,共11页
RGBT目标跟踪利用可见光和热红外两种模态信息的互补性改善了在云雾遮挡、光照变化等场景下的跟踪性能,但由于可见光和热红外图像特征差异较大,导致大多数跟踪算法特征信息提取不充分、特征融合的冗余信息太多。针对以上问题,提出一种引... RGBT目标跟踪利用可见光和热红外两种模态信息的互补性改善了在云雾遮挡、光照变化等场景下的跟踪性能,但由于可见光和热红外图像特征差异较大,导致大多数跟踪算法特征信息提取不充分、特征融合的冗余信息太多。针对以上问题,提出一种引入Transformer的RGBT自适应融合目标跟踪算法SiamTAF。首先,在特征提取阶段,使用Transformer分别对可见光和热红外分支的AlexNet网络后两层进行改进,使其具有建立特征上下文依赖性的能力。其次,结合交叉注意力和挑选机制提出一种自适应融合模块,以促进两模态特征的互补性融合。最后,为了让线性互相关运算具有捕捉非线性相似特征的能力,在线性互相关运算中加入非线性门控注意力。在GTOT和RGBT234基准数据集上的实验结果表明,相比MANet、DAFNet、DAPNet等算法,SiamTAF算法在面对热交叉、光照变化等问题时,其跟踪性能更具鲁棒性。 展开更多
关键词 RGBT transformER 自适应融合 互相关运算 门控注意力
在线阅读 下载PDF
上一页 1 2 73 下一页 到第
使用帮助 返回顶部