期刊文献+
共找到1,277篇文章
< 1 2 64 >
每页显示 20 50 100
USING CROSS-CORRELATION THEORY TO EXTRACT MODAL PARAMETERS IN FREQUENCY- DOMAIN 被引量:1
1
作者 ShenFan ZhengMin 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2003年第1期83-86,共4页
Conventional modal parameter identifications are usually based on frequencyresponse functions, which require measurements of both the input force and the resulting response.However, in many cases, only response data a... Conventional modal parameter identifications are usually based on frequencyresponse functions, which require measurements of both the input force and the resulting response.However, in many cases, only response data are available while the actual excitations (such aswind/wave load) are not measurable. Modal parameters estimation must base itself on response-onlydata. Over the past years, many time-domain modal parameter identification techniques fromoutput-only are proposed. A poly-reference frequency-domain modal identification scheme onresponse-only is presented. It is based on coupling the cross-correlation theory with conventionalfrequency-domain modal parameter extraction. An experiment using an airplane model is performed toverify the proposed method. 展开更多
关键词 modal identification Vibration testing cross-correlation theory Operating conditions
在线阅读 下载PDF
Translational,vibrational,rotational enhancements and alignments of reactions H + ClF(v = 0-5,j= 0,3,6,9) →HCl + F and HF + Cl,at E_(rel)= 0.5-20 kcal/mol
2
作者 赵(吴)为克 《Chinese Physics B》 SCIE EI CAS CSCD 2013年第10期213-225,共13页
Quasi-classical trajectory calculations of the title reactions H + C1F (v = 0-5, j = 0, 3,6, 9) -+ HCl + F and H + C1F (v = 0-5, j =0, 3, 6, 9) → HF + C1 at Erel = 0.5 kcal/mol-20 kcal/mol on ground potentia... Quasi-classical trajectory calculations of the title reactions H + C1F (v = 0-5, j = 0, 3,6, 9) -+ HCl + F and H + C1F (v = 0-5, j =0, 3, 6, 9) → HF + C1 at Erel = 0.5 kcal/mol-20 kcal/mol on ground potential energy surface DHTSN of 1 2AI [M. E Deskevich, M. Y. Hayes, K. Takahashi, R. T. Skodje and D. J. Nesbitt, J. Chem. Phys. 124, 224303 (2006)] are performed. Potential energy surfaces derived from DHTSN for the title reactions are obtained, and compared with that of DHTSN for the reaction F + HC1 -+ HF + C1. Both potential energy surfaces have an early barrier pattern. Integral cross sections and alignments of product molecules HC1 and HF dependent on the internal energy states v and j of reactant molecule C1F are obtained and compared. Translational, vibrational, and rotational energy specific translational enhancements of the reactant molecule CIF of the title reactions are found. Reaction mechanisms of the title reactions according to the respective potential energy contours are further found and explained. Reasons of simultaneous translational and vibrational enhancements are clarified. 展开更多
关键词 quasi-classical trajectory calculation integral cross section alignment TRV enhancement
原文传递
Study on tapered crossed subwavelength gratings by Fourier modal method
3
作者 陈熙 钟源 +2 位作者 王青 张冶金 陈良惠 《Chinese Physics B》 SCIE EI CAS CSCD 2010年第10期258-264,共7页
Fourier modal method incorporating staircase approximation is used to study tapered crossed subwavelength gratings in this paper. Three intuitive formulations of eigenvalue functions originating from the prototype are... Fourier modal method incorporating staircase approximation is used to study tapered crossed subwavelength gratings in this paper. Three intuitive formulations of eigenvalue functions originating from the prototype are presented, and their convergences are compared through numerical calculation. One of them is found to be suitable in modeling the diffraction efficiency of the circular tapered crossed subwavelength gratings without high absorption, and staircase approximation is further proven valid for non-highly-absorptive tapered gratings. This approach is used to simulate the "moth-eye" antireflection surface on silicon, and the numerical result agrees well with the experimental one. 展开更多
关键词 tapered crossed subwavelength gratings Fourier modal method staircase approximation eigenvalue functions
原文传递
Dorsal and ventral streams across sensory modalities 被引量:1
4
作者 Anna Sedda Federica Scarpina 《Neuroscience Bulletin》 SCIE CAS CSCD 2012年第3期291-300,共10页
In this review, we describe the current models of dorsal and ventral streams in vision, audition and touch. Available theories take their first steps from the model of Milner and Goodale, which was developed to explai... In this review, we describe the current models of dorsal and ventral streams in vision, audition and touch. Available theories take their first steps from the model of Milner and Goodale, which was developed to explain how human actions can be efficiently carried out using visual information. Since then, similar concepts have also been applied to other sensory modalities. We propose that advances in the knowledge of brain functioning can be achieved through models explaining action and perception patterns independently from sensory modalities. 展开更多
关键词 sensorimotor integration action control perception dorsal stream ventral stream cross-modal
原文传递
基于层内融合和跨层增强两阶段融合的RGB-P图像语义分割 被引量:1
5
作者 蔡轶珩 何秉芳 +1 位作者 何楷祺 何彦良 《计算机工程与应用》 北大核心 2026年第2期266-276,共11页
偏振信息能有效揭示各类物体材料差异,与可见光图像融合,可显著增强网络语义分割能力。然而,现有的大多数可见光-偏振(RGB-P)图像语义分割方法忽视了偏振图关键细节信息的保留且采用通用的交互融合方式,这导致复杂场景下分割结果容易出... 偏振信息能有效揭示各类物体材料差异,与可见光图像融合,可显著增强网络语义分割能力。然而,现有的大多数可见光-偏振(RGB-P)图像语义分割方法忽视了偏振图关键细节信息的保留且采用通用的交互融合方式,这导致复杂场景下分割结果容易出现边缘模糊和语义混淆。针对这些问题,提出了一种基于层内融合和跨层增强的递进式两阶段融合网络(IFCE-Net)。在第一阶段,设计跨模态多尺度交互机制,其结合多尺度化操作使RGB和偏振图像每级特征实现空间和通道信息的交互,加之混合通道嵌入操作,该阶段实现了多模态层内特征互补性探索和精细融合。在第二阶段,通过设计具有自适应权重的跨层增强策略,以逐级联合强化各层特征,从而显著提高网络对物体边缘等关键细节信息的保留能力。在公开ZJU-RGB-P和MCubeS数据集上进行实验,结果表明,该网络在定性和定量评估中均优于当前先进的RGB-P图像分割方法。 展开更多
关键词 RGB-P图像语义分割 跨模态多尺度交互机制 逐级联合增强
在线阅读 下载PDF
基于自适应超模态学习的音视频情绪识别方法
6
作者 胡峻峰 刘倩 《计算机工程与设计》 北大核心 2026年第2期486-494,共9页
针对多模态情感识别中存在的特征冗余、噪声干扰及模态权重固化问题,提出一种基于自适应超模态学习的音视频情感识别方法。通过EfficientFace网络与一维卷积分别提取视频面部特征和音频特征,采用自适应超模态学习方法评估模态信息质量,... 针对多模态情感识别中存在的特征冗余、噪声干扰及模态权重固化问题,提出一种基于自适应超模态学习的音视频情感识别方法。通过EfficientFace网络与一维卷积分别提取视频面部特征和音频特征,采用自适应超模态学习方法评估模态信息质量,建立跨模态特征交互通道以抑制噪声特征。设计双重特征融合架构,结合残差连接保持原始特征完整性,通过一维卷积层实现跨模态特征自适应拼接。在公开数据集CH-SIMS和RAVDESS上的实验结果表明,所提方法情感识别准确率优于基准模型,F1值同步提升。消融实验验证了自适应超模态学习模块对噪声抑制的有效性。 展开更多
关键词 深度学习 情感分析 跨模态融合 注意力机制 特征提取 情绪分类 多模态
在线阅读 下载PDF
频域空间信息驱动的特征聚合跨模态行人重识别方法
7
作者 金静 朱传斌 翟凤文 《计算机应用研究》 北大核心 2026年第1期298-304,共7页
跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信... 跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信息且忽略了不同尺度特征语义关联性,提出一种基于频域空间信息的特征聚合(FDSIFA)网络。首先,通过设计的多分支频域空间感知模块(MFSPM),对不同模态的增强图像和原始图像充分提取模态特定信息,同时在频域和空间维度上挖掘跨模态特征的一致性,有效减小了模态间的差异;其次,设计了多阶段特征聚合模块(MFAM),自适应聚合不同尺度的特征,挖掘低层次特征与高层次特征之间的语义关联,提升特征的语义表达能力和判别力。该网络在SYSU-MM01数据集的全搜索模式下,rank-1和mAP分别达到了75.09%和71.35%,优于对比方法,实验结果验证了所提方法的有效性。 展开更多
关键词 跨模态 行人重识别 数据增强 频域空间信息 特征聚合
在线阅读 下载PDF
低空立体交通跨模式协同与智能调度研究综述
8
作者 段海滨 梅宇 范彦铭 《自动化学报》 北大核心 2026年第2期194-209,共16页
随着低空立体交通系统进程的加速推进,空中、地面与水面三维异构交通平台的协同愈加关键.智能调度与资源优化的深度融合,正逐步成为智慧城市建设与应急响应体系中不可或缺的核心支撑力量.本文围绕多模式协同调度的研究热点展开综述.首先... 随着低空立体交通系统进程的加速推进,空中、地面与水面三维异构交通平台的协同愈加关键.智能调度与资源优化的深度融合,正逐步成为智慧城市建设与应急响应体系中不可或缺的核心支撑力量.本文围绕多模式协同调度的研究热点展开综述.首先,综合回顾无人机、无人车与无人艇在多源信息融合、环境感知与自适应决策方面的协同机制.其次,从任务分解、路径规划、协同控制与系统调度四个层面,总结强化学习、图优化、进化算法等在复杂动态环境下的典型调度方法.进一步地,梳理集中式、分布式与混合式控制架构下的任务分配与通信策略,并分析传感器数据、仿真数据与运行大数据在调度优化中的作用.最后,探讨当前低空立体交通系统在资源分配、安全保障与跨域协同中的关键挑战,并展望基于大数据驱动与智能增强的低空立体交通系统未来发展路径. 展开更多
关键词 低空立体交通 跨模式协同 智能调度 协同控制 异构分布
在线阅读 下载PDF
结合自适应特征加权与权值优化策略的多模态情感分析
9
作者 冯广 周垣桦 +5 位作者 钟婷 杨燕茹 黄荣灿 盘皓然 林健忠 周科栋 《计算机工程与应用》 北大核心 2026年第6期194-204,共11页
多模态情感分析在智慧教育领域中发挥着关键作用,通过对课堂中产生的音视频流媒体数据进行实时分析,可以更精准地挖掘学生的情感状态。当前多模态情感分析中的编码方法普遍忽视了不同模态之间信息密度的差异以及模态特有信息之间的不兼... 多模态情感分析在智慧教育领域中发挥着关键作用,通过对课堂中产生的音视频流媒体数据进行实时分析,可以更精准地挖掘学生的情感状态。当前多模态情感分析中的编码方法普遍忽视了不同模态之间信息密度的差异以及模态特有信息之间的不兼容性,这在融合过程中可能引入噪声或导致信息冗余。为解决这一问题,提出了一种结合自适应特征加权与权值优化策略的多模态情感分析模型。在特征优化层,作为低级特征的音频与视频通过交叉注意力进行交互,从而提高信息密度,并通过自适应加权与权值优化策略对交互结果进行动态校正。在特征融合层,利用交叉注意力模块实现文本特征与音视频特征的有效融合,通过由特征加权过滤与权值优化约束实现的互补策略增强特征表征能力。在公开数据集MOSI和MOSEI上的实验结果表明,提出的模型在特征加权调优下显著提升了情感预测性能,在大多数评价指标上实现了较先进或具竞争力的表现。 展开更多
关键词 多模态情感分析 跨模态融合 交叉注意力 权值优化
在线阅读 下载PDF
跨模态特征增强与层次化MLP通信的多模态情感分析
10
作者 王旭阳 马瑾 《广西师范大学学报(自然科学版)》 北大核心 2026年第1期91-101,共11页
在多模态情感分析任务中,由于非语言模态信息利用不充分、跨模态交互缺乏细粒度关联建模以及层次化语义融合机制不完善,导致不同模态之间的情感信息难以实现有效融合。为此,本文提出一种跨模态特征增强与层次化MLP通信的多模态情感分析... 在多模态情感分析任务中,由于非语言模态信息利用不充分、跨模态交互缺乏细粒度关联建模以及层次化语义融合机制不完善,导致不同模态之间的情感信息难以实现有效融合。为此,本文提出一种跨模态特征增强与层次化MLP通信的多模态情感分析方法。该方法构建渐进式融合架构,首先通过跨模态注意力机制增强非语言模态信息,捕捉多对多的跨模态细粒度交互;继而使用层次化MLP通信模块,在模态融合维度与时间建模维度上分别设计并行与堆叠的MLP模块,实现水平与垂直方向的层次化特征交互,有效提升情感理解的准确性与表达能力。实验结果表明,本文模型在CMU-MOSI上,Acc2和F_(1)值较次优模型分别提升0.89和0.77个百分点,在CMU-MOSEI上对比实验各项指标均优于基准模型,Acc2、F_(1)值分别达到86.34%、86.25%。 展开更多
关键词 多模态 情感分析 跨模态注意力 层次化MLP通信 门控单元
在线阅读 下载PDF
基于跨模态多头注意力的交通量音视融合检测方法
11
作者 马庆禄 吴斐斐 +2 位作者 吴跃川 张丽 张埂 《重庆交通大学学报(自然科学版)》 北大核心 2026年第1期95-105,共11页
针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征... 针对传统视觉或音频信号在交通量检测中均无法充分捕捉时域和频域细节信息的问题,提出了基于跨模态多头注意力的交通量音视融合检测方法。该方法通过构建一种跨音视频模态的交通量检测模型,获取高质量的交通视觉模态表征和声音模态表征并进行高效融合。首先,采用Res2Net网络与DCNv3网络对音视频数据进行特征提取,通过双向长短期记忆网络对时间序列特征处理,分别分析了音视频中复杂行为序列,获取丰富性和连贯性的交通信息描述;其次,在跨模态融合中将交叉注意力与多头注意力结合,利用多个子空间进行合并输出,进行多头注意力跨模态融合;最后,将交叉熵损失和一致性损失联合应用,加强对不同模态信息的协调解析,确保多模态数据在分类和识别任务中的一致性表现。实验结果表明在交通量检测场景下笔者方法分别比单一音频、视频与AVSS(audio-visual speech separation,AVSS)中的融合方法的平均车辆检测准确率提高了2.57%、1.70%、0.95%,车辆平均分类准确率分别提高了4.72%、1.78%、1.62%,总体交通量平均检测准确率分别提高了4.41%、2.96%、1.46%,且在4种不同场景下表现稳定。 展开更多
关键词 交通工程 交通量检测 音视融合 跨模态 注意力机制
在线阅读 下载PDF
基于多码深度特征融合生成对抗网络的文本生成图像方法
12
作者 顾广华 孙文星 伊柏宇 《电子与信息学报》 北大核心 2026年第1期287-296,共10页
文本生成图像是一项极具挑战的跨模态任务,其核心在于生成与文本描述高度一致、细节丰富的高质量图像。当前基于生成对抗网络的方法多依赖单一噪声输入,导致生成图像细粒度不足;同时,单词级特征利用不充分,也制约了文本与图像之间的语... 文本生成图像是一项极具挑战的跨模态任务,其核心在于生成与文本描述高度一致、细节丰富的高质量图像。当前基于生成对抗网络的方法多依赖单一噪声输入,导致生成图像细粒度不足;同时,单词级特征利用不充分,也制约了文本与图像之间的语义对齐精度。为此,该文提出一种多码深度特征融合生成对抗网络(mDFAGAN)。该方法通过设计多噪声输入生成器与多码先验融合模块,提升生成图像的细节表现力;在生成器中引入多头注意力机制,从多角度对齐单词与图像子区域,增强语义一致性;此外,提出多码先验融合损失以稳定训练过程。在CUB和COCO数据集上的实验结果表明,所提方法在IS与FID评价指标上均优于当前主流生成对抗网络方法,能够生成更逼真、细节更丰富、语义一致性更强的图像。 展开更多
关键词 文本生成图像 生成对抗网络 跨模态 多码先验融合
在线阅读 下载PDF
图文跨模态检索双重过滤与动态补全的注意力区域优化方法研究
13
作者 孟凡奇 田凯迪 田研 《现代信息科技》 2026年第1期41-46,共6页
当前图文跨模态检索存在两个主要瓶颈:传统注意力机制往往包含大量冗余区域,引入无关语义噪声;过度筛选又会导致有效区域不足,造成关键视觉信息丢失。这两种情况均会显著降低模型的匹配精度与鲁棒性。针对该问题,提出一种双重优化策略:... 当前图文跨模态检索存在两个主要瓶颈:传统注意力机制往往包含大量冗余区域,引入无关语义噪声;过度筛选又会导致有效区域不足,造成关键视觉信息丢失。这两种情况均会显著降低模型的匹配精度与鲁棒性。针对该问题,提出一种双重优化策略:首先通过双重过滤机制自适应保留高响应区域,有效抑制冗余噪声;同时创新性引入Top-K动态补全方法,在检测到特征不足时自动补充关键语义区域。实验验证表明,该方法在保持特征选择精度的同时,有效避免关键信息丢失,显著提升了模型在复杂场景下的跨模态匹配性能。 展开更多
关键词 跨模态检索 图文检索 特征对齐 阈值过滤 注意力优化
在线阅读 下载PDF
基于模态互相关分析的燃气管道非开挖泄漏检测定位及应用
14
作者 申伟 於加雪 +4 位作者 曹志祥 王琳 王志成 郝永梅 马敏洁 《管道技术与设备》 2026年第1期26-31,48,共7页
为解决城市燃气埋地管道因开挖检测受限、小泄漏难以及时发现以及城市燃气管道小泄漏定位精度不高的问题,基于模态分析和小波消噪原理,运用声发射技术,提出基于模态互相关分析的燃气管道泄漏定位方法。通过实验室模拟燃气管道非开挖泄... 为解决城市燃气埋地管道因开挖检测受限、小泄漏难以及时发现以及城市燃气管道小泄漏定位精度不高的问题,基于模态分析和小波消噪原理,运用声发射技术,提出基于模态互相关分析的燃气管道泄漏定位方法。通过实验室模拟燃气管道非开挖泄漏试验,采集0.2 MPa下3种不同泄漏量的声发射泄漏信号,建立管道模态互相关泄漏定位模型,对泄漏信号进行分析运算,计算得到更加精准的定位结果,并被应用于工程实践,对城市燃气管道非开挖泄漏检测进行了探索。 展开更多
关键词 燃气管道 泄漏检测 非开挖 模态导波 互相关分析 工程应用
在线阅读 下载PDF
基于决策融合的跨模态建模:网络舆情的多层次细粒度情感分析
15
作者 黄微 马庆懿 刘逸伦 《情报理论与实践》 北大核心 2026年第1期170-180,共11页
[目的/意义]突破突发自然灾害中多模态网络舆情细粒度情感分析的技术瓶颈,突破单一文本模态分析的语义局限,为管理部门应对舆情熵增现象提供兼顾风险感知捕捉与动态导控决策的理论工具集。[方法/过程]构建融合Ro‐BERTa与ViT的跨模态情... [目的/意义]突破突发自然灾害中多模态网络舆情细粒度情感分析的技术瓶颈,突破单一文本模态分析的语义局限,为管理部门应对舆情熵增现象提供兼顾风险感知捕捉与动态导控决策的理论工具集。[方法/过程]构建融合Ro‐BERTa与ViT的跨模态情感识别模型,并引入BERTopic主题分类实现“主题—情感”双粒度解析,基于实证数据的对比实验验证模型有效性。[结果/结论]提出的跨模态动态细粒度情感分析方法可显著提升舆情情感分析精度,同时揭示主题—情感耦合下的群体认知的分化规律。RoBERTa-ViT模型F1值达0.8043,较传统单模态模型提升15%~24%,成功识别灾情速报、制度反思等6大主题及其情感分布。[创新/局限]研究立足社交媒体场景下碎片化—异构化数据治理的迫切需求,突破传统以单模态静态分析为主的舆情研判路径,构建了RoBERTa-ViT多模态情感识别框架,并通过实证研究验证了主题维度对情感极化的牵引效应。 展开更多
关键词 RoBERTa-ViT 跨模态 自然灾害网络舆情 细粒度情感分析
原文传递
用音乐与语音揭示大脑奥秘——评戴安娜·多伊奇《音乐错觉与词语虚幻》
16
作者 李小诺 《星海音乐学院学报》 北大核心 2026年第1期154-161,共8页
文章从认知科学视角系统梳理了戴安娜·多伊奇著作《音乐错觉与词语虚幻》关于音乐错觉及其与语言感知关系的突破性研究成果:1.音乐听知觉重组:通过八度错觉、音阶错觉等实验揭示大脑对声音信息的自组织机制,提出并集中展现了听觉... 文章从认知科学视角系统梳理了戴安娜·多伊奇著作《音乐错觉与词语虚幻》关于音乐错觉及其与语言感知关系的突破性研究成果:1.音乐听知觉重组:通过八度错觉、音阶错觉等实验揭示大脑对声音信息的自组织机制,提出并集中展现了听觉系统遵循接近律、相似律等格式塔原则的感知现象;2.三全音感知双重性:通过跨地域实验证明语音环境(尤其是童年方言音高特征)会永久影响音乐音高感知;3.语音到歌声错觉转换特征:实验证实语音与音乐存在于同一感知连续体,并发现唱歌比说话激活更广泛的脑区网络;4.虚幻词产生机制:模糊声音刺激会因个人经验形成差异化感知,证明听觉信号会被记忆、情绪等主观因素重构。文章同时强调了多伊奇将实验心理学与传统音乐学、神经科学相结合的跨学科研究方法,及该研究对理解人类认知本质的深刻启示。 展开更多
关键词 音乐错觉 音乐感知 认知神经科学 听知觉重组 三全音感知 跨模态研究
在线阅读 下载PDF
轮式爬杆机器人结构设计与分析
17
作者 庞然 解南枫 李荣 《煤矿机械》 2026年第1期132-137,共6页
针对油气管道、桥梁拉索等杆状设施人工高空检测风险高、效率低的问题,设计一种具备越障能力与直径适应性的轮式爬杆机器人。该机器人采用周向均匀布置的4组爬行机构,搭配可调弹性压紧机构,通过调整压紧臂转角(10°~30°)实现φ... 针对油气管道、桥梁拉索等杆状设施人工高空检测风险高、效率低的问题,设计一种具备越障能力与直径适应性的轮式爬杆机器人。该机器人采用周向均匀布置的4组爬行机构,搭配可调弹性压紧机构,通过调整压紧臂转角(10°~30°)实现φ60~200 mm杆径适配,驱动轮借助2个自由度完成杆体表面缺陷越障,同时提升负载能力(可搭载15 kg检测设备)与爬行稳定性。基于ABAQUS建立有限元模型,分别进行了静力学及模态分析,结果表明所设计结构强度满足需求;模态分析结果表明,其前6阶固有频率为0~0.759 Hz,与杆体1~3 Hz振动频率无交集,可有效避免共振。该机器人可替代人工完成杆状设施检测,显著提升作业效率与安全性,为能源、基建领域杆状设施维护提供技术支撑。 展开更多
关键词 爬杆机器人 越障能力 静力分析 模态分析
原文传递
基于多模态融合特征的并分支发动机寿命预测方法
18
作者 李亚男 郭梦阳 +3 位作者 邓国军 陈允峰 任建吉 原永亮 《计算机应用》 北大核心 2026年第1期305-313,共9页
针对发动机运行数据的多模态以及难以实现有效的发动机寿命预测问题,提出一种融合图像和发动机运行时间数据潜在关系的多模态融合特征并分支发动机寿命预测方法。首先,利用滑动窗口对发动机运行数据进行分割,以构造发动机运行数据的序... 针对发动机运行数据的多模态以及难以实现有效的发动机寿命预测问题,提出一种融合图像和发动机运行时间数据潜在关系的多模态融合特征并分支发动机寿命预测方法。首先,利用滑动窗口对发动机运行数据进行分割,以构造发动机运行数据的序列样本,并采用格拉姆角场(GAF)将构造的序列样本转化为图像;其次,用序列样本和图像分别通过双向长短期记忆(BiLSTM)网络和卷积神经网络(CNN)获取趋势和周期等传感器之间的潜在关系特征;最后,引入交叉注意力机制(CAM)实现2种模态特征的融合并实现发动机寿命的预测。在公开的C-MAPSS数据集上的实验结果表明,该预测方法的R-squared(R^(2))高于0.99,而均方根误差(RMSE)在1以内。可见,该方法能在保证预测精度的同时改善计算效率。 展开更多
关键词 寿命预测 多模态融合 格拉姆角场 卷积神经网络 交叉注意力机制
在线阅读 下载PDF
基于深度学习的野生动物图像识别方法与挑战 被引量:1
19
作者 李尧迪 田野 +3 位作者 张长春 谢将剑 赵海涛 张军国 《林业科学》 北大核心 2026年第1期207-222,共16页
随着野生动物保护和生态监测需求的不断增长,基于深度学习的图像识别方法在野生动物研究中的应用日益广泛。本研究首先介绍野生动物常用公开数据集,随后详细综述不同深度学习技术在野生动物图像识别中的应用,依据任务需求将识别方法划... 随着野生动物保护和生态监测需求的不断增长,基于深度学习的图像识别方法在野生动物研究中的应用日益广泛。本研究首先介绍野生动物常用公开数据集,随后详细综述不同深度学习技术在野生动物图像识别中的应用,依据任务需求将识别方法划分为图像级、对象级和像素级3个层级,并重点讨论各层级方法的具体实现及其技术细节。在此基础上,深入探讨野生动物图像识别所面临的核心挑战,涵盖数据层面的诸多问题,如数据质量参差不齐、标注代价高昂且效率低下、样本分布不均衡;同时还从模型与算法角度剖析若干关键技术难题,包括细粒度检测、跨域分布偏移、类增量学习、零样本学习和跨模态学习等。针对上述挑战,总结当前的研究进展与应对策略,并提出未来可能的发展方向,旨在为构建高效、鲁棒且适用于实际监测场景的野生动物智能识别系统提供理论支持和方法参考。 展开更多
关键词 野生动物图像识别 深度学习 数据不平衡 迁移学习 零样本学习 跨模态学习
在线阅读 下载PDF
基于在线知识蒸馏与伪特征模拟的跨模态融合遥感图像建筑提取方法
20
作者 黄子恒 芮杰 +2 位作者 金飞 王淑香 林雨准 《地球信息科学学报》 北大核心 2026年第2期451-469,共19页
【目的】针对光学与SAR影像在实际应用中因数据缺失导致融合模型性能下降的问题,本研究旨在实现一种仅需单一模态输入即可获得接近双模态融合模型性能的轻量化建筑提取方法。【方法】提出了一种基于在线知识蒸馏的跨模态融合框架,其核... 【目的】针对光学与SAR影像在实际应用中因数据缺失导致融合模型性能下降的问题,本研究旨在实现一种仅需单一模态输入即可获得接近双模态融合模型性能的轻量化建筑提取方法。【方法】提出了一种基于在线知识蒸馏的跨模态融合框架,其核心包含一个双模态输入的教师网络和一个单模态输入的学生网络。框架的主要特点在于:在教师网络中设计了自适应门控注意力机制(AGAFM)以实现光学与SAR特征的有效互补;在学生网络中引入了伪特征生成模块(LDAF/ESAR)以模拟缺失模态的信息;并构建了特征层与输出层的多层次知识蒸馏损失,以迫使学生网络学习教师网络的融合表征能力。针对建筑几何特性,在网络中引入了可变形卷积(DCM)和边界感知增强模块(MAC-BEM)。【结果】在DDHRNet_DATA数据集的山东省和韩国浦项市子数据集上的实验表明:在SAR模态缺失时,学生网络的IoU分别达到83.68%和77.24%,相较于次优算法分别提升了3.06%和2.66%;在光学模态缺失时,学生网络的IoU分别达到77.78%和77.20%,相较于次优算法分别提升了4.01%和1.31%,性能显著优于SegNet、Deeplabv3、Deeplabv3+、UNetFormer、MFFDeeplabV3+、SC_Deep等单模态对比模型,消融实验验证了各核心模块的有效性。【结论】本文方法有效解决了测试阶段模态缺失的实用化瓶颈,为多模态遥感建筑提取技术的实际部署提供了可靠、高效的解决方案。 展开更多
关键词 知识蒸馏 跨模态融合 缺失模态 建筑提取 语义分割 注意力机制 特征模拟 可变形卷积
原文传递
上一页 1 2 64 下一页 到第
使用帮助 返回顶部