期刊文献+
共找到190篇文章
< 1 2 10 >
每页显示 20 50 100
Decoding algorithm with multiple features based on optical camera communication system 被引量:1
1
作者 ZHANG Junming SHI Wenxiao +2 位作者 WANG Qiang LIU Anqi LIU Wei 《Optoelectronics Letters》 EI 2023年第2期65-71,共7页
The performance of decoding algorithm is one of the important influential factors to determine the communication quality of optical camera communication(OCC) system. In this paper, we first propose a decoding algorith... The performance of decoding algorithm is one of the important influential factors to determine the communication quality of optical camera communication(OCC) system. In this paper, we first propose a decoding algorithm with adaptive thresholding based on the captured pixel values under an ideal environment, and then we further propose a decoding algorithm with multiple features, which is more suitable under the existence of the interference of light sources. The algorithm firstly determines the light-emitting diode(LED) array profile information by removing the interfering light sources through geometric features, and then identifies the LED state by calculating two grayscale features, the average gray ratio(AGR) and the gradient radial inwardness(GRI) of the LEDs, and finally obtains the LED state matrix. The experimental results show that the bit error ratio(BER) of the decoding algorithm with multiple features decreases from 1×10^(-2) to 5×10^(-4) at 80 m. 展开更多
关键词 decoding algorithm multiple features camera communication system
原文传递
基于时空特征融合的Encoder-Decoder多步4D短期航迹预测 被引量:2
2
作者 石庆研 张泽中 韩萍 《信号处理》 CSCD 北大核心 2023年第11期2037-2048,共12页
航迹预测在确保空中交通安全、高效运行中扮演着至关重要的角色。所预测的航迹信息是航迹优化、冲突告警等决策工具的输入,而预测准确性取决于模型对航迹序列特征的提取能力。航迹序列数据是具有丰富时空特征的多维时间序列,其中每个变... 航迹预测在确保空中交通安全、高效运行中扮演着至关重要的角色。所预测的航迹信息是航迹优化、冲突告警等决策工具的输入,而预测准确性取决于模型对航迹序列特征的提取能力。航迹序列数据是具有丰富时空特征的多维时间序列,其中每个变量都呈现出长短期的时间变化模式,并且这些变量之间还存在着相互依赖的空间信息。为了充分提取这种时空特征,本文提出了基于融合时空特征的编码器-解码器(Spatio-Temporal EncoderDecoder,STED)航迹预测模型。在Encoder中使用门控循环单元(Gated Recurrent Unit,GRU)、卷积神经网络(Convolutional Neural Network,CNN)和注意力机制(Attention,AT)构成的双通道网络来分别提取航迹时空特征,Decoder对时空特征进行拼接融合,并利用GRU对融合特征进行学习和递归输出,实现对未来多步航迹信息的预测。利用真实的航迹数据对算法性能进行验证,实验结果表明,所提STED网络模型能够在未来10 min预测范围内进行高精度的短期航迹预测,相比于LSTM、CNN-LSTM和AT-LSTM等数据驱动航迹预测模型具有更高的精度。此外,STED网络模型预测一个航迹点平均耗时为0.002 s,具有良好的实时性。 展开更多
关键词 4D航迹预测 时空特征 Encoder-decoder 门控循环单元
在线阅读 下载PDF
LSTM Encoder-Decoder方法预测设备剩余使用寿命 被引量:8
3
作者 赵志宏 李晴 +1 位作者 李乐豪 赵敬娇 《交通运输工程学报》 EI CSCD 北大核心 2021年第6期269-277,共9页
应用LSTM Encoder-Decoder提出了机械设备剩余使用寿命预测方法;对获取的传感器数据进行预处理,利用LSTM Encoder对数据序列进行编码,得到设备状态信息的中间表示,其中蕴含了设备状态的特征信息,利用LSTM Decoder对中间表示信息进行解码... 应用LSTM Encoder-Decoder提出了机械设备剩余使用寿命预测方法;对获取的传感器数据进行预处理,利用LSTM Encoder对数据序列进行编码,得到设备状态信息的中间表示,其中蕴含了设备状态的特征信息,利用LSTM Decoder对中间表示信息进行解码,利用解码后的信息预测剩余使用寿命;研究了LSTM Encoder-Decoder方法在公开的C-MAPSS数据集上的剩余使用寿命预测试验,与LSTM、D-LSTM等方法进行了对比试验;研究了不同滑动窗口大小对于剩余寿命预测结果的影响。研究结果表明:LSTM Encoder-Decoder方法的剩余使用寿命预测结果的评分函数值和均方根误差均优于LSTM、D-LSTM方法;在FD001子集上,LSTM Encoder-Decoder方法、LSTM方法和D-LSTM方法对应的均方根误差分别为11、12、16;当滑动窗口大小为30时,LSTM Encoder-Decoder方法在FD001~FD004子集对应的评分函数值分别为164、3 012、372、4 800,对应的均方根误差分别为11、20、14、22;当滑动窗口大小为40时,LSTM Encoder-Decoder方法在FD001~FD004子集对应的评分函数值分别为305、1 220、408、4 828,对应的均方根误差分别为14、16、15、19。可见,提出的LSTM Encoder-Decoder方法是一种有效的预测机械设备剩余使用寿命方法,并且滑动窗口大小对于剩余使用寿命预测结果存在一定的影响。 展开更多
关键词 剩余使用寿命预测 编码器-解码器 LSTM 深度学习 特征提取
原文传递
Coding of Topological Entities in Feature-Based Parametric Modeling System 被引量:1
4
作者 Wu Tao Bai Yuewei Chen Zhuoning Bin Hongzan School of Mechanical Engineering, Huazhong University of Science and Technology, Wuhan 430074, China 《Computer Aided Drafting,Design and Manufacturing》 2001年第1期19-25,共7页
How to identify topological entities during rebuilding features is a critical problem in Feature-Based Parametric Modeling System (FBPMS). In the article, authors proposes a new coding approach to distinguish differen... How to identify topological entities during rebuilding features is a critical problem in Feature-Based Parametric Modeling System (FBPMS). In the article, authors proposes a new coding approach to distinguish different entities. The coding mechanism is expatiated,and some typical examples are presented. At last, the algorithm of decoding is put forward based on set theory. 展开更多
关键词 feature-based modeling entity coding decodING
全文增补中
基于自注意力机制的高分遥感影像语义分割 被引量:2
5
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
基于3D注意力和金字塔解码器的目标跟踪算法
6
作者 符强 殷奇晨 +1 位作者 纪元法 任风华 《电光与控制》 北大核心 2025年第8期18-24,共7页
针对复杂场景下目标的快速移动、遮挡、非刚性形变和光照变化等问题,提出了一种基于3D注意力和金字塔解码器的目标跟踪算法。首先引入VGG-16神经网络并对其进行结构上的优化,以提高特征提取的效率和质量。其次通过引入3D注意力,增强了... 针对复杂场景下目标的快速移动、遮挡、非刚性形变和光照变化等问题,提出了一种基于3D注意力和金字塔解码器的目标跟踪算法。首先引入VGG-16神经网络并对其进行结构上的优化,以提高特征提取的效率和质量。其次通过引入3D注意力,增强了对关键特征的提取能力。然后使用深层语义融合模块,通过上采样融合特征信息,以达到对特征的精确表达。最后设计金字塔解码器提升模型在复杂场景下的鲁棒性。实验结果表明,在OTB100数据集上,相比基准算法,所提算法的成功率和跟踪精度分别提升了15.8%和16.2%。 展开更多
关键词 目标跟踪 孪生网络 注意力 特征融合 解码器
在线阅读 下载PDF
基于多尺度和多头注意力的图像去雨算法
7
作者 陈海秀 何珊珊 +2 位作者 陆康 房威志 黄仔洁 《信息技术》 2025年第3期28-34,41,共8页
针对现有图像去雨方法存在雨纹去除不干净、图像中细节信息丢失等问题,文中提出一种基于多尺度和多头注意力的图像去雨算法。通过在网络架构中引入跨尺度特征融合模块并运用门控循环单元来连接不同尺度的雨纹特征,提升网络捕获和融合多... 针对现有图像去雨方法存在雨纹去除不干净、图像中细节信息丢失等问题,文中提出一种基于多尺度和多头注意力的图像去雨算法。通过在网络架构中引入跨尺度特征融合模块并运用门控循环单元来连接不同尺度的雨纹特征,提升网络捕获和融合多尺度雨纹特征的能力;并运用多头注意力模块作为编码器-解码器之间的桥梁,获取雨纹更多的全局信息并打破卷积神经网络感受视野的局限性。在合成和真实的有雨图像数据集上与其他算法进行比照,实验结果表明,所提方法在图像雨纹去除和细节信息保留方面均优于比较算法。 展开更多
关键词 图像去雨 多尺度 特征融合 编码器-解码器 多头注意力
在线阅读 下载PDF
基于双Transformer结构的多模态视频段落描述生成研究
8
作者 赵宏 张立军 《计算机工程与应用》 北大核心 2025年第21期182-191,共10页
针对现有视频段落描述方法对视频中主要事件的关注度不足与多事件描述之间缺乏连贯性的问题,在现有编码器-解码器框架的基础上,提出了一种基于双Transformer结构的多模态视频段落描述模型。采用Faster-RCNN对视频中心帧目标进行细粒度... 针对现有视频段落描述方法对视频中主要事件的关注度不足与多事件描述之间缺乏连贯性的问题,在现有编码器-解码器框架的基础上,提出了一种基于双Transformer结构的多模态视频段落描述模型。采用Faster-RCNN对视频中心帧目标进行细粒度特征提取,由混合注意力结合全局视觉特征选择最具代表性的细粒度局部视觉特征,对视频中主要事件信息进行补充与增强,提高视频内容描述的准确性;提出在Transformer结构中增加存储模块与混合注意力模块,并设计了双Transformer结构,内部Transformer对事件内一致性进行建模,外部Transformer由混合注意力计算与当前事件最相关的状态建模事件间的一致性,结合内外部Transformer的输出对事件内容进行预测,提高生成描述语句的连贯性。在ActivityNet Captions数据集和YouCookII数据集上的实验结果表明,所提模型在BLEU-4、METEOR、ROUGE-L和CIDEr指标上相较于现有主流视频段落描述模型有明显提升,验证了模型的有效性。 展开更多
关键词 视频段落描述 编码器-解码器结构 细粒度局部视觉特征 双Transformer结构
在线阅读 下载PDF
一种基于时空频多维特征的短时窗口脑电听觉注意解码网络
9
作者 王春丽 李金絮 +2 位作者 高玉鑫 王晨名 张珈豪 《电子与信息学报》 北大核心 2025年第3期814-824,共11页
在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信... 在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信号的时域或频域单个特征或二者的组合(如时频特征),而忽略了时-空-频域特征之间的互补性,这在一定程度上限制了模型的分类能力,进而影响了模型在决策窗口上的解码精度。同时,已有AAD模型大多在长时决策窗口(1~5 s)中有较高的解码精度。该文提出一种基于时-空-频多维特征的短时窗口脑电信号听觉注意解码网络(TSF-AADNet),用于提高短时决策窗口(0.1~1 s)的解码精度。该模型由两个并行的时空、频空特征提取分支以及特征融合和分类模块组成,其中,时空特征提取分支由时空卷积块和高阶特征交互模块组成,频空特征提取分支采用基于频空注意力的3维卷积模块(FSA-3DCNN),最后将双分支网络提取的时空和频空特征进行融合,得到最终的听觉注意力二分类解码结果。实验结果表明,TSF-AADNet模型在听觉注意检测数据集KULeuven(KUL)和听觉注意检测的脑电和音频数据集(DTU)的0.1 s决策窗口下,解码精度分别为91.8%和81.1%,与最新的AAD模型一种基于时频融合的双分支并行网络(DBPNet)相比,分别提高了5.40%和7.99%。TSF-AADNet作为一种新的短时决策窗口的AAD模型,可为听力障碍诊断以及神经导向助听器研发提供有效参考。 展开更多
关键词 脑电信号 听觉注意力解码 短时决策窗口 时空频特征 神经导向助听器
在线阅读 下载PDF
基于时频双域特征融合与动态交互机制的短期电力负荷预测
10
作者 王东风 张浩 +2 位作者 胡怡然 崔玉雷 黄宇 《电力科学与工程》 2025年第12期57-64,共8页
针对电力负荷序列时序动态性、多尺度特征及复杂周期规律给预测带来的难题,提出一种基于时频双域特征融合与动态交互机制的短期电力负荷预测方法,其核心架构为双谱网。首先,针对短期电力负荷数据的非平稳和非线性特性,采用基于阿尔法进... 针对电力负荷序列时序动态性、多尺度特征及复杂周期规律给预测带来的难题,提出一种基于时频双域特征融合与动态交互机制的短期电力负荷预测方法,其核心架构为双谱网。首先,针对短期电力负荷数据的非平稳和非线性特性,采用基于阿尔法进化算法改进的变分模态分解算法对负荷数据分解,得到若干本征模态函数;其次,设计频域特征增强机制,通过频谱注意力动态融合振幅谱与相位谱,并构建时频交叉注意力网络嵌入频域先验,结合跨维度门控实现特征校准;最后,基于多尺度金字塔解码器自适应融合时空特征生成预测值。以某市电力负荷数据集进行验证并与主流模型进行对比,结果表明所采用的预测方法具有更好的预测性能。 展开更多
关键词 时频双域 动态交互 双谱网 频域特征增强 多尺度金字塔解码器
在线阅读 下载PDF
基于改进Segformer的光伏组件分割算法 被引量:1
11
作者 曹冠华 党建武 杨景玉 《太阳能学报》 北大核心 2025年第2期425-432,共8页
针对光伏图像中光伏组件与复杂背景的边界特征模糊、难以区分的问题,提出一种基于Segformer的改进算法。在编码阶段,引入全新设计的block5模块用来解析更高级的语义信息;在解码阶段,引入LPCB(边界强化)模型用来识别更精确的边界特征,最... 针对光伏图像中光伏组件与复杂背景的边界特征模糊、难以区分的问题,提出一种基于Segformer的改进算法。在编码阶段,引入全新设计的block5模块用来解析更高级的语义信息;在解码阶段,引入LPCB(边界强化)模型用来识别更精确的边界特征,最终得到精确的分割结果。实验结果表明:改进后的光伏组件分割算法在光伏组件图像数据集上的分割效果优于经典的主流分割算法,可以对光伏组件区域进行有效分割。 展开更多
关键词 光伏组件 Segformer 编码 解码 边界特征
原文传递
改进Transformer解码器的端到端语音识别 被引量:1
12
作者 胡恒博 牛铜 何振华 《计算机应用》 北大核心 2025年第S1期95-100,共6页
Transformer模型架构在序列到序列任务中可以很好地将注意力分散到整个输入上以学习长期依赖关系,然而,在语音识别中,文本输出和语音输入是单调对齐的。针对Transformer解码器无法较好地捕获局部特征以进行单调对齐的问题,提出一种改进... Transformer模型架构在序列到序列任务中可以很好地将注意力分散到整个输入上以学习长期依赖关系,然而,在语音识别中,文本输出和语音输入是单调对齐的。针对Transformer解码器无法较好地捕获局部特征以进行单调对齐的问题,提出一种改进的Transformer解码器。将Transformer解码器中的2种注意力机制拆分为2个单独模块,再使用交叉注意力进行更高效的局部特征捕获。在开源中文普通话AISHELL-1数据集上的实验结果表明,使用能够捕获局部特征的编码器时,该解码器相较于Transformer解码器有着更好的识别效果。具体地,当编码器为Conformer时,字错误率(CER)降低了16.19%,且收敛速度更快,而在使用了连接时序分类(CTC)进行辅助解码后,CER降低了5.08%,最终的CER为4.67%。 展开更多
关键词 交叉注意力 Transformer解码器 Conformer编码器 语音识别 局部特征
在线阅读 下载PDF
基于编解码网络的生猪骨架提取方法研究
13
作者 王泽华 徐爱俊 +2 位作者 周素茵 叶俊华 夏芳 《计算机应用与软件》 北大核心 2025年第4期181-188,共8页
针对生猪骨架提取难度大、精度低、耗时长等问题,提出一种基于编解码网络的生猪骨架提取方法。该文构建关键点热力图生成模型,将ResNet50残差网络和U-Net语义分割网络相结合,搭建编码-解码网络结构并引入注意力机制,以提高尾、蹄等小目... 针对生猪骨架提取难度大、精度低、耗时长等问题,提出一种基于编解码网络的生猪骨架提取方法。该文构建关键点热力图生成模型,将ResNet50残差网络和U-Net语义分割网络相结合,搭建编码-解码网络结构并引入注意力机制,以提高尾、蹄等小目标关键点的特征提取精度;在生成关键点热力图的同时预测关键点偏移量,弥补反算关键点原始位置时的精度损失,再利用霍夫投票机制对二者进行加权聚合,最终映射得到生猪骨架。实验结果表明,骨架提取准确率为85.27%。相较于ResNet50残差网络,在耗时相近的情况下,准确率提高了22.67个百分点。该研究为生猪骨架提取提供了一种新的方法,可为进一步开展生猪行为研究提供技术参考。 展开更多
关键词 骨架提取 关键点检测 生猪 注意力机制 特征提取 编解码网络
在线阅读 下载PDF
基于脑电信号的任务诱发疲劳监测的关键挑战与展望
14
作者 王韬 何峰 《中国生物医学工程学报》 北大核心 2025年第2期221-231,共11页
随着脑电信号采集技术的突破性进展,基于脑电的疲劳监测模型在交通运输、外科手术和高危作业等高风险领域已展现出巨大应用潜力,成为保障安全和提高效率的关键工具。这些模型通过实时监测个体脑电活动特征,能够客观评估疲劳状态并早期预... 随着脑电信号采集技术的突破性进展,基于脑电的疲劳监测模型在交通运输、外科手术和高危作业等高风险领域已展现出巨大应用潜力,成为保障安全和提高效率的关键工具。这些模型通过实时监测个体脑电活动特征,能够客观评估疲劳状态并早期预警,有效降低人为错误和事故风险。然而,将此类模型有效应用于实际场景仍存在4个核心挑战。其一,现有脑电采集设备的舒适性和便利性不足,制约了长期佩戴的可行性;其二,运动和肌电伪迹等干扰导致信号失真,严重影响脑电特征提取,导致解码精度下降;其三,脑电信号的个体间和个体内动态变异显著削弱了模型泛化的能力;其四,疲劳数据标注和收集的标准化问题依然突出,缺乏客观金标准,主观评估方法易引入数据偏差和不一致性。面对诸多挑战,综述了已有的研究进展,探讨了可能的创新方案,以期为创新的技术突破带来启发。展望未来,随着脑电信号采集技术、信号处理算法及机器学习模型的持续进步,新一代疲劳监测系统有望在穿戴舒适性、环境鲁棒性、检测精密性和个体适应性方面实现突破,为人机协同系统的安全高效运行提供理论支撑与技术保障。 展开更多
关键词 脑电 疲劳监测 特征鲁棒性 解码泛化
暂未订购
基于多视角注意力的异构双分支解码单通道语音增强
15
作者 更藏措毛 黄鹤鸣 《计算机应用》 北大核心 2025年第10期3284-3293,共10页
针对单通道语音增强中主流编解码结构面临的声学特征提取不充分、通道信息丢失和幅度相位补偿困难等问题,提出一种融合不同维度语音特征的异构双分支解码单通道语音增强模型——HDBMV(Heterogeneous DualBranch with Multi-View)。该模... 针对单通道语音增强中主流编解码结构面临的声学特征提取不充分、通道信息丢失和幅度相位补偿困难等问题,提出一种融合不同维度语音特征的异构双分支解码单通道语音增强模型——HDBMV(Heterogeneous DualBranch with Multi-View)。该模型通过信息融合编码器(IFE)、时频残差Conformer(TFRC)模块、多视角注意力(MVA)模块和异构双分支解码器(HDBD)等机制,提升单通道语音增强的性能。首先,IFE联合处理振幅与复数特征,捕捉全局依赖和局部相关,生成紧凑的特征表示;其次,TFRC模块有效捕捉时间维度和频域维度上的相关性,同时降低计算复杂度;再次,MVA模块重构通道域和时频域信息,进一步增强模型对信息的多视角多层次的表征能力;最后,HDBD分别处理幅度特征和细化复数特征,解决幅度相位补偿问题,提升解码鲁棒性。实验结果表明,HDBMV在公开数据集VoiceBank+DEMAND、大数据集DNS Challenge 2020和自建的藏语数据集BodSpeDB上的语音质量感知评估(PESQ)分别达到了3.00、3.12和2.09,短时目标可理解度(STOI)分别达到了0.96、0.97和0.81。可见,HDBMV以最小的参数量和较高的计算效率获得了最佳的语音增强性能和较强的泛化能力。 展开更多
关键词 语音增强 编解码器 CONFORMER 注意力机制 复数特征
在线阅读 下载PDF
基于DB-PATNet的棉布瑕疵小样本语义分割
16
作者 杨正达 李波 +2 位作者 苏莲花 姚为 田淙文 《计算机工程与设计》 北大核心 2025年第6期1803-1809,共7页
针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块... 针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块,增强模型对新类样本和新域样本的泛化能力。实验结果表明,DB-PATNet网络的mIoU在5-shot设置中相较于PATNet网络提升了2.67%,相比RePRI网络提升了8.84%。在跨域实验中,mIoU在1-shot设置中达到了57.61%,在5-shot设置中达到了64.43%,接近常规语义分割网络的性能。 展开更多
关键词 棉布瑕疵 小样本学习 语义分割 双分支解码器结构 双向指导策略 自注意力 特征转换
在线阅读 下载PDF
特征增强和渐进式解码的RGB-D显著性检测
17
作者 化春键 姚烨涛 +2 位作者 蒋毅 俞建峰 陈莹 《计算机科学与探索》 北大核心 2025年第9期2419-2429,共11页
针对现有的大多数RGB-D显著性检测方法在特征提取过程中难以有效提取多尺度特征以及在解码过程中模态特征信息交互不充分导致信息丢失的问题,提出了一种特征增强和渐进式解码的RGB-D显著性检测方法。针对多尺度特征提取困难,导致算法对... 针对现有的大多数RGB-D显著性检测方法在特征提取过程中难以有效提取多尺度特征以及在解码过程中模态特征信息交互不充分导致信息丢失的问题,提出了一种特征增强和渐进式解码的RGB-D显著性检测方法。针对多尺度特征提取困难,导致算法对多目标、小目标物体检测精度低的问题,构建了多尺度自注意力特征增强模块;为了充分发挥两种模态特征的优势,构建了跨模态特征融合模块,以增强不同模态分支之间的信息交互;为了解决解码过程中信息易丢失的问题,提出了渐进式加权融合解码器,充分整合细化不同模态的特征信息;对逐层解码的结果采用混合损失函数监督训练,实现初始显著图优化。在5个公开基准数据集上与10种先进主流方法进行的对比实验表明,该方法在5个指标上均有较优表现。实验结果表明,该方法在多种复杂情况下都能获得相对精确的显著图,达到了较为先进的性能。 展开更多
关键词 图像处理 显著性检测 深度学习 特征增强 渐进式解码
在线阅读 下载PDF
SACE-Net:结构感知的高分遥感影像建筑物与道路协同提取方法
18
作者 龚思诗 李圣文 +4 位作者 王渝 闵楠 赵宇翔 方芳 周顺平 《地球信息科学学报》 北大核心 2025年第12期2894-2909,共16页
【目的】作为城市空间结构的重要组成部分,建筑物与道路信息在城市规划、灾害响应和自动驾驶等前沿领域具有重要的应用价值。鉴于二者在空间分布上的高度关联性,协同提取建筑物和道路两类地物已成为高分辨率遥感影像解译的重要研究方向... 【目的】作为城市空间结构的重要组成部分,建筑物与道路信息在城市规划、灾害响应和自动驾驶等前沿领域具有重要的应用价值。鉴于二者在空间分布上的高度关联性,协同提取建筑物和道路两类地物已成为高分辨率遥感影像解译的重要研究方向。然而,现有方法尚未充分利用两类地物间的空间结构和各自的形态结构特性,存在地物边界不清晰及小尺寸对象漏检问题。【方法】为解决上述问题,本文提出了一种结构感知的协同提取网络SACE-Net,综合考虑地物的空间结构与形态结构,以提升建筑物和道路的协同提取性能。网络设计了特征空间交互模块,通过查询引导的跨注意力机制学习建筑物和道路的空间结构互补特征,增强两类地物间的特征交互与信息融合;同时,构建了形态结构感知的双分支解码模块,通过注意力引导机制与方向感知机制,实现对两类地物的形态结构的差异化解码。【结果】在Massachusetts与AIOI这2个公开数据集上的实验结果表明,SACE-Net在定量与可视化性能上均优于7种基线方法。定量结果显示,SACE-Net的平均交并比在Massachusetts和AIOI数据集上分别达到75.82%和64.14%,相较于现有最优协同提取方法分别提升了10.70%和4.90%;可视化结果进一步验证了模型在保持建筑物轮廓完整性和道路连通性方面具有显著优势,减少了边界模糊、漏检或误检等问题;消融实验结果显示,在基础网络中添加特征空间交互模块和双分支解码模块后,2个公开数据集的平均交并比相较于基础模型分别提升了18.96%和14.01%,验证了SACE-Net中各模块的有效性。【结论】本文通过强化模型对建筑物与道路空间及形态结构特征的感知,提升了地物协同提取精度,并为高分辨率遥感影像的多类地物协同提取提供了方法参考。 展开更多
关键词 结构感知 高分遥感影像 协同提取 注意力机制 深度学习 双分支解码 特征交互 语义分割
原文传递
基于特征解码的表情识别方法研究 被引量:1
19
作者 吴东升 林玉婷 徐鹏飞 《沈阳理工大学学报》 CAS 2025年第1期19-24,共6页
针对目前大多数面部表情提取未充分考虑语义特征以及个人独特面部特征导致面部表情识别准确性低的问题,提出一种基于特征解码的高效表情识别方法,称为FER-FD方法。该方法由两个模块组成,即特征解耦模块(FFD)和语义强化模块(VTS)。首先,... 针对目前大多数面部表情提取未充分考虑语义特征以及个人独特面部特征导致面部表情识别准确性低的问题,提出一种基于特征解码的高效表情识别方法,称为FER-FD方法。该方法由两个模块组成,即特征解耦模块(FFD)和语义强化模块(VTS)。首先,FFD模块使用两个深度二维卷积神经网络从输入图像中提取面部和表情特征,面部特征解耦器将面部特征与表情特征解耦,以最大限度地减少个人独特面部特征的影响;其次,VTS模块采用两个关键思想以无监督的方式自动捕获面部运动,从而建立全局面部区域的深层语义信息;最后,将两个模块的特征串联起来,以更准确地预测样本的面部表情。实验结果表明,本文提出的特征解码方法在CK+数据集上获得了98.78%的准确率,对不同场景具有可扩展性和适应性,具有较好的泛化能力。 展开更多
关键词 表情识别 特征解码 注意力机制 深度学习
在线阅读 下载PDF
GMFNet:全局多尺度和多级别的特征融合语义分割网络 被引量:1
20
作者 陈金令 赵成明 李洁 《计算机应用与软件》 北大核心 2025年第4期311-318,334,共9页
语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结... 语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结构不仅在空间上提取多尺度信息和通道上对图像信息充分利用,还增强编码器阶段的特征重用。设计特征融合注意力模块,在编码器中连接不同阶段的高低水平特征和新特征。实验表明,该算法在Cityscapes数据集上达到了77.92%mIoU。 展开更多
关键词 语义分割 卷积神经网络 全局上下文信息 特征融合 编码器-解码器
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部