期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
VTAN: A Novel Video Transformer Attention-Based Network for Dynamic Sign Language Recognition
1
作者 Ziyang Deng Weidong Min +2 位作者 Qing Han Mengxue Liu Longfei Li 《Computers, Materials & Continua》 2025年第2期2793-2812,共20页
Dynamic sign language recognition holds significant importance, particularly with the application of deep learning to address its complexity. However, existing methods face several challenges. Firstly, recognizing dyn... Dynamic sign language recognition holds significant importance, particularly with the application of deep learning to address its complexity. However, existing methods face several challenges. Firstly, recognizing dynamic sign language requires identifying keyframes that best represent the signs, and missing these keyframes reduces accuracy. Secondly, some methods do not focus enough on hand regions, which are small within the overall frame, leading to information loss. To address these challenges, we propose a novel Video Transformer Attention-based Network (VTAN) for dynamic sign language recognition. Our approach prioritizes informative frames and hand regions effectively. To tackle the first issue, we designed a keyframe extraction module enhanced by a convolutional autoencoder, which focuses on selecting information-rich frames and eliminating redundant ones from the video sequences. For the second issue, we developed a soft attention-based transformer module that emphasizes extracting features from hand regions, ensuring that the network pays more attention to hand information within sequences. This dual-focus approach improves effective dynamic sign language recognition by addressing the key challenges of identifying critical frames and emphasizing hand regions. Experimental results on two public benchmark datasets demonstrate the effectiveness of our network, outperforming most of the typical methods in sign language recognition tasks. 展开更多
关键词 dynamic sign language recognition TRANSFORMER soft attention attention-based visual feature aggregation
在线阅读 下载PDF
Feature-Based Aggregation and Deep Reinforcement Learning:A Survey and Some New Implementations 被引量:15
2
作者 Dimitri P.Bertsekas 《IEEE/CAA Journal of Automatica Sinica》 EI CSCD 2019年第1期1-31,共31页
In this paper we discuss policy iteration methods for approximate solution of a finite-state discounted Markov decision problem, with a focus on feature-based aggregation methods and their connection with deep reinfor... In this paper we discuss policy iteration methods for approximate solution of a finite-state discounted Markov decision problem, with a focus on feature-based aggregation methods and their connection with deep reinforcement learning schemes. We introduce features of the states of the original problem, and we formulate a smaller "aggregate" Markov decision problem, whose states relate to the features. We discuss properties and possible implementations of this type of aggregation, including a new approach to approximate policy iteration. In this approach the policy improvement operation combines feature-based aggregation with feature construction using deep neural networks or other calculations. We argue that the cost function of a policy may be approximated much more accurately by the nonlinear function of the features provided by aggregation, than by the linear function of the features provided by neural networkbased reinforcement learning, thereby potentially leading to more effective policy improvement. 展开更多
关键词 REINFORCEMENT learning dynamic programming Markovian DECISION problems aggregation feature-based ARCHITECTURES policy ITERATION DEEP neural networks rollout algorithms
在线阅读 下载PDF
动态特征聚合与多层次协同的无人机红外目标实例分割 被引量:2
3
作者 何自芬 王启刚 +3 位作者 张印辉 黄滢 彭伟 陈光晨 《红外与激光工程》 北大核心 2025年第8期246-258,共13页
针对无人机红外成像中因距离较远导致的图像轮廓模糊及目标尺度变化致使分割精度下降的问题,文中提出动态特征聚合与多层次协同的无人机红外目标实例分割模型(Dynamic feature aggregation and multi-level collaboration,DFMCNet)。首... 针对无人机红外成像中因距离较远导致的图像轮廓模糊及目标尺度变化致使分割精度下降的问题,文中提出动态特征聚合与多层次协同的无人机红外目标实例分割模型(Dynamic feature aggregation and multi-level collaboration,DFMCNet)。首先,设计区域特征自适应卷积模块(Spatial attention dynamic convolution,SADConv),采用动态卷积核和注意力机制,有效缓解特征图降维引发的细节丢失,抑制背景噪声干扰;其次,构建特征感知重组上采样模块(Feature sensing recombination upsampling module,FRUM),利用并行化可学习权重实现特征重组,在恢复特征图分辨率时保留空间特征并增强空间结构信息关注;最后,引入多尺度上下文聚合模块(Multi-scale context aggregation feature extraction module,MSFE),通过跨层级特征融合捕获多尺度上下文信息,提升模型对尺寸差异目标的泛化性。在红外航拍交通数据集Aerial-Mancar上的实验表明,DFMCNet的mAP50精度为78.4%较基准模型提升9.7%,mAP50-95精度为51.1%提升5.6%,与YOLOv12n-seg相比mAP50提高7.2%,验证了其在无人机红外场景下实现红外目标精确分割的有效性。 展开更多
关键词 无人机红外 动态卷积核 特征重组 多尺度聚合
原文传递
基于高阶空间特征聚合的车型识别算法
4
作者 杨潞霞 薛映昭 +1 位作者 张红瑞 马永杰 《电子测量技术》 北大核心 2025年第4期169-180,共12页
针对复杂交通场景下车型目标密集、遮挡而造成的车型识别精度低的问题,提出基于高阶空间特征聚合的车型识别算法。首先,在特征提取的下采样阶段,设计了HSIDM模块,实现更深层次的特征聚合,减少细小信息损失。其次,在特征融合部分设计了DM... 针对复杂交通场景下车型目标密集、遮挡而造成的车型识别精度低的问题,提出基于高阶空间特征聚合的车型识别算法。首先,在特征提取的下采样阶段,设计了HSIDM模块,实现更深层次的特征聚合,减少细小信息损失。其次,在特征融合部分设计了DMFAM模块,动态调整各尺度特征的权重,获取多尺度的上下文信息,以增强模型对多样化特征的适应能力。然后,设计解耦REL-Head检测头,将分类和回归任务拆解,避免任务混杂,增强局部特征的学习能力与抗干扰能力。最后,将本文模型部署到边缘设备进行测试。实验结果显示,本文算法在复杂度交通场景数据集BIT-Vehicle和UA-DETRAC上,mAP相较于原模型分别提升了0.7%和3.9%,并在边缘设备上可以流畅运行,具有较好的识别效果。表明所提出的方法能够有效提高车型识别的精度并应用于受限设备。 展开更多
关键词 车型识别 高阶空间交互 动态多尺度特征聚合 解耦检测头
原文传递
基于一致性感知特征融合的高动态范围成像方法 被引量:2
5
作者 印佳丽 韩津 +1 位作者 陈斌 刘西蒙 《计算机学报》 EI CAS CSCD 北大核心 2024年第10期2352-2367,共16页
高动态范围成像(High Dynamic Range Imaging,HDRI)技术是指通过融合多张低动态范围(Low Dynamic Range,LDR)图像拓展图像动态范围、完整图像内容的方法,其为解决由于相机传感器动态范围有限而导致所拍摄图像内容丢失的问题提供了实际... 高动态范围成像(High Dynamic Range Imaging,HDRI)技术是指通过融合多张低动态范围(Low Dynamic Range,LDR)图像拓展图像动态范围、完整图像内容的方法,其为解决由于相机传感器动态范围有限而导致所拍摄图像内容丢失的问题提供了实际的解决方案.通过数十年的研究,众多有效的HDRI方法已被提出,并在无物体运动、内容曝光良好的静态场景中取得接近最优的性能.然而,现实场景中物体移动和相机偏移无法避免,直接使用传统HDRI方法会在融合后的HDR图像中产生严重的重影和伪影.这使得仅包含简单融合过程的HDRI方法并不适用于实际应用,现实场景中的HDRI任务仍然具有一定挑战.因此,针对动态场景下的HDRI研究迅速发展.近期的方法集中在借助深度卷积神经网络(Convolutional Neural Network,CNN)的力量以期实现更好的性能.在这些基于CNN的方法中,特征融合对于恢复图像完整内容、消除图像伪影方面起着至关重要的作用.传统的特征融合方法通过借助跳跃连接或注意力模块,首先将LDR图像的特征进行拼接,并通过堆叠的卷积操作逐渐关注不同的局部特征.然而,此类方案通常忽略了LDR图像序列之间丰富的上下文依赖关系,且未充分利用特征之间的纹理一致性.为解决这一问题,本文提出了一种全新的一致性感知特征融合(Coherence-Aware Feature Aggregation,CAFA)方案,该方案在卷积过程中对输入特征中位于不同空间位置但具有相同上下文信息的特征信息进行采样,从而显式地将上下文一致性纳入特征融合中.基于CAFA,本文进一步提出了一种结合CAFA的动态场景下一致性感知高动态范围成像网络CAHDRNet.为更好地嵌合CAFA方案,本文通过设计三个额外的可学习模块来构建CAHDRNet.首先,使用基于在ImageNet上预训练的VGG-19构建可学习特征提取器,并在模型训练期间不断更新该特征提取器的参数.这种设计可实现LDR图像的联合特征学习,为CAFA中的上下文一致性评估奠定了坚实基础.接着,应用所提出的CAFA模块,通过在图像特征中采样具有相同上下文的信息进行特征融合.最后,本文提出使用一种多尺度残差补全模块来处理融合后的特征,利用不同扩张率进行特征学习,以实现更强大的特征表示并在图像缺失区域中进行可信细节填充.同时,设计一个软注意力模块来学习不同图像区域的重要性,以便在跳跃连接期间获得与参考图像互补的所需特征.多种实验验证了CAHDRNet的有效性并证实其优于现有最先进的方法.具体而言,本文所提出的CAHDRNet在Kalantari数据集上HDR-VDP-2和PSNR-L等指标相较于次好方法AHDRNet分别提升了1.61和0.68. 展开更多
关键词 高动态范围成像 图像融合 特征融合 上下文一致性 卷积采样
在线阅读 下载PDF
基于多特征检测与自适应权重调整的鲁棒联邦学习算法
6
作者 王春东 赵立扬 +1 位作者 张博宇 赵永新 《计算机科学》 CSCD 北大核心 2024年第S02期894-903,共10页
联邦学习作为一种保护隐私的分布式机器学习范式,允许多个客户端在不泄露原始训练数据的情况下协同训练全局模型。然而,由于无法直接访问客户端本地训练数据和无法监控本地训练过程,联邦学习面临各种拜占庭攻击的威胁,如数据中毒和模型... 联邦学习作为一种保护隐私的分布式机器学习范式,允许多个客户端在不泄露原始训练数据的情况下协同训练全局模型。然而,由于无法直接访问客户端本地训练数据和无法监控本地训练过程,联邦学习面临各种拜占庭攻击的威胁,如数据中毒和模型篡改攻击。这些攻击旨在扰乱联邦学习模型训练过程,降低模型性能。针对此问题,尽管已有许多研究提出了不同的聚合算法,但这些方法主要聚焦于单一拜占庭攻击场景,而忽略了实际环境中可能出现的混合拜占庭攻击所带来的威胁。为应对这一难题,受净水器的原理启发,提出了一种基于多特征检测与自适应权重调整的新型拜占庭鲁棒聚合算法FL-Sieve,旨在通过多层次的筛查过滤恶意客户端。首先,算法通过角幅相似度和模型边界测度评估客户端间的特征相似性,生成相似度矩阵并计算相似性分数;接着,利用聚类算法将相似的节点归入同一簇,以确保相似的节点能够被正确分类;随后,根据预定义规则筛选潜在良性客户端;最后,根据每个客户端的信任度智能地分配权重,进一步增强防御效果和系统鲁棒性。为了验证FL-Sieve的性能,实验利用了MNIST,Fashion-MNIST和CIFAR-10这3种数据集,考虑了Non-IID数据分布情景和混合拜占庭攻击场景。混合拜占庭客户端的数量从20%递增到49%,以模拟大规模混合拜占庭客户端攻击的场景。同时也对FL-Sieve在IID和Non-IID数据分布以及单攻击场景下的性能进行了测试。实验结果表明,FL-Sieve能够有效抵御不同场景下的拜占庭攻击,即使在高达49%的混合拜占庭客户端攻击下,FL-Sieve依然能够维持较高的主任务准确率。相比之下,几种现有的经典算法存在不同程度的失效,凸显出FL-Sieve的优势。 展开更多
关键词 联邦学习 混合拜占庭攻击 多特征检测 动态分配权重 鲁棒聚合算法
在线阅读 下载PDF
基于数值符号和形态特征的时间序列相似性度量方法 被引量:27
7
作者 李海林 梁叶 《控制与决策》 EI CSCD 北大核心 2017年第3期451-458,共8页
针对传统符号聚合近似方法在特征表示时容易忽略时间序列局部形态特征的局限性,以及动态时间弯曲在度量上的优势,提出一种基于数值符号和形态特征的时间序列相似性度量方法.将时间序列进行符号和形态的特征表示后,提出动态时间弯曲与符... 针对传统符号聚合近似方法在特征表示时容易忽略时间序列局部形态特征的局限性,以及动态时间弯曲在度量上的优势,提出一种基于数值符号和形态特征的时间序列相似性度量方法.将时间序列进行符号和形态的特征表示后,提出动态时间弯曲与符号距离结合的时间序列距离度量方法,使所提方法能够较好地反映时间序列数据数值分布和形态特征.实验结果表明,所提出的方法在时间序列数据挖掘中能够得到较好的分类效果,具有一定的优越性. 展开更多
关键词 符号聚合近似 动态时间弯曲 数值符号 形态特征 相似性度量
原文传递
分段聚合近似和数值导数的动态时间弯曲方法 被引量:6
8
作者 李海林 梁叶 《智能系统学报》 CSCD 北大核心 2016年第2期249-256,共8页
针对动态弯曲方法对时间序列数据相似性度量的质量和效率的局限性,本文提出一种基于分段聚合近似和数值导数的动态时间弯曲方法。该方法通过分段聚合近似将时间序列数据进行有效地降维,再结合数值导数对降维后的特征序列构建新特征序列... 针对动态弯曲方法对时间序列数据相似性度量的质量和效率的局限性,本文提出一种基于分段聚合近似和数值导数的动态时间弯曲方法。该方法通过分段聚合近似将时间序列数据进行有效地降维,再结合数值导数对降维后的特征序列构建新特征序列,并且设计符合该特征序列相似性度量方法。实验结果分析表明,与传统动态弯曲方法相比,新方法具有较好的度量质量,能在时间序列数据挖掘中得到较好的分类效果,且在低维空间具有较高的分类效率,具有一定的优越性。 展开更多
关键词 动态时间弯曲 时间序列 分段聚合近似 数值导数 相似性度量 分类 数据降维 特征表示
在线阅读 下载PDF
基于全局注意力动态联合增强的图像超分重建 被引量:1
9
作者 张祥银 胡立坤 《国外电子测量技术》 北大核心 2023年第7期22-30,共9页
针对注意力机制的移位窗口建立的长程依赖不能使全局信息得到充分交互以及多层级特征如何有效融合问题,提出一种全局动态联合增强注意力算法(global dynamic union enhances attention, GDUEA)。首先,使用叠加卷积聚合模块用于在网络的... 针对注意力机制的移位窗口建立的长程依赖不能使全局信息得到充分交互以及多层级特征如何有效融合问题,提出一种全局动态联合增强注意力算法(global dynamic union enhances attention, GDUEA)。首先,使用叠加卷积聚合模块用于在网络的浅层聚合图像局部低频特征;其次,提出的深层全局注意力算法将注意力机制只用于进行全局信息的获取;最后,使用动态联合增强模块对不同层级的特征进行动态联合均衡以及深层特征增强。通过在Urban100、B100、Set5、Set14测试集上对比SwinIR网络,GDUEA获得了更快更稳定的训练并使得网络的性能在峰值信噪比(peak signal-to-noise ratio, PSNR)上显著提高了0.075~0.32 dB。 展开更多
关键词 全局窗口 深层特征增强 动态特征联合 叠加卷积聚合
原文传递
A Study of Ca-Mg Silicate Crystalline Glazes——An Analysis on Forms of Crystals
10
作者 LIUPei-de YUPing-li WUJi-huai 《Chemical Research in Chinese Universities》 SCIE CAS CSCD 2004年第2期200-204,共5页
In the study on Ca-Mg silicate crystalline glazes, we found some disequilibrated crystallization phenomena, such as non-crystallographic small angle forking and spheroidal growth, parasitism and wedging-form of crysta... In the study on Ca-Mg silicate crystalline glazes, we found some disequilibrated crystallization phenomena, such as non-crystallographic small angle forking and spheroidal growth, parasitism and wedging-form of crystals, dendritic growth, secondary nucleation, etc. Those phenomena possibly resulted from two factors: (1) partial temperature gradient, which is caused by heat asymmetry in the electrical resistance furnace, when crystals crystalize from silicate melt; (2) constitutional supercooling near the surface of crystals. The disparity of disequilibrated crystallization phenomena in different main crystalline phases causes various morphological features of the crystal aggregates. At the same time, disequilibrated crystallization causes great stress retained in the crystals, which results in cracks in glazes when the temperature drops. According to the results, the authors analyzed those phenomena and displayed correlative figures and data. 展开更多
关键词 Crystalline glaze Costitutional supercooling Heat dynamical condition Disequilibrated crystallization Morphological feature of crystal aggregates
在线阅读 下载PDF
复杂道路场景下智能驾驶单目3D车道线检测
11
作者 娄路 胡振坤 +2 位作者 魏文洁 沈燚 隗寒冰 《计算机应用研究》 2025年第12期3807-3814,共8页
车道线检测对智能车辆的环境感知和驾驶决策至关重要,针对现有方法在复杂交通道路场景中难以同时兼顾检测精度与速度的问题,提出一种高效的单目3D车道线检测方法。该方法通过采用动态蛇形卷积,有效提取车道线弯曲和细长形态特征;利用不... 车道线检测对智能车辆的环境感知和驾驶决策至关重要,针对现有方法在复杂交通道路场景中难以同时兼顾检测精度与速度的问题,提出一种高效的单目3D车道线检测方法。该方法通过采用动态蛇形卷积,有效提取车道线弯曲和细长形态特征;利用不同尺度的视图变换与特征聚合,减少特征损失,获取不同层次的车道线位置信息;采用残差连接的辅助监督策略,增强模型的表征能力。在3D车道线评测数据集上的实验结果显示,该方法在虚拟仿真数据集Apollo 3D synthetic上的F_(1)-score指标达到98.6%,相较于目前先进的BEV-LaneDet和LATR方法分别提升了1.7%和1.8%;在大规模真实场景OpenLane数据集上的F_(1)-score指标达到59.8%,相较于BEV-LaneDet,提升了1.4%,在上下坡和弯道场景中的精度提升尤为明显,分别为4.6%和2.5%;F_(1)-score虽比基于Transformer的LATR方法低2.1%,但运行速度80.1 fps是后者14 fps的5.7倍。结果表明,该方法能够提高复杂场景下3D车道线检测的准确性和鲁棒性,实现检测性能与运行推理速度之间的较好平衡。 展开更多
关键词 自动驾驶 动态蛇形卷积 鸟瞰图 特征聚合 残差连接
在线阅读 下载PDF
Detection and counting method of juvenile abalones based on improved SSD network
12
作者 Runxue Su Jun Yue +2 位作者 Zhenzhong Li Shixiang Jia Guorui Sheng 《Information Processing in Agriculture》 CSCD 2024年第3期325-336,共12页
Detection and counting of abalones is one of key technologies of abalones breeding density estimation.The abalones in the breeding stage are small in size,densely distributed,and occluded between individuals,so the ex... Detection and counting of abalones is one of key technologies of abalones breeding density estimation.The abalones in the breeding stage are small in size,densely distributed,and occluded between individuals,so the existing object detection algorithms have low precision for detecting the abalones in the breeding stage.To solve this problem,a detection and counting method of juvenile abalones based on improved SSD network is proposed in this research.The innovation points of this method are:Firstly,the multi-layer feature dynamic fusion method is proposed to obtain more color and texture information and improve detection precision of juvenile abalones with small size;secondly,the multiscale attention feature extraction method is proposed to highlight shape and edge feature information of juvenile abalones and increase detection precision of juvenile abalones with dense distribution and individual coverage;finally,the loss feedback training method is used to increase the diversity of data and the pixels of juvenile abalones in the images to get the even higher detection precision of juvenile abalones with small size.The experimental results show that the AP@0.5 value,AP@0.7 value and AP@0.75 value of the detection results of the proposed method are 91.14%,89.90% and 80.14%,respectively.The precision and recall rates of the counting results are 99.59% and 97.74%,respectively,which are superior to the counting results of SSD,FSSD,MutualGuide,EfficientDet and VarifocalNet models.The proposed method can provide support for real-time monitoring of aquaculture density for juvenile abalones. 展开更多
关键词 Juvenile abalones Object detection SSD network Multi-layer feature dynamic fusion multi-scale attention feature extraction Loss feedback training
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部