期刊文献+
共找到15,671篇文章
< 1 2 250 >
每页显示 20 50 100
基于图像匹配的高空大斜视无源目标定位
1
作者 贾平 李昌灏 +3 位作者 孙辉 宋悦铭 祃卓荦 徐芳 《光学精密工程》 北大核心 2026年第1期124-138,共15页
提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似... 提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似正射变换,并截取对应区域的卫星图像。采用RepVGG提取图像粗特征,通过互最近邻实现初步匹配,并结合MiHo与归一化互相关(Normalized Cross Correlation,NCC)筛选匹配点对。最后,借助Transformer模块完成精细化匹配,再根据精匹配结果构建角度误差修正矩阵,多次迭代修正系统误差。实验结果表明,所提方法的定位精度较传统方法有较大幅度提升,在典型应用场景下提升约70%,在斜距90 km的情况下,定位精度可维持在120 m左右。该方法突破了传统无源定位对角度精度的高度依赖,验证了基于图像匹配的无源定位路径的可行性与有效性。 展开更多
关键词 图像匹配 目标定位 航空光电系统 无源定位 大斜视 TRANSFORMER
在线阅读 下载PDF
计及预案式失配冲击的响应驱动频率稳定紧急切负荷策略
2
作者 孙正龙 刘勇 +5 位作者 陈威翰 章锐 刘铖 华文 张程铭 蔡国伟 《电力系统保护与控制》 北大核心 2026年第1期117-129,共13页
在新型电力系统复杂工况下,以策略表为主体、通过“离线仿真、在线匹配”的预案式频率稳定控制方案存在较高失配风险,甚至因调控失当引发二次冲击,严重威胁电力系统的安全稳定运行。提出一种计及预案式失配冲击的响应驱动频率稳定紧急... 在新型电力系统复杂工况下,以策略表为主体、通过“离线仿真、在线匹配”的预案式频率稳定控制方案存在较高失配风险,甚至因调控失当引发二次冲击,严重威胁电力系统的安全稳定运行。提出一种计及预案式失配冲击的响应驱动频率稳定紧急切负荷策略。该策略动作在预案式控制之后,是对预案式控制的有益补充,能够有效提升系统频率稳定性。首先建立了基于系统频率响应(system frequency response,SFR)模型辨识的频率稳定切负荷量计算方法。提出了基于频率稀疏量测的SFR模型辨识方法,在此基础上建立了含稳定控制的SFR模型,根据频率稳定控制目标迭代求解切负荷量。其次,建立了基于Transformer网络的频率控制敏感点挖掘模型,通过分析关键发电机母线节点频率时序值和频率控制敏感点的映射关系,实现响应驱动的频率控制敏感点在线挖掘。最后,按照敏感点排序快速分配控制措施总量,构建频率稳定紧急控制方案。在某实际交直流混联万节点仿真系统验证了所提方法的有效性。 展开更多
关键词 预案式控制 频率稳定 紧急控制 频率响应模型 TRANSFORMER
在线阅读 下载PDF
基于BSimilar优化PTransformer的光伏功率短期预测
3
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 TRANSFORMER 相似日
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
4
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
5
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
6
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
融合群分解与Transformer-KAN的短期风速预测
7
作者 史加荣 张思怡 《南京信息工程大学学报》 北大核心 2026年第1期60-68,共9页
针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列... 针对风速固有的不稳定性,通过融合群分解(Swarm Decomposition,SWD)、Transformer和Kolmogorov-Arnold网络(KAN),提出一种SWD-Transformer-KAN预测模型.首先,利用SWD对原始风速数据进行分解,以提取关键特征.其次,针对每个被分解的子序列,建立Transformer-KAN模型,所建模型充分利用了Transformer的时序处理能力和KAN的非线性逼近能力.最后,对所有子序列的预测结果进行叠加,得到最终的风速预测值.为了验证所提出模型的有效性,将其与其他模型进行实验对比,结果表明,SWD-Transformer-KAN模型具有最优的预测性能,其决定系数(R2)高达99.91%. 展开更多
关键词 风速预测 群分解 TRANSFORMER Kolmogorov-Arnold网络
在线阅读 下载PDF
基于近红外光谱与Transformer的烟叶感官指标预测方法
8
作者 张云伟 张健涛 +3 位作者 张海 周渭皓 李斌 陶成金 《农业机械学报》 北大核心 2026年第1期386-396,共11页
为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用... 为克服传统卷烟配方设计与维护过程中存在的主观性强、过度依赖人工经验及感官评吸等技术瓶颈,利用“近红外光谱-化学成分-感官指标”的间接关联,提出了一种基于近红外光谱与Transformer架构的端到端烟叶感官质量指标预测方法。首先采用Savitzky-Golay卷积平滑法(SG)、一阶导数法(D1)、多元散射校正(MSC)3种光谱预处理技术有效消除基线漂移和散射干扰;进而设计了一种面向光谱数据特征的Transformer预测模型,实现了烟叶感官质量三维评价体系(风格特征:清香、甜香、焦香;烟气特征:浓度、劲头;质量特征:香气质、香气量、杂气、刺激、余味)的精准预测,并采用了SHAP方法对模型进行分析,增强了模型的可解释性。结果表明,模型对各感官指标测试集预测的平均绝对误差均不高于0.56,具有较好可用性;针对不同感官指标,模型表现出对不同光谱特征波段的捕捉,有效挖掘了光谱特征的协同作用机制,具有较好可解释性。在此基础上,进一步结合多维相似度分析设计了一种辅助烟叶替代方法,可为烟叶替代与配方优化提供量化决策支持。 展开更多
关键词 烟叶感官指标 近红外光谱 TRANSFORMER 预测模型 烟叶替代
在线阅读 下载PDF
基于Transformer模型堤坝渗漏入口精准识别方法研究
9
作者 梁越 赵硕 +4 位作者 喻金桃 许彬 张斌 龚胜勇 舒云林 《岩土工程学报》 北大核心 2026年第1期187-195,共9页
渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型... 渗漏是堤坝工程面临的主要安全隐患,渗漏入口精确识别与定位对降低堤坝风险至关重要。通过堤坝渗漏入口示踪剂分布及其运移特征模拟数据,训练学习Transformer模型以确定最优参数条件并分析该条件下该模型的预测效果,进一步通过室内模型试验验证该模型的可靠性。研究表明:①当迭代次数达600次时,模型预测的流速最大值相对误差最小,且最大流速值坐标与真实渗漏入口坐标最为接近,预测效果最佳;在此条件下,当数据采集时长为50 s时,模型预测的流速最大值相对偏差最小,预测效果最优。②在最佳迭代次数和数据采集时长条件下,模型预测精度超过95%,渗漏入口大小和渗漏流量的预测值与真实值差异极小,且流速和位置预测相对误差均较低,其中位置预测相对误差低于5%。③将电导率试验采集数据转换为示踪剂浓度并输入至该模型进行流速分布预测,可知该模型能准确定位渗漏入口位置,且流速和渗漏入口坐标的预测平均相对误差均低于10%,进而验证了该模型在渗漏入口定位中的有效性与准确性。相关研究成果可为堤坝渗漏入口精确识别奠定理论基础和提供技术支撑。 展开更多
关键词 堤坝 渗漏入口 Transformer模型 精准识别 室内模型试验
原文传递
基于线性注意和类别关联特征学习的在线动作检测
10
作者 詹永照 孙慧敏 +1 位作者 夏惠芬 任晓鹏 《江苏大学学报(自然科学版)》 北大核心 2026年第1期39-47,63,共10页
为了在在线动作检测中充分合理利用动作的上下文特征、与类别关联的特征和预测的未来特征快速检测相应动作,提出基于线性注意和类别关联特征学习的在线动作检测方法.该方法改进了Transformer构架,采用哈达玛积的轻型线性自注意实现Trans... 为了在在线动作检测中充分合理利用动作的上下文特征、与类别关联的特征和预测的未来特征快速检测相应动作,提出基于线性注意和类别关联特征学习的在线动作检测方法.该方法改进了Transformer构架,采用哈达玛积的轻型线性自注意实现Transformer视频上下文特征学习,以减少计算开销;其次对训练样本动作特征进行聚类,将视频序列上下文特征与动作类别特征进行关联学习,有效获得与类别关联的特征表达;最后融合动作的上下文特征、与类别关联的特征和预测的未来特征检测相应时刻动作,以提升动作鉴别性.在典型数据集上进行性能试验,完成了超参取值分析,对比了不同方法的工作精度和运行效率.给出了消融试验和可视化分析.结果表明:在Thumos14(TSN-Anet)、Thumos14(TSN-Kinetics)和HDD数据集上,所提出方法的mAP比Colar方法分别提高了0.2、0.5、0.2百分点,可见新方法优于目前较先进的Colar方法. 展开更多
关键词 在线动作检测 深度学习 注意力机制 编码 上下文特征 TRANSFORMER 类别关联特征学习
在线阅读 下载PDF
基于长短期记忆网络-Transformer模型参数优化的锂离子电池剩余使用寿命预测
11
作者 高建树 郝世宇 党一诺 《汽车工程师》 2026年第1期32-39,共8页
为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transforme... 为提高锂离子电池剩余使用寿命(RUL)预测的准确性,提出了一种基于长短期记忆(LSTM)网络-Transformer模型参数优化的RUL预测方法,采用网格搜索法选取模型的超参数,利用LSTM网络提取锂离子电池时间序列中的长短期依赖关系,使用Transformer的自注意力机制处理全局信息并对超参数进行优化,通过全连接层进行最终的寿命预测。基于美国国家航空航天局(NASA)数据集和先进生命周期工程中心(CALCE)数据集的试验验证结果表明,模型在更短的序列长度、更少的隐藏层数量和训练次数等条件下,在多种评价指标上均优于LSTM网络模型、Transformer模型及其他神经网络模型,具有更高的预测精度和鲁棒性。最后,通过不同电池的对比试验进一步验证了模型在不同电池数据上的泛化能力。 展开更多
关键词 锂离子电池 剩余使用寿命预测 参数优化 长短期记忆神经网络 TRANSFORMER 混合模型
在线阅读 下载PDF
基于可变序列的跨层通道剪枝方法
12
作者 李秉烨 鲍宇 +2 位作者 曹伟 李明泽 徐方正 《计算机工程》 北大核心 2026年第1期381-389,共9页
放射治疗是肝癌的重要治疗方式。基于深度学习的图像语义分割技术能辅助医师勾画放射靶区,提高放射治疗的精确性。然而,现有的医疗图像语义分割模型结构较为复杂,且参数量大,难以部署在资源受限的设备上。分析视觉Transformer模型参数... 放射治疗是肝癌的重要治疗方式。基于深度学习的图像语义分割技术能辅助医师勾画放射靶区,提高放射治疗的精确性。然而,现有的医疗图像语义分割模型结构较为复杂,且参数量大,难以部署在资源受限的设备上。分析视觉Transformer模型参数的重要性,发现模型不同层次的重要性参数具有特殊分布规律。据此,提出基于可变序列的跨层通道剪枝方法。依据重要性参数分布规律,对多头自注意力(MSA)层和前馈网络(FFN)层,测量其重要性权重并调节取值,形成重要性权重值的层次序列,再为序列设定对应的剪枝率,形成随网络深度变化的可变剪枝率序列,从而实现MSA层和FFN层的精细化剪枝。引入循环剪枝策略,在每一轮次模型剪枝过程中迭代更新可变剪枝率序列,以充分削减MSA层和FFN层的冗余结构。在公开肝脏分割数据集3D-IRCADb-01上进行训练和测试,视觉Transformer模型经剪枝后,图像分割准确率保持不变,但浮点运算数(FLOPs)和参数量分别减少了60.26%和66.07%。实验结果表明,所提方法在保证分割精度的前提下,实现了更大的剪枝率,比固定剪枝率方法更具有优势。 展开更多
关键词 医学影像 语义分割 视觉Transformer 可变序列 模型剪枝
在线阅读 下载PDF
基于动态优化细节感知网络的遥感图像分割方法
13
作者 梁书绮 王雷 +2 位作者 孙燕青 杨善良 李彬 《工程科学学报》 北大核心 2026年第1期177-189,共13页
现有的遥感图像分割模型,例如基于卷积神经网络(Convolutional neural network,CNN)和基于Transformer框架的模型,取得了巨大成功,但是还存在难以完整保留原始编码器特征图细节、动态捕捉全局上下文信息等缺点.因此,基于CNN-Transforme... 现有的遥感图像分割模型,例如基于卷积神经网络(Convolutional neural network,CNN)和基于Transformer框架的模型,取得了巨大成功,但是还存在难以完整保留原始编码器特征图细节、动态捕捉全局上下文信息等缺点.因此,基于CNN-Transformer混合框架,提出了一种全新的基于动态优化细节感知网络(Dynamic optimized detail-aware network,DODNet)的分割方法.首先,在编码器采用ResNext-50作为主干网络,提出一种多重减法感知模块(Multi-subtraction perception module,MSPM)来收集多尺度特征图之间的空间细节差异,有效减少冗余信息.然后,在解码器设计一个动态信息融合模块(Dynamic information fusion block,DIFB),它结合了全局双层路由自注意力分支和局部注意力分支,用于提高全局和局部信息的获取能力.最后,提出一种新的通道空间注意力模块—统一特征提取器(Unified feature extractor,UFE)以进一步获取语义和上下文信息.在Vaihingen、Potsdam和LoveDA三个经典公开数据集,通过对比和消融实验的定量和可视化分析表明,所提方法在F1分数、总体精度(Over accuracy,OA)和平均交并比(Mean intersection over union,mIoU)评价指标中优于十种最先进的分割方法,其中平均交并比分别达到了84.96%、87.64%和52.43%,验证了所提方法在分割具有复杂背景、内类方差大和类间方差小问题的高分辨率遥感图像的优越性能. 展开更多
关键词 遥感图像 语义分割 CNN-Transformer框架 动态Transformer 多尺度减法
在线阅读 下载PDF
基于深度学习的无人机单目标跟踪综述
14
作者 陈泷 石磊 +2 位作者 黎智辉 丁锰 潘亦伦 《计算机科学与探索》 北大核心 2026年第1期40-65,共26页
基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网... 基于深度学习的无人机(UAV)单目标跟踪算法旨在从航拍视频序列中准确跟踪指定目标,已成为计算机视觉领域的研究热点。与传统地面视觉跟踪相比,无人机单目标跟踪面临着视角变化剧烈、目标尺度复杂多变、计算资源受限等独特挑战。基于网络架构特点,将基于深度学习的无人机单目标跟踪方法系统梳理为传统Siamese网络、CNN-Transformer混合架构和全Transformer三大技术路线,重点关注2022—2025年间的最新研究进展。创新性地提出了两个细化分类框架:针对CNN-Transformer混合架构提出模块替代、特征后融合和协同建模三分类;针对Transformer单流方法提出静态计算、混合机制和动态计算三分类。系统揭示了无人机单目标跟踪算法从追求性能最大化向性能与效率协同优化的演进趋势。通过在UAV123、DTB70、UAVDT、VisDrone2018等主流数据集上的性能对比分析,验证了不同技术路线的优势与局限性。识别当前技术面临的关键挑战并提出未来发展方向和工程部署指导。 展开更多
关键词 无人机 单目标跟踪 深度学习 Siamese网络 TRANSFORMER
在线阅读 下载PDF
面向刀具异常检测的多模态时序融合网络
15
作者 盖田田 黄民 孙巍伟 《组合机床与自动化加工技术》 北大核心 2026年第1期32-40,46,共10页
随着精密加工技术的发展,数控刀具的健康状态对生产质量与效率具有重要影响。针对多模态时间序列数据的融合与多层次时间序列建模挑战,提出了多模态交叉注意力时序融合网络(MCTF-Net)。模型首先通过TCN模块分别捕获每个模态信号的局部... 随着精密加工技术的发展,数控刀具的健康状态对生产质量与效率具有重要影响。针对多模态时间序列数据的融合与多层次时间序列建模挑战,提出了多模态交叉注意力时序融合网络(MCTF-Net)。模型首先通过TCN模块分别捕获每个模态信号的局部时间特征,并通过Transformer的编码器获取全局特征,随后在中期融合层引入跨模态交叉注意力机制,以振动信号为查询融合声发射和电流特征得到统一表示,接着采用TCN-Transformer双路架构同时捕捉局部磨损瞬态模式和建模负载波动的长程依赖,提升异常检测的准确性与鲁棒性。基于PHM2010刀具数据集和自采数据的实验表明,该模型在准确率、F1分数及ROC分数等指标上均优于主流方法。消融实验进一步验证了TCN与Transformer模块的协同作用,为复杂制造环境下的刀具异常检测提供了一种高效、精准的解决方案。 展开更多
关键词 刀具异常检测 多模态数据 时间卷积网络 TRANSFORMER 精密加工
在线阅读 下载PDF
基于自适应频率感知网络的遥感图像分割方法
16
作者 梁书绮 王雷 +3 位作者 孙燕青 刘世龙 杨善良 李彬 《电子科技大学学报》 北大核心 2026年第1期149-160,共12页
现有遥感图像分割方法在跨尺度特征融合时缺乏对低频结构与高频细节的协同处理,且无法对图像内容自适应响应,导致难以有效解决因自然变化、光照和阴影干扰引起的高分辨率遥感图像中类内差异大、类间差异小的问题。为此提出了一种自适应... 现有遥感图像分割方法在跨尺度特征融合时缺乏对低频结构与高频细节的协同处理,且无法对图像内容自适应响应,导致难以有效解决因自然变化、光照和阴影干扰引起的高分辨率遥感图像中类内差异大、类间差异小的问题。为此提出了一种自适应频率感知网络(AFANet)。首先,提出一种频率动态融合模块,通过自适应低通和高通滤波在保留低频结构的同时抑制高频噪音分量,并增强高频细节边界信息。其次,构建双域学习模块集成空间和频率信息,实现空间域局部细节与频域全局结构的联合建模。最后,引入一个细节增强模块,利用不同的差分卷积以增强模型的特征提取和泛化能力。在Vaihingen和Potsdam两个经典公开数据集上通过对比和消融实验的定量及可视化分析表明,AFANet在F1分数、总体精度和平均交并比等指标中优于7种先进的分割方法,验证了AFANet的优越性能。 展开更多
关键词 遥感图像 语义分割 特征融合 自适应频率滤波 空间域—频域Transformer
在线阅读 下载PDF
基于Transformer-卷积神经网络模型实现单节点腰部康复训练动作识别任务
17
作者 余圣涵 成贤锴 +1 位作者 郑跃 杨颖 《中国组织工程研究》 北大核心 2026年第16期4125-4136,共12页
背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于... 背景:惯性测量单元被广泛用于人体姿态感知与动态捕捉。深度学习已逐步替代传统规则与特征工程,广泛应用于动作识别任务。卷积神经网络在提取局部动态特征方面表现良好,Transformer则在建模长时序依赖方面展现出强大能力。目的:通过基于Transformer-卷积神经网络融合模型识别方法,实现在单惯性传感器条件下的腰部康复训练动作识别任务。方法:采集6名健康受试者佩戴单个惯性传感器条件下执行腰部康复动作的加速度与角速度数据,以动作类型为数据进行标注,制作腰部康复动作数据集。通过腰部康复动作数据集对Transformer-卷积神经网络融合模型进行训练,构建动作分类模型。通过留一交叉验证评估模型准确性,并与线性判别分析、支持向量机、多层感知、经典Transformer等模型进行性能对比。结果与结论:在5类动作识别任务中,Transformer-卷积神经网络模型准确率达96.67%,F1-score为0.9669。在单传感器输入的条件下,相较于传统模型,在识别精度与泛化能力方面具有明显优势。验证了基于单惯性测量单元数据的深度模型在腰部康复动作分类任务中的实用性,为轻量化、高部署性的居家腰部康复训练系统提供基础。 展开更多
关键词 慢性腰痛 康复训练 深度学习 TRANSFORMER 单节点惯性传感器 动作分类
暂未订购
基于Transformer的壁画裂缝自动化数字修复方法
18
作者 刘晨玲 李炳焱 +3 位作者 米艳华 薛峰 王建华 戴震 《太原理工大学学报》 北大核心 2026年第1期186-194,共9页
【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多... 【目的】随着现代科技的发展,文物保护领域正经历深刻变革。传统的壁画修复手段虽能维护文物的部分完整性,但受限于技术和操作的复杂性。人工智能等数字化文物修复技术能够实现对壁画文物的高精度记录与还原,然而,现有图像修复方法大多依赖专家知识或人工辅助,无法实现壁画数字修复的自动化。【方法】本文结合北方地区长期缺水干燥的环境特征,针对壁画文物可能存在的撕扯断裂或裂缝错位问题,实现自动化数字修复。具体而言,本研究提出基于Transformer的壁画裂缝自动化数字修复方法;基于VGG16-Unet模型,创新性提出基于膨胀核的裂缝掩码优化方法,通过形态学膨胀操作显著提升裂缝覆盖率。此外,利用Transformer的全局结构学习能力与CNN上采样实现结构修复,并引入傅立叶卷积与大核注意力模块完成纹理细节还原和高保真修复。【结果】实验基于山西多地真实壁画数据验证了该方法的有效性,结果表明,该方法在裂缝识别覆盖度、结构还原度及纹理协调性方面均优于传统方法,尤其对北方干燥地区特有的断裂错位型裂缝修复效果显著。 展开更多
关键词 壁画修复 深度学习 壁画图像分割 TRANSFORMER
在线阅读 下载PDF
基于KAN的无监督多元时间序列异常检测网络
19
作者 王成 金城 《计算机科学》 北大核心 2026年第1期89-96,共8页
时间序列数据在金融、医疗、工业和交通等领域中广泛存在,异常检测对确保系统稳定和安全至关重要。由于异常样本的收集十分困难,当前大多数时间序列异常检测方法是无监督的。然而,这些方法普遍存在过泛化问题,即模型不仅能重建正常样本... 时间序列数据在金融、医疗、工业和交通等领域中广泛存在,异常检测对确保系统稳定和安全至关重要。由于异常样本的收集十分困难,当前大多数时间序列异常检测方法是无监督的。然而,这些方法普遍存在过泛化问题,即模型不仅能重建正常样本,还能很好地重建异常样本。这一问题使得异常检测效果不佳。因此,提出了一种基于Kolmogorov-Arnold表示理论的时间序列异常检测方法TS-KAN,利用其参数高效性与局部可塑性,使模型更好地拟合正常样本并缓解过泛化问题。此外,提出了局部特征增强层Local-KAN,以增强时域特征的表达能力,提高上下文异常检测能力。在5个主流时间序列异常检测数据集上的实验表明,TS-KAN的异常检测能力显著优于现有方法。 展开更多
关键词 时间序列异常检测 KAN TRANSFORMER 记忆模块 深度学习
在线阅读 下载PDF
ACB-Net:带有注意力补偿分支的图像分割算法及应用
20
作者 杨明樟 陈壹华 +3 位作者 余松森 曾易文浩 徐芳 陈榕榕 《微电子学与计算机》 2026年第1期110-123,共14页
近年来,基于深度学习的图像分割技术取得了显著进展,但现有方法在特征提取方面存在深浅层特征区分不充分的问题,影响了分割效果的准确性。为解决此问题,提出了一种称为ACB-Net的创新分割网络,通过引入注意力补偿机制提升分割性能。具体... 近年来,基于深度学习的图像分割技术取得了显著进展,但现有方法在特征提取方面存在深浅层特征区分不充分的问题,影响了分割效果的准确性。为解决此问题,提出了一种称为ACB-Net的创新分割网络,通过引入注意力补偿机制提升分割性能。具体而言,ACB-Net引入ResPath来处理低级特征中的语义信息不足,采用卷积补偿的CC-Transformer捕捉深层特征的全局上下文信息,并通过双增强卷积(DEC-Block)促进浅层与深层特征的有效融合。该方法实现了CNN对局部边缘信息的强化与注意力机制对全局信息的补偿,提升了模型对不同尺度特征的表征能力。在公开皮肤病数据集(ISIC 2017和ISIC 2018)和息肉数据集(Kvasir-SEG、CVC-ColonDB、CVCClinicDB、ETIS-LaribPolypDB)上的实验结果表明:ACB-Net在多种指标上显著优于现有方法。这一特征差异化处理与互补机制为图像自动分割提供了精确且高效的解决方案,对生物医学图像分析中的深度学习应用具有重要的借鉴意义。 展开更多
关键词 图像分割 CNN TRANSFORMER 增强卷积分支 特征融合
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部