期刊文献+
共找到16,554篇文章
< 1 2 250 >
每页显示 20 50 100
深度学习在细胞图像自动分割中的应用与进展 被引量:1
1
作者 王旭 王晓燕 +3 位作者 郭英慧 蔡肖红 刘艳艳 张文凯 《计算机工程与应用》 北大核心 2026年第2期73-91,共19页
细胞分割研究对于细胞形态学分析、疾病早期诊断、药物筛选以及个性化医疗具有重要意义。细胞图像分割作为一种核心任务,旨在从复杂的生物图像中提取细胞边界和结构,支持疾病诊断和研究。因此,对细胞进行精确分割是解决细胞形态学分析... 细胞分割研究对于细胞形态学分析、疾病早期诊断、药物筛选以及个性化医疗具有重要意义。细胞图像分割作为一种核心任务,旨在从复杂的生物图像中提取细胞边界和结构,支持疾病诊断和研究。因此,对细胞进行精确分割是解决细胞形态学分析、肿瘤检测以及药物筛选等生物医学问题的首要任务。深度学习以其良好的特征提取和自适应学习能力,近年来成为细胞图像自动分割领域的重要技术手段。为推动细胞图像分割研究,在介绍常用细胞图像分割性能评价指标的基础上,梳理了CNN、U-Net、Mask R-CNN、GAN、Transformer、GNN、弱监督学习、迁移学习和视觉大模型以及混合架构在细胞图像分割中的应用,并通过对各模型优缺点进行对比分析,明确了当前研究中存在的主要问题,并展望了未来的研究方向。 展开更多
关键词 细胞分割 深度学习 TRANSFORMER 弱监督学习 混合架构
在线阅读 下载PDF
基于线性注意和类别关联特征学习的在线动作检测 被引量:1
2
作者 詹永照 孙慧敏 +1 位作者 夏惠芬 任晓鹏 《江苏大学学报(自然科学版)》 北大核心 2026年第1期39-47,63,共10页
为了在在线动作检测中充分合理利用动作的上下文特征、与类别关联的特征和预测的未来特征快速检测相应动作,提出基于线性注意和类别关联特征学习的在线动作检测方法.该方法改进了Transformer构架,采用哈达玛积的轻型线性自注意实现Trans... 为了在在线动作检测中充分合理利用动作的上下文特征、与类别关联的特征和预测的未来特征快速检测相应动作,提出基于线性注意和类别关联特征学习的在线动作检测方法.该方法改进了Transformer构架,采用哈达玛积的轻型线性自注意实现Transformer视频上下文特征学习,以减少计算开销;其次对训练样本动作特征进行聚类,将视频序列上下文特征与动作类别特征进行关联学习,有效获得与类别关联的特征表达;最后融合动作的上下文特征、与类别关联的特征和预测的未来特征检测相应时刻动作,以提升动作鉴别性.在典型数据集上进行性能试验,完成了超参取值分析,对比了不同方法的工作精度和运行效率.给出了消融试验和可视化分析.结果表明:在Thumos14(TSN-Anet)、Thumos14(TSN-Kinetics)和HDD数据集上,所提出方法的mAP比Colar方法分别提高了0.2、0.5、0.2百分点,可见新方法优于目前较先进的Colar方法. 展开更多
关键词 在线动作检测 深度学习 注意力机制 编码 上下文特征 TRANSFORMER 类别关联特征学习
在线阅读 下载PDF
基于改进自编码器和TFT的发动机剩余寿命预测模型 被引量:1
3
作者 谭娜 郭嘉玺 +3 位作者 李耀华 石瑞勃 黄金煜昊 雷欣然 《航空动力学报》 北大核心 2026年第2期144-155,共12页
针对航空发动机多源传感器数据在时变工况下退化特征难表征的问题,提出融合改进型卷积自编码器与temporal fusion transformer(TFT)解码器的预测模型,通过多尺度时空特征融合提升了剩余寿命单点预测精度与时变不确定性量化能力。改进的... 针对航空发动机多源传感器数据在时变工况下退化特征难表征的问题,提出融合改进型卷积自编码器与temporal fusion transformer(TFT)解码器的预测模型,通过多尺度时空特征融合提升了剩余寿命单点预测精度与时变不确定性量化能力。改进的卷积自编码器利用其多尺度卷积单元(MSCU)从多维传感器时序数据中提取不同尺度下的特征信息,灵活捕获序列中信息间的局部依赖关系,同时避免了信息丢失问题。TFT解码器通过特征选择模块和多头注意力机制有效捕捉了数据中的全局依赖关系,并通过这些机制揭示了特征的重要性,从而提供了对数据特征影响程度的解释。采用公开数据集进行实验验证,与先进预测模型的比较分析表明,MS1DCAE_TFT模型在FD001与FD003数据集上的方均根误差和分数指标至少提高了0.2%和65.5%,同时分位数回归预测了其寿命区间进行了不确定性量化,可为发动机剩余寿命预测提供可靠的解决方案。 展开更多
关键词 不确定性量化 多尺度卷积单元 temporal fusion transformers解码器 剩余寿命预测 分位数回归
原文传递
基于图像匹配的高空大斜视无源目标定位
4
作者 贾平 李昌灏 +3 位作者 孙辉 宋悦铭 祃卓荦 徐芳 《光学精密工程》 北大核心 2026年第1期124-138,共15页
提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似... 提出一种基于图像匹配的无源定位方法,通过引入基于Transformer的特征增强与MiHo聚类筛选的两步匹配策略,减轻了高空大斜视条件下传统无源定位算法因微小角度误差导致的定位精度下降程度。根据粗定位结果与飞行参数对航拍图像进行近似正射变换,并截取对应区域的卫星图像。采用RepVGG提取图像粗特征,通过互最近邻实现初步匹配,并结合MiHo与归一化互相关(Normalized Cross Correlation,NCC)筛选匹配点对。最后,借助Transformer模块完成精细化匹配,再根据精匹配结果构建角度误差修正矩阵,多次迭代修正系统误差。实验结果表明,所提方法的定位精度较传统方法有较大幅度提升,在典型应用场景下提升约70%,在斜距90 km的情况下,定位精度可维持在120 m左右。该方法突破了传统无源定位对角度精度的高度依赖,验证了基于图像匹配的无源定位路径的可行性与有效性。 展开更多
关键词 图像匹配 目标定位 航空光电系统 无源定位 大斜视 TRANSFORMER
在线阅读 下载PDF
基于双重并行任务的无人机小目标两阶段检测方法
5
作者 杨艺 朱江睿 +3 位作者 王科平 张高鹏 钱伟 王田 《模式识别与人工智能》 北大核心 2026年第1期31-51,共21页
目标在图像中的尺寸过小是无人机目标检测面临的主要挑战之一,特别是当无人机飞行高度较高且成像分辨率较低时,小目标特征极易在深度神经网络的深层特征中弥散.为此,文中提出基于双重并行任务的无人机小目标两阶段检测方法,并行任务包... 目标在图像中的尺寸过小是无人机目标检测面临的主要挑战之一,特别是当无人机飞行高度较高且成像分辨率较低时,小目标特征极易在深度神经网络的深层特征中弥散.为此,文中提出基于双重并行任务的无人机小目标两阶段检测方法,并行任务包含小目标检测任务与超分辨率重建任务.在超分辨率重建任务分支中,构建空间先验模块和窗口注意力引导模块.小目标检测任务分支以Swin Transformer为基础,并且分别由空间先验模块和窗口注意力引导模块进行浅层特征的空间信息和深层特征的注意力的超分辨率重建.两阶段检测方法分为训练阶段和推理阶段.在训练阶段,超分辨率重建任务分支均以高分辨率特征为标签,从而增强小目标检测任务分支对细节特征的提取能力.在推理阶段,仅保留小目标检测任务分支,可提升方法的推理速度,降低资源开销.在公共数据集VisDrone和自制无人机数据集JZ-UAV上的实验表明,文中方法识别精度较高. 展开更多
关键词 无人机(UAV) Swin TRANSFORMER 小目标检测 超分辨率重建
在线阅读 下载PDF
面向遥感图像超分辨率重建的跨尺度余弦注意力网络
6
作者 李智杰 宋易宸 +3 位作者 李昌华 董玮 张颉 介军 《计算机工程与应用》 北大核心 2026年第1期285-296,共12页
为了解决现有遥感图像超分辨率网络无法充分利用跨尺度特征、参数过多和计算量大的问题,提出一种面向遥感图像超分辨率重建的跨尺度余弦注意力网络。通过引入特征蒸馏机制设计了一种级联特征蒸馏块,用来提取具有不同感知场和高频信息的... 为了解决现有遥感图像超分辨率网络无法充分利用跨尺度特征、参数过多和计算量大的问题,提出一种面向遥感图像超分辨率重建的跨尺度余弦注意力网络。通过引入特征蒸馏机制设计了一种级联特征蒸馏块,用来提取具有不同感知场和高频信息的更丰富的区域特征,同时保持模型轻量化。在级联特征蒸馏块中嵌入一种多分支空间注意力模块以进一步提升网络对关键空间信息的捕捉能力。此外,提出的跨尺度余弦注意力层可以在不增加计算复杂度的情况下有效计算高维和低维特征之间的相关性,从而增强模型对不同尺度特征的处理能力,而且其中的高效余弦自注意力机制解决了网络注意力被特定像素支配的问题,增强网络关注更多特征的能力。在UC Merced和AID数据集上的实验结果表明,所提算法与当前主流的超分辨率重建算法相比以相对较低的计算成本获得了更好的峰值信噪比和结构相似度,重建后的图像恢复了更多的纹理细节信息,验证了所提网络可以在较好地平衡模型轻量化的同时提升超分辨率重建性能。 展开更多
关键词 遥感图像 超分辨率重建 TRANSFORMER 轻量级 跨尺度
在线阅读 下载PDF
计及预案式失配冲击的响应驱动频率稳定紧急切负荷策略
7
作者 孙正龙 刘勇 +5 位作者 陈威翰 章锐 刘铖 华文 张程铭 蔡国伟 《电力系统保护与控制》 北大核心 2026年第1期117-129,共13页
在新型电力系统复杂工况下,以策略表为主体、通过“离线仿真、在线匹配”的预案式频率稳定控制方案存在较高失配风险,甚至因调控失当引发二次冲击,严重威胁电力系统的安全稳定运行。提出一种计及预案式失配冲击的响应驱动频率稳定紧急... 在新型电力系统复杂工况下,以策略表为主体、通过“离线仿真、在线匹配”的预案式频率稳定控制方案存在较高失配风险,甚至因调控失当引发二次冲击,严重威胁电力系统的安全稳定运行。提出一种计及预案式失配冲击的响应驱动频率稳定紧急切负荷策略。该策略动作在预案式控制之后,是对预案式控制的有益补充,能够有效提升系统频率稳定性。首先建立了基于系统频率响应(system frequency response,SFR)模型辨识的频率稳定切负荷量计算方法。提出了基于频率稀疏量测的SFR模型辨识方法,在此基础上建立了含稳定控制的SFR模型,根据频率稳定控制目标迭代求解切负荷量。其次,建立了基于Transformer网络的频率控制敏感点挖掘模型,通过分析关键发电机母线节点频率时序值和频率控制敏感点的映射关系,实现响应驱动的频率控制敏感点在线挖掘。最后,按照敏感点排序快速分配控制措施总量,构建频率稳定紧急控制方案。在某实际交直流混联万节点仿真系统验证了所提方法的有效性。 展开更多
关键词 预案式控制 频率稳定 紧急控制 频率响应模型 TRANSFORMER
在线阅读 下载PDF
基于深度神经网络的声波远探测成像图像解释生成方法
8
作者 吴兴能 唐保勇 +6 位作者 张承森 罗生强 郝志强 黄若坤 段文星 陈旭 鲁明宇 《大庆石油地质与开发》 北大核心 2026年第2期131-141,共11页
声波远探测成像技术作为一种“透过井、向远看”的测井利器,近年来在碳酸盐岩裂缝及缝洞探测等领域中发挥着重要作用。然而,由于声波远探测成像解释存在多解性,并且对解释人员的专业背景要求较高,在一定程度上限制了该技术的进一步应用... 声波远探测成像技术作为一种“透过井、向远看”的测井利器,近年来在碳酸盐岩裂缝及缝洞探测等领域中发挥着重要作用。然而,由于声波远探测成像解释存在多解性,并且对解释人员的专业背景要求较高,在一定程度上限制了该技术的进一步应用。提出了一种基于深度神经网络Transformer架构的声波远探测成像图像自动解释生成方法(CNN):针对声波远探测图像特征提取不准确的问题,该方法有效实现了声波远探测成像的自动化解释。首先通过卷积神经网络捕获图像的视觉特征;然后利用Transformer编码器捕捉图像的长距离依赖关系;其次,引入跨模态特征融合模块,增强模型在图像与文本特征之间的映射关系捕捉能力;然后,通过类别记忆特征矩阵学习不同类型的解释报告特征,进一步优化模型的解释效果;最后,将相同种类的文本向量与文本序列进行融合,最终获得能够准确描述井旁地质异常体的地质解释结论。通过现场实例对比分析声波远探测热图成像结果与酸化压裂曲线,验证了该方法的有效性,为大规模成像样本的训练奠定了基础。研究成果为测井图像解释(如电成像、声波远探测成像等)提供了新的研究思路,并具有广泛的应用前景。 展开更多
关键词 声波远探测 深度神经网络 Transformer网络 解释生成
在线阅读 下载PDF
用于低剂量CT图像降噪的多路特征生成对抗网络
9
作者 王丽芳 任文婧 +2 位作者 郭晓东 张荣国 胡立华 《计算机应用》 北大核心 2026年第1期270-279,共10页
近些年,把生成对抗网络(GAN)应用于低剂量计算机断层扫描(LDCT)图像降噪取得了显著进展。然而,现有方法存在对复杂噪声分布建模能力不足以及结构细节保留能力有限等问题。因此,提出一种用于LDCT图像降噪的多路特征GAN——Trident GAN。... 近些年,把生成对抗网络(GAN)应用于低剂量计算机断层扫描(LDCT)图像降噪取得了显著进展。然而,现有方法存在对复杂噪声分布建模能力不足以及结构细节保留能力有限等问题。因此,提出一种用于LDCT图像降噪的多路特征GAN——Trident GAN。首先,设计特征引导生成器Trident Uformer,通过在U-Net结构的瓶颈层增加特征聚合注意力(FPA)模块解决U型结构空间分辨率较低的问题;其次,设计多路特征提取子模块Trident Block,并在3个分支中分别引入局部细节增强模块(LDEB)提取细节特征,轻量通道注意力模块(LCAB)增强通道特征,以及空间交互注意力模块(SIAB)获得重要空间特征;在SIAB中采用多级交互式注意力函数和评估机制设计空间上下文注意力机制(SCAM),解决单一注意力受限的问题;最后,设计多特征融合(MFF)模块来在三分支末端进行特征聚合,并对局部细节信息和全局语义信息进行建模,解决不同层次之间细节不连续的问题。此外,利用多尺度金字塔判别器(MSPD)在不同维度下检查生成结果的质量,指导具有全局一致性图像的生成。实验结果表明,在Mayo和Piglet数据集上,Trident GAN的平均峰值信噪比(PSNR)和结构相似性(SSIM)分别达到了31.5193 dB/0.8830和33.6331 dB/0.9478,与高频敏感GAN(HFSGAN)相比,参数量降低75.58%,测试时间缩短36.36%。可见,与HFSGAN等方法相比,Trident GAN可在较少的计算负荷下提高了图像质量。 展开更多
关键词 低剂量计算机断层扫描 图像降噪 注意力机制 TRANSFORMER 生成对抗网络
在线阅读 下载PDF
一种面向地图综合建筑多边形化简的Transformer模型
10
作者 刘鹏程 成晓强 +2 位作者 肖天元 杨敏 艾廷华 《测绘学报》 北大核心 2026年第1期124-137,共14页
针对地图综合中建筑多边形化简方法依赖人工规则、自动化程度低且难以利用已有化简成果的问题,本文提出了一种基于Transformer机制的建筑多边形化简模型。该模型首先把建筑多边形映射至一定范围的网格空间,将建筑多边形的坐标串表达为... 针对地图综合中建筑多边形化简方法依赖人工规则、自动化程度低且难以利用已有化简成果的问题,本文提出了一种基于Transformer机制的建筑多边形化简模型。该模型首先把建筑多边形映射至一定范围的网格空间,将建筑多边形的坐标串表达为网格序列,从而获取建筑多边形化简前后的Token序列,构建出建筑多边形化简样本对数据;随后采用Transformer架构建立模型,基于样本数据利用模型的掩码自注意力机制学习点序列之间的依赖关系,最终逐点生成新的简化多边形,从而实现建筑多边形的化简。在训练过程中,模型使用结构化的样本数据,设计了忽略特定索引的交叉熵损失函数以提升化简质量。试验设计包括主试验与泛化验证两部分。主试验基于洛杉矶1∶2000建筑数据集,分别采用0.2、0.3和0.5 mm 3种网格尺寸对多边形进行编码,实现了目标比例尺为1∶5000与1∶10000的化简。试验结果表明,在0.3 mm的网格尺寸下模型性能最优,验证集上的化简结果与人工标注的一致率超过92.0%,且针对北京部分区域的建筑多边形数据的泛化试验验证了模型的迁移能力;与LSTM模型的对比分析显示,在参数规模相近的条件下,LSTM模型无法形成有效收敛,并生成可用结果。本文证实了Transformer在处理空间几何序列任务中的潜力,且能够有效复用已有化简样本,为智能建筑多边形化简提供了具有工程实用价值的途径。 展开更多
关键词 地图综合 建筑多边形化简 TOKENIZATION Transformer模型 上下文工程
在线阅读 下载PDF
基于CNN-Transformer架构的电磁传播损耗预测算法
11
作者 万勇 李骏杰 +1 位作者 孙伟峰 戴永寿 《现代电子技术》 北大核心 2026年第6期43-48,共6页
为了解决传统经验传播损耗模型预测精度不足的问题,提出一种基于CNN-Transformer架构的电磁传播损耗预测算法,通过构建回归模型进行精准的传播损耗预测。通过斯皮尔曼系数法提取有效特征,利用CNN提取与传播损耗预测高度相关的浅层特征,... 为了解决传统经验传播损耗模型预测精度不足的问题,提出一种基于CNN-Transformer架构的电磁传播损耗预测算法,通过构建回归模型进行精准的传播损耗预测。通过斯皮尔曼系数法提取有效特征,利用CNN提取与传播损耗预测高度相关的浅层特征,将从卫星图像中获取的传播路径上地物特征序列进行位置编码,增强对传播路径中不同地物特征顺序对传播损耗影响的理解。最后将CNN提取的浅层特征与位置编码后的地物特征输入到Transformer模型,通过多头自注意力机制捕捉特征间的全局关联性,从而有效校正传播损耗的预测结果。实验结果表明,所提出的CNN-Transformer方法显著降低了传播损耗预测的均方根误差(RMSE),达到了3.3745 dB,同时保持了0.8956的较高确定性系数(R^(2))。所提的电磁传播损耗预测算法为无线通信传播特性研究领域提供了参考,具有一定的应用价值。 展开更多
关键词 电磁传播 损耗预测 TRANSFORMER CNN 斯皮尔曼系数法 地物类型 位置编码
在线阅读 下载PDF
基于对比学习和未来特征预测的早期行为识别方法
12
作者 张洪博 陈婕 +3 位作者 郑博圣 刘景华 杜吉祥 孙真真 《计算机学报》 北大核心 2026年第2期447-465,共19页
针对早期行为识别任务中因仅能观测到视频的初始片段、时序信息不完整而导致识别精度受限的问题,本文提出了一种融合对比学习和未来特征预测的早期行为识别方法。该方法基于Transformer架构,设计了面向未来不可观测片段的特征预测模型,... 针对早期行为识别任务中因仅能观测到视频的初始片段、时序信息不完整而导致识别精度受限的问题,本文提出了一种融合对比学习和未来特征预测的早期行为识别方法。该方法基于Transformer架构,设计了面向未来不可观测片段的特征预测模型,并引入对比学习机制以提升预测特征的判别能力。具体而言,该模型首先利用视频特征编码器对可观测片段进行时序建模;随后,采用基于交叉注意力机制的解码器生成未来片段的特征,从而显式建模早期可观测片段与未来片段之间的映射关系。其次,在训练阶段,通过构建“预测未来特征—真实未来特征”作为正样本对、“预测未来特征—早期片段特征”作为负样本对的策略,引入对比损失函数,以增强预测特征与早期特征之间的区分度,进而提升模型性能。本文在Something-Something V2与UCF101两个公开数据集上进行了定量与定性分析。实验结果表明,所提方法在不同观测比例下均优于现有方法,在具有挑战性的Something-Something V2数据集上平均准确率提升了4.96%;在已有方法精度较高的UCF101数据集上,准确率进一步从89.44%提升至90.03%,充分验证了本文引入的对比学习策略与整体模型设计的有效性。同时,实验还表明该方法在提升性能的同时兼顾了模型参数规模,体现出良好的效率和性能平衡。 展开更多
关键词 早期行为识别 对比学习 早期可观测片段 未来特征预测 Transformer模型
在线阅读 下载PDF
融合视觉测量和Transformer的桥梁裂缝智能检测与三维映射
13
作者 余加勇 杨睿韬 +2 位作者 王昱东 彭志豪 周劲 《湖南大学学报(自然科学版)》 北大核心 2026年第3期108-118,共11页
无人机巡检方法已成为桥梁表观病害检测的重要手段.针对无人机(unmanned aerial vehicle,UVA)易受振动干扰、成像质量不稳定、卷积神经网络识别裂缝小目标效果差及裂缝定位困难等问题,提出了融合视觉测量与Transformer的桥梁裂缝智能检... 无人机巡检方法已成为桥梁表观病害检测的重要手段.针对无人机(unmanned aerial vehicle,UVA)易受振动干扰、成像质量不稳定、卷积神经网络识别裂缝小目标效果差及裂缝定位困难等问题,提出了融合视觉测量与Transformer的桥梁裂缝智能检测与三维映射方法,建立基于Real ESRGan图像超分辨率技术的航拍图像采集方法,复原运动模糊图像,实现对高质量桥梁图像的高效采集;在桥梁复杂背景下,通过具有全局注意力机制的Detection Transformer算法和数字图像处理技术,实现对裂缝病害的识别提取与高亮标识;利用多视角影像匹配法处理裂缝高亮标识图片,生成密集点云数据,构建桥梁病害面的精细模型,实现对裂缝病害的三维映射定位.以长沙市靳江河大桥为实验桥梁,使用无人机拍摄2316张桥梁表观图像用于生成三维实景模型,拍摄479张精细图像用于病害检测,使用Real ESRgan超分辨率重建算法对运动模糊图像进行复原,所建立的桥梁病害部位精细模型像素点分辨率达0.25 mm/pixel,裂缝宽度测量最小相对误差为1.37%,最大相对误差为9.90%.结果表明,融合视觉测量和Transformer的桥梁裂缝智能检测与三维映射方法,能够有效提升检测效率,保障人员安全,实现对桥梁裂缝的数字化、智能化、可视化检测,具备重要的研究价值与广阔的应用前景. 展开更多
关键词 桥梁 裂缝检测 无人机 三维建模 TRANSFORMER
在线阅读 下载PDF
基于行列栅格感知Transformer的车道线检测方法
14
作者 陈广秋 刘枫铭 +1 位作者 段锦 黄丹丹 《光学精密工程》 北大核心 2026年第6期953-972,共20页
低光照或光线不均的夜间环境下,道路成像存在车道线可见性低、局部过曝和阴影,现有车道线检测算法多聚焦于提升正常光照环境下的检测能力,忽略了夜间光照环境下的道路特征退化问题,导致算法的精确性和鲁棒性差。针对上述问题,本文在编... 低光照或光线不均的夜间环境下,道路成像存在车道线可见性低、局部过曝和阴影,现有车道线检测算法多聚焦于提升正常光照环境下的检测能力,忽略了夜间光照环境下的道路特征退化问题,导致算法的精确性和鲁棒性差。针对上述问题,本文在编解码语义分割框架下,提出了一种基于行列栅格感知Transformer的车道线检测方法。该方法首先采用光增强曲线模块对输入图像进行光照归一化,通过生成对抗网络实现光照失衡图像到光照分布合理图像的映射,有效抑制噪声与过曝;编码器采用ResNet34网络提取多尺度特征;行列栅格感知Transformer模块通过行、列双向令牌编码显式建模车道线的空间结构与上下文关系,增强模型对几何形变与局部遮挡的鲁棒性;解码器由双边上采样模块与置信度评估模块构成,分别完成特征重建与车道线存在性预测。实验结果表明,本文方法在TuSimple数据集下准确率为96.86%;在CULane数据集下整体场景F1分数为77.5%,其中夜间场景下F1值达到76.7%。本文方法的检测精度优于当前主流车道线检测模型,能有效实现复杂夜间环境下的车道线精准检测。 展开更多
关键词 交通工程 车道线检测 语义分割 TRANSFORMER 栅格感知
在线阅读 下载PDF
基于BSimilar优化PTransformer的光伏功率短期预测
15
作者 张文广 蔡浩 +1 位作者 刘科 孙盼荣 《动力工程学报》 北大核心 2026年第1期77-84,102,共9页
为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据... 为提高光伏功率短期预测的精度,提出了考虑光伏设备性能退化因素的相似日算法优化的分时段多通道独立光伏功率短期预测方法。首先,在PTransformer模型中用分时段与通道独立的方法来处理光伏输入数据,以降低空间复杂度及提高长时间数据序列的关注度。其次,运用Transformer的编码器模型,通过自身注意力机制捕捉光伏序列特征之间的依赖关系,进行光伏功率的短期预测。最后,运用夹角余弦距离计算相似度并考虑光伏设备性能退化因素确定相似日,利用其功率数据优化PTransformer模型,以改善功率数据的滞后性。结果表明:相比典型的光伏功率短期预测方法,所提方法训练速度更快,预测精准度更高,并且对复杂天气状况下的光伏功率也有较好的预测结果。 展开更多
关键词 光伏功率 短期预测 性能退化 贝叶斯分析 TRANSFORMER 相似日
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
16
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
任务提示融合的端到端视觉多任务学习模型
17
作者 耿焕同 范子辰 +2 位作者 蒋骏 刘振宇 李嘉兴 《计算机工程与科学》 北大核心 2026年第3期456-466,共11页
针对现有视觉多任务学习模型中网络结构分离和任务间相互干扰的问题,提出了一种基于三重特征嵌入和任务提示融合的端到端多任务学习模型。在图像嵌入编码阶段,通过采用3组不同的编码模块以捕获图像原始的3种特征,充分保留图像的全局、... 针对现有视觉多任务学习模型中网络结构分离和任务间相互干扰的问题,提出了一种基于三重特征嵌入和任务提示融合的端到端多任务学习模型。在图像嵌入编码阶段,通过采用3组不同的编码模块以捕获图像原始的3种特征,充分保留图像的全局、局部以及轮廓特征,丰富嵌入编码向量结构和语义信息,使得模型可以获取不同特征维度的图像信息。在特征提取阶段,为实现端到端统一的任务通用学习、任务特定学习以及跨任务交互,使用空间-通道提示学习模块和提示融合模块提取图像和任务提示的显著特征、趋势以及原始信息,增强任务提示的表达能力和提示能力,更充分地提取图像和任务提示的全局和局部特征。实验结果表明,与单任务SOTA模型相比,mDS以及RMSE指标分别提高了3.36个百分点和2.41个百分点;而与多任务SOTA模型相比,以上2个指标分别提高了1.69个百分点和0.32个百分点,mIOU提高了0.99个百分点,为多任务学习提供了新的解决方法。 展开更多
关键词 多任务学习 Transformer架构 三维目标检测 语义分割 景深估计
在线阅读 下载PDF
基于多方位感知深度融合检测头的目标检测算法
18
作者 包晓安 彭书友 +3 位作者 张娜 涂小妹 张庆琪 吴彪 《浙江大学学报(工学版)》 北大核心 2026年第1期32-42,共11页
针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用... 针对传统目标检测头难以有效捕捉全局信息的问题,提出基于多方位感知深度融合检测头的目标检测算法.通过在检测头部分设计高效双轴窗口注意力编码器(EDWE)模块,使网络能够深度融合捕获到的全局信息与局部信息;在特征金字塔结构之后使用重参化大核卷积(RLK)模块,减小来自主干网络的特征空间差异,增强网络对中小型数据集的适应性;引入编码器选择保留模块(ESM),选择性地累积来自EDWE模块的输出,优化反向传播.实验结果表明,在规模较大的MS-COCO2017数据集上,所提算法应用于常见模型RetinaNet、FCOS、ATSS时使AP分别提升了2.9、2.6、3.4个百分点;在规模较小的PASCAL VOC2007数据集上,所提算法使3种模型的AP分别实现了1.3、1.0和1.1个百分点的提升.通过EDWE、RLK和ESM模块的协同作用,所提算法有效提升了目标检测精度,在不同规模的数据集上均展现了显著的性能优势. 展开更多
关键词 检测头 目标检测 Transformer编码器 深度融合 大核卷积
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
19
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
改进YOLOv13的红外遥感小目标检测算法
20
作者 李平 陈继锋 《计算机工程与应用》 北大核心 2026年第7期131-142,共12页
为了有效应对红外遥感场景中小目标尺度较小、信噪比低且易被复杂背景淹没等挑战,对YOLOv13模型进行改进,实现实时性和轻量化的检测需求。通过构建多阶特征聚合模块(multi-level feature aggregation module,MFAM),自底向上汇聚不同语... 为了有效应对红外遥感场景中小目标尺度较小、信噪比低且易被复杂背景淹没等挑战,对YOLOv13模型进行改进,实现实时性和轻量化的检测需求。通过构建多阶特征聚合模块(multi-level feature aggregation module,MFAM),自底向上汇聚不同语义深度与空间分辨率的层级信息,并自适应重标定其贡献,以缓解小目标在深层语义中被稀释的问题。设计了双路径融合金字塔网络(dual-path fusion pyramid network,DFPN),以互补的自顶向下语义增强路径与自底向上细节回流路径实现跨尺度信息循环交互,从而强化弱小热目标的可分性。提出的上下文感知融合模块(context-aware fusion block,CAFBlock)采用全局自注意力和局部深度卷积的双分支结构以协同建模长距离依赖与精细局部特征,同时结合膨胀卷积多感受野和深度卷积局部细节的双路径处理方式与门控融合机制,全面增强模型的多尺度上下文建模能力。在SIRST和HIT-UAV数据集上进行对比评估,改进模型实现了90.06%和64.37%的AP,分别提高了7.65个百分点和8.55个百分点,充分验证了模型的有效性和可行性。 展开更多
关键词 红外遥感 YOLOv13 小目标检测 跨尺度 特征融合 TRANSFORMER
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部