期刊文献+
共找到149,520篇文章
< 1 2 250 >
每页显示 20 50 100
基于YOLOv8s多阶段算法的幼猪吮乳行为识别研究
1
作者 陈创业 刘兹豪 +4 位作者 胡天让 谢晓丽 李洋 陈立涛 刘根新 《农机化研究》 北大核心 2026年第3期185-193,共9页
针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助De... 针对幼猪吮乳行为识别精度不足和个体目标跟踪困难的问题,采用以计算机视觉为基础的自动检测体系,整合YOLOv8s、DeepSORT、LSTM 3个算法模块,提出了一种多阶段的行为识别方法。首先,通过YOLOv8s对视频里的幼猪目标进行实时检测,再借助DeepSORT算法来实行跨帧目标追踪并分配唯一标识;然后,把多张连续检测图片输入到LSTM模型里进行时序建模,从而判定出该段时间范围内的幼猪是否正在吮乳。于养殖场的母猪产房拍摄了26 320张照片、采集了4 930组行为序列数据集进行试验,结果表明,在mAP@0.5评价标准下,以YOLOv8s模型为基准的目标检测准确率为91.7%,召回率为92.3%,系统整体追踪准确值(MOTA)达到85.6%,且系统可在复杂的养殖环境下做到稳定运行。将该系统布置到云端平台上,可进行云端处理、数据可视化和远程监控等功能,即时展示每头幼猪的吮乳次数和时长,快速找出进食异常的幼猪个体,优化管理效率。 展开更多
关键词 幼猪行为识别 目标检测 多目标跟踪 时序模型 吮乳监测 智能养殖
在线阅读 下载PDF
基于深度霍夫投票的建筑点云轻量级表面重建
2
作者 陈佳舟 朱肖航 +5 位作者 徐阳辉 高崟 鲁一慧 毛真 李胜龙 章超权 《浙江大学学报(工学版)》 北大核心 2026年第2期341-350,共10页
针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难... 针对实景三维场景中建筑物结构缺失、数据冗余、噪声多等问题,提出新的建筑点云轻量级表面重建方法,进行建筑的多边形网格模型重建.构建高效的建筑数据集生成框架,自动生成包含5500个带标签的建筑模型数据.针对建筑点云中平面提取困难的问题,使用深度霍夫投票预测建筑平面,采用基于面的非极大值抑制算法(F-NMS)有效去除预测的重复面以及错误面.设计建筑平面相邻关系预测模块,对经过非极大值抑制后的建筑平面进行相邻关系的预测.定量实验结果表明,与如PolyFit的传统方法相比,所提方法在拟合精度与场景适应性方面均具有显著优势.使用所提方法重建的建筑多边形网格模型保留了输入建筑点云的主要结构特征,存储量不到原始点云的1%. 展开更多
关键词 三维点云 建筑简化 三维重建 霍夫投票 网格模型
在线阅读 下载PDF
通道注意力指导全局-局部语义协同的表情识别
3
作者 吕景刚 高硕 +1 位作者 李玉芝 周金 《计算机科学》 北大核心 2026年第1期195-205,共11页
情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通... 情感识别领域,数据集常因图像质量不佳而引入噪声,导致识别准确率下降;此外,样本数量有限,导致传统深度学习网络难以高效区分噪声及纯净表情特征。为了解决上述问题,提出了一种新的含噪表情识别框架CAFSC,该框架采用自适应分组排序的通道注意力策略,并结合全局和局部特征的协同机制来提升识别性能。首先,提出了一种抗噪数据增强策略,通过随机高斯模糊、透视变换和色彩扰动等抗噪预处理技术,结合图像拼接、随机翻转和旋转,在保留原始表情的细微特征的同时,提升图像清晰度并丰富数据集多样性和模型在细微情感识别中的鲁棒性。然后,设计了自适应分组排序的通道注意力模块(Channel Attention Module with Adaptive Channel Reordering,CAM-ACR),根据通道注意力函数对通道特征进行重排序,再经分组卷积和拼接获取包含多维度语义信息的局部特征。其次,在局部-全局特征增强机制中,利用局部特征指导优化全局特征的提取,增强全局特征对复杂情感模式和上下文信息的表征能力。最后,将局部特征与全局特征输入改进的交叉注意力融合模块,实现全局与局部特征之间的双向引导与协同增强。实验结果表明,所提方法在RAF-DB,CK+,FER2013和FER2013PLUS数据集上准确率分别达到91.21%,98.31%,74.54%和86.74%,在RAF-DB上学习效率和收敛稳定性均有优势^(1)。 展开更多
关键词 表情识别 局部特征 全局特征 注意力机制 噪声对抗
在线阅读 下载PDF
用于鱼眼图像自适应矫正的注意力金字塔网络
4
作者 张博 李雪 +4 位作者 王白阳 李光健 王国平 潘杨 朱磊 《电光与控制》 北大核心 2026年第1期106-111,共6页
针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增... 针对鱼眼镜头拍摄图像存在畸变,影响其在目标检测、图像分割等计算机视觉任务中的应用问题,提出了一种用于鱼眼图像自适应矫正的注意力金字塔网络(APFC-Net)。首先,为解决卷积层中特征图缩放导致的边缘和角落信息丢失问题,构建了注意增强空间金字塔(AASP)模块以加强特征提取;其次,考虑到不同区域的畸变程度差异,在失真矫正阶段引入可变形卷积,以自适应处理不同程度的畸变;最后,为解决失真矫正过程中信息细节丢失导致的图像模糊问题,在编码阶段嵌入SimAM注意力机制,以专注图像关键区域。仿真结果表明:APFC-Net在Place 2数据集上优于MLC和SimFIR等方法;相较于PCN方法,其PSNR和SSIM分别提升9.11%和27.14%,验证了模型在图像矫正中的有效性。 展开更多
关键词 鱼眼图像 畸变矫正 机器视觉 深度学习
在线阅读 下载PDF
基于Swin-PIDNet的纸质工程制图线型识别方法
5
作者 朱文博 陈龙飞 迟玉伦 《计算机应用研究》 北大核心 2026年第1期313-320,共8页
识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模... 识别纸质工程制图图像的难点主要在于线型识别,针对纸质工程制图线型规范性差、跨度长、相对于背景图像尺寸小等问题,提出一种纸质工程制图线型识别Swin-PIDNet模型。用Swin Transformer替换PIDNet主干网络,在减少下采样的同时增强了模型长程建模能力;提出一种逐阶段解冻的迁移学习方法,提升模型对线型识别的训练效率和精度,平滑模型训练过程;针对工程制图线型的细长特征,嵌入注意力模块EMA到PAHDC模块中,从而改善背景信息淹没线型特征信息的问题;为处理线型类别不平衡问题,将Focal loss和Dice loss通过加权结合构建Swin-PIDNet的训练损失函数。实验证明该模型的评价指标MIoU为87.02%、MPA为95.42%、F 1分数为96.57%,相较于其他模型,该模型具有较强的线型识别能力,对纸质工程制图图像识别具有理论研究意义和实际应用价值。 展开更多
关键词 PIDNet Swin Transformer 线型识别 纸质工程制图 迁移学习 混合空洞卷积
在线阅读 下载PDF
基于轻量化SuperPoint网络的水下光学图像特征提取
6
作者 刘艳 朱昌盛 +1 位作者 余彬 霍冠英 《河海大学学报(自然科学版)》 北大核心 2026年第1期167-176,共10页
针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意... 针对水下光学图像质量下降导致的图像配准、三维重建等水下视觉任务中特征提取鲁棒性差的问题,提出了一种轻量化SuperPoint网络,该网络针对水下光学图像普遍存在颜色失真、模糊等细节退化问题,利用注意力机制,构建频域-空间域动态注意力融合模块,融合频域与空间域的特征信息,提升网络在水下退化图像中的特征提取能力;构建残差特征增强深度可分离卷积模块,以降低模型复杂度并增强网络的特征提取能力。验证结果表明:该网络较SuperPoint网络参数量减少了13.8%,计算量降低了8.0%,帧率提升31.7%,光照变化和视角变化下的重复率分别提高了2.3%和2.1%,在SQUID和FLSea数据集上的特征点检测与匹配性能评估中具有较好的特征提取鲁棒性。 展开更多
关键词 水下光学图像 SuperPoint网络 轻量化网络 特征提取 特征融合
在线阅读 下载PDF
基于改进RT-DETR的有遮挡交通标志检测算法
7
作者 于天河 杨壮壮 +2 位作者 胡金帅 常梦瑶 王文龙 《工程科学学报》 北大核心 2026年第2期393-408,共16页
针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏... 针对交通标志检测中目标尺寸小、检测精度低等问题,尤其是在远距离拍摄、遮挡严重的情况下,传统检测算法往往难以准确识别交通标志.本文提出了一种基于改进RT-DETR的交通标志检测算法.首先,考虑到当前交通标志被遮挡情况下数据集的匮乏,自建一个遮挡条件下的交通标志数据集.然后,在反向残差移动块中引入膨胀重参数块,构建了一个轻量级的复合膨胀残差块来替换原始主干提取网络中的BasicBlock,增强了模型的特征提取能力.最后,对RT-DETR模型的损失函数进行了优化,提出了DS-IoU联合损失函数加快收模型敛速度.实验结果表明,改进后的算法在自制数据集上的m AP为94.2%,相比于原始算法增加量为4.7%,在公开数据集TT100K和CCTSDB2021的m AP分别为92.8%和91.7%,相比于原始算法增加量分别为3.1%和2.4%,Params和GFLOPs相比于原始的算法分别降低了26.0%和12.5%.本文提出的改进方法极大地减少了计算量和参数数量,有效提升了遮挡情况下的交通标志的检测精度. 展开更多
关键词 交通标志检测 RT-DETR 遮挡数据集 轻量化 联合损失函数
在线阅读 下载PDF
频域空间信息驱动的特征聚合跨模态行人重识别方法
8
作者 金静 朱传斌 翟凤文 《计算机应用研究》 北大核心 2026年第1期298-304,共7页
跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信... 跨模态行人重识别旨在匹配可见光与红外不同模态下的行人图像,该任务的核心挑战是缓解可见光与红外模态间差异并提取具有鉴别力的共享特征。然而,现有方法在最小化模态间差异和提取模态共享特征过程中,未能充分利用数据增强后的模态信息且忽略了不同尺度特征语义关联性,提出一种基于频域空间信息的特征聚合(FDSIFA)网络。首先,通过设计的多分支频域空间感知模块(MFSPM),对不同模态的增强图像和原始图像充分提取模态特定信息,同时在频域和空间维度上挖掘跨模态特征的一致性,有效减小了模态间的差异;其次,设计了多阶段特征聚合模块(MFAM),自适应聚合不同尺度的特征,挖掘低层次特征与高层次特征之间的语义关联,提升特征的语义表达能力和判别力。该网络在SYSU-MM01数据集的全搜索模式下,rank-1和mAP分别达到了75.09%和71.35%,优于对比方法,实验结果验证了所提方法的有效性。 展开更多
关键词 跨模态 行人重识别 数据增强 频域空间信息 特征聚合
在线阅读 下载PDF
基于改进YOLO11n模型的自动驾驶道路交通检测算法研究
9
作者 田晟 赵凯龙 苗佳霖 《广西师范大学学报(自然科学版)》 北大核心 2026年第1期1-9,共9页
随着自动驾驶技术的快速发展,道路交通检测作为感知模块的核心任务,直接影响自动驾驶系统的安全性与可靠性,当前基于深度学习方法作为研究的热点,却仍存在检测精度低、模型泛化性差等问题。为解决这些问题,本文提出一种改进YOLO11n模型... 随着自动驾驶技术的快速发展,道路交通检测作为感知模块的核心任务,直接影响自动驾驶系统的安全性与可靠性,当前基于深度学习方法作为研究的热点,却仍存在检测精度低、模型泛化性差等问题。为解决这些问题,本文提出一种改进YOLO11n模型的道路交通检测方法。该方法通过增加小目标检测层提高对小目标的检测精度,引入GhostConv+DWConv检测头结构,组合优化现有的双DWConv结构,并设计更适合小目标的Inner-CIoU损失函数,增强模型的泛化性,提高边界框回归的准确性。实验结果显示,与现有YOLO11n算法相比,该模型在KITTI和BDD100K数据集上的检测精度分别提升1.1个百分点和1.9个百分点,并达到125帧/s和124帧/s的检测速度,提升了低分辨率小目标检测的有效性,在不同交通场景下具有良好的泛化性。 展开更多
关键词 自动驾驶 小目标检测 YOLO11 多尺度检测 损失函数
在线阅读 下载PDF
自适应区域生长耦合神经P系统的图像分割方法
10
作者 许家昌 叶栩秀 《计算机应用研究》 北大核心 2026年第1期280-290,共11页
针对耦合神经P系统利用脉冲机制实现区域生长依赖于初始种子点选择的问题,提出一种自适应区域生长耦合神经P系统(adaptive region growing coupled neural P systems,ARGCNP)的图像分割方法。该方法利用金豺优化算法(golden jackal opti... 针对耦合神经P系统利用脉冲机制实现区域生长依赖于初始种子点选择的问题,提出一种自适应区域生长耦合神经P系统(adaptive region growing coupled neural P systems,ARGCNP)的图像分割方法。该方法利用金豺优化算法(golden jackal optimization,GJO)的全局搜索能力,通过引入四种策略提升GJO的全局寻优性能,从而在图像中寻找最佳阈值点,以优化区域生长中的种子点选择。在实验中,首先通过CEC2017测试函数对改进后的GJO进行性能测试,结果表明改进后的GJO在测试函数上整体性能第一;随后将ARGCNP应用于分割彩色图像和医学图像,以峰值信噪比等三个指标对分割效果进行量化评价,分割结果显示该方法能够提升分割精度及分割结果的稳定性,证明ARGCNP在应用场景下具有的优势,能够满足图像分割需求。 展开更多
关键词 图像分割 金豺优化算法 耦合神经P系统 区域生长
在线阅读 下载PDF
基于几何锚点引导的双阶段配准算法研究
11
作者 高春甫 谭景益 +1 位作者 贺新升 周崇秋 《浙江师范大学学报(自然科学版)》 2026年第1期9-15,共7页
针对列车轮对踏面点云配准中重叠区域有限、曲率变化较小导致特征不显著的问题,提出了一种基于几何锚点引导的双阶段配准方法.首先,对源点云与目标点云进行区域分割,提取具有结构信息的有效区域;其次,利用罗德里格斯旋转投影点云至拟合... 针对列车轮对踏面点云配准中重叠区域有限、曲率变化较小导致特征不显著的问题,提出了一种基于几何锚点引导的双阶段配准方法.首先,对源点云与目标点云进行区域分割,提取具有结构信息的有效区域;其次,利用罗德里格斯旋转投影点云至拟合平面,以增强几何特征表达;然后,结合轮对踏面的结构特征提取特征锚点;最后,通过引入几何锚点约束,设计双阶段ICP算法实现高精度配准.实验结果表明,该方法将测量的关键尺寸精度控制为0.2 mm,其在提升踏面轮廓重建完整性与尺寸测量精度方面具有显著优势.该结果可为列车轮对检测与维护提供可靠的技术支撑. 展开更多
关键词 轨道交通 非接触测量 点云配准 轮对踏面 几何锚点
在线阅读 下载PDF
基于改进DeepLabV3+网络的黄瓜叶片病斑分割算法
12
作者 唐卫东 陈冠华 +2 位作者 谭显明 刘灵辉 刘秋明 《井冈山大学学报(自然科学版)》 2026年第1期68-78,共11页
叶片病斑是影响瓜果等农作物品质和产量的重要因素,病斑分割有助于精准识别病害,并为果农提供科学防治策略。由于叶片病斑边缘较模糊且具有反光特性,运用现有方法却难以达到理想的分割效果,本研究以黄瓜为研究对象,提出一种基于改进Deep... 叶片病斑是影响瓜果等农作物品质和产量的重要因素,病斑分割有助于精准识别病害,并为果农提供科学防治策略。由于叶片病斑边缘较模糊且具有反光特性,运用现有方法却难以达到理想的分割效果,本研究以黄瓜为研究对象,提出一种基于改进DeepLabV3+网络的叶片病斑分割算法。首先将原Xception主干网络替换为更轻量化的MobileNetV2网络;其次将密集连接(DenseNet)思想应用于ASPP结构,构造一个基于密集连接的空洞空间金字塔池化(DenseASPP),通过扩大网络感受野来提升对多尺度目标的分割性能,同时在DenseASPP后引入SENet通道注意力机制,以增强模型的特征表达能力;最后将主干网络所提取的各阶段特征图依次与深层特征图拼接,从而充分利用各阶段特征图中的特征信息。在黄瓜病害叶片数据集上对模型进行测试训练,结果表明该算法在sensitivity、specificity、Dice、accuracy等评价指标上分别达到90.55%、98.03%、85.43%、97.31%,相较其他主流方法,其分割精度都有显著提高,且具有良好的泛化能力。该算法能够适用于不同作物的叶片病斑分割,还可以为作物病害防治提供参考。 展开更多
关键词 图像分割 DeepLabV3+ 密集连接 注意力机制
在线阅读 下载PDF
前视声呐三维视觉里程计技术
13
作者 张博鸣 徐超 +1 位作者 杜伟东 周天 《声学学报》 北大核心 2026年第1期216-231,共16页
针对水下航行器的三维运动估计问题,提出了一种基于前视声呐的三维视觉里程计框架,包含特征提取、高程图恢复与三维运动估计三个主要模块。在特征提取部分,通过基于马氏距离的滑动窗算法与局部二值拟合水平集算法相结合,实现对目标轮廓... 针对水下航行器的三维运动估计问题,提出了一种基于前视声呐的三维视觉里程计框架,包含特征提取、高程图恢复与三维运动估计三个主要模块。在特征提取部分,通过基于马氏距离的滑动窗算法与局部二值拟合水平集算法相结合,实现对目标轮廓的精细化分割,并基于目标的灰度分布特征与梯度特性构建目标–阴影对;在高程图恢复部分,基于Lambert漫反射模型构建非线性方程组,迭代求解目标内点高程;在三维运动估计部分,使用相干点漂移点云配准方法对高程图进行配准,求解三维运动参数。仿真和实测结果表明,所提方法较对比方法在平均误差、累计误差及均方根误差等评价指标上均表现出更优的性能,显著提升了运动估计的准确性和可靠性。 展开更多
关键词 前视声呐 三维运动估计 视觉里程计 高程估计
原文传递
基于动态优化细节感知网络的遥感图像分割方法
14
作者 梁书绮 王雷 +2 位作者 孙燕青 杨善良 李彬 《工程科学学报》 北大核心 2026年第1期177-189,共13页
现有的遥感图像分割模型,例如基于卷积神经网络(Convolutional neural network,CNN)和基于Transformer框架的模型,取得了巨大成功,但是还存在难以完整保留原始编码器特征图细节、动态捕捉全局上下文信息等缺点.因此,基于CNN-Transforme... 现有的遥感图像分割模型,例如基于卷积神经网络(Convolutional neural network,CNN)和基于Transformer框架的模型,取得了巨大成功,但是还存在难以完整保留原始编码器特征图细节、动态捕捉全局上下文信息等缺点.因此,基于CNN-Transformer混合框架,提出了一种全新的基于动态优化细节感知网络(Dynamic optimized detail-aware network,DODNet)的分割方法.首先,在编码器采用ResNext-50作为主干网络,提出一种多重减法感知模块(Multi-subtraction perception module,MSPM)来收集多尺度特征图之间的空间细节差异,有效减少冗余信息.然后,在解码器设计一个动态信息融合模块(Dynamic information fusion block,DIFB),它结合了全局双层路由自注意力分支和局部注意力分支,用于提高全局和局部信息的获取能力.最后,提出一种新的通道空间注意力模块—统一特征提取器(Unified feature extractor,UFE)以进一步获取语义和上下文信息.在Vaihingen、Potsdam和LoveDA三个经典公开数据集,通过对比和消融实验的定量和可视化分析表明,所提方法在F1分数、总体精度(Over accuracy,OA)和平均交并比(Mean intersection over union,mIoU)评价指标中优于十种最先进的分割方法,其中平均交并比分别达到了84.96%、87.64%和52.43%,验证了所提方法在分割具有复杂背景、内类方差大和类间方差小问题的高分辨率遥感图像的优越性能. 展开更多
关键词 遥感图像 语义分割 CNN-Transformer框架 动态Transformer 多尺度减法
在线阅读 下载PDF
基于强监督数据增强的双阶段扎把烟叶分级模型
15
作者 廖文静 黄剑满 +2 位作者 杨洋 和红杰 陈帆 《南京信息工程大学学报》 北大核心 2026年第1期48-59,共12页
以“扎把”作为烟叶分级单位是提高烟叶收购效率的关键策略.由于扎把烟叶间遮挡和卷曲等特性,现有主流分类方法难以准确提取其细粒度分级特征.为此,本文提出了一种基于强监督数据增强的双阶段扎把烟叶分级模型,以渐进式的方式实现扎把... 以“扎把”作为烟叶分级单位是提高烟叶收购效率的关键策略.由于扎把烟叶间遮挡和卷曲等特性,现有主流分类方法难以准确提取其细粒度分级特征.为此,本文提出了一种基于强监督数据增强的双阶段扎把烟叶分级模型,以渐进式的方式实现扎把烟叶精确分级.首先,设计双重注意力残差网络自适应融合多维度特征来提取粗粒度信息,提出软通道注意力模块生成反映扎把烟叶关键部位的注意力图,实现对扎把烟叶的粗分级.然后,为了促进网络关注差异性细粒度特征,以粗分级注意力图为指导对全局图做强监督数据增强,获得具有辨别性特征的局部图,从而实现更精细的分级结果.本文将所提方法与当前主流的通用分类方法及细粒度分类方法在扎把烟叶数据集上进行了对比实验.实验结果表明,本文所提方法的分级准确率和macro-F1指标均达到了98.54%,显著优于对比方法,能够较好地满足工业扎把烟叶分级的实际需求. 展开更多
关键词 烟叶分级 扎把烟叶 细粒度特征 强监督数据增强
在线阅读 下载PDF
基于改进YOLOv5s的绝缘子缺陷检测方法
16
作者 彭晏飞 袁晓龙 +1 位作者 赵涛 陈炎康 《高压电器》 北大核心 2026年第1期134-142,共9页
基于无人机航拍的电力巡检成为目前绝缘子缺陷检测方法的主流,但当遇到图像特征不够明显或干扰特征较多等问题时,绝缘子缺陷识别困难,检测精度不高。由此,提出了一种基于改进YOLOv5s的绝缘子缺陷检测方法。首先,重新设计卷积模块,然后... 基于无人机航拍的电力巡检成为目前绝缘子缺陷检测方法的主流,但当遇到图像特征不够明显或干扰特征较多等问题时,绝缘子缺陷识别困难,检测精度不高。由此,提出了一种基于改进YOLOv5s的绝缘子缺陷检测方法。首先,重新设计卷积模块,然后将CA注意力机制与其相融合,并且在主干网络加入注意力机制与颈部网络的特征图进行多尺度特征融合,抑制复杂环境下的干扰特征,专注缺陷特征提取;其次,对空间金字塔池化结构(SPPF)进行改进,扩大感受野,减少被模型过滤掉的有用信息;接着,将Transformer与C3模块中的残差结构(Bottleneck)相结合,增强模型对绝缘子缺陷特征的识别能力;最后,使用K-means算法对数据集进行聚类分析,重新计算最适合的锚框尺寸。在数据集上进行验证,改进后的方法平均精度达到97.4%,召回率达到94.8%,均值平均精度为97.6%,该方法有效提升了复杂环境下的绝缘子缺陷检测能力,进一步满足了对绝缘子缺陷检测精度的需求。 展开更多
关键词 YOLOv5s 绝缘子 注意力机制 缺陷检测 SPPF
在线阅读 下载PDF
基于二分假设端到端深度学习的ADHD辅助诊断
17
作者 郇战 张玉龙 +1 位作者 陈瑛 王乐乐 《郑州大学学报(工学版)》 北大核心 2026年第1期81-87,共7页
在注意缺陷多动障碍(ADHD)的辅助诊断研究中,很多ADHD分类方法存在模型不能一体化或缺乏生物学解释的问题。为此,提出一种基于二分假设端到端深度学习的ADHD分类模型。在二分假设框架下,选择边缘系统相关的低频波动振幅数据作为输入特征... 在注意缺陷多动障碍(ADHD)的辅助诊断研究中,很多ADHD分类方法存在模型不能一体化或缺乏生物学解释的问题。为此,提出一种基于二分假设端到端深度学习的ADHD分类模型。在二分假设框架下,选择边缘系统相关的低频波动振幅数据作为输入特征,并设置注意力模块,使得网络重点关注分类贡献高的特征。模型整体形成端到端结构,而不是传统的深度学习和机器学习结合的结构。此外,完成检测生物标识的任务,提供生物学解释。在ADHD-200数据库的留一交叉验证实验中,4个子数据库上的平均准确率达到98.1%。随后,在边缘系统上进行ADHD生物标识的统计与分析,得到的ADHD生物标识分别为前扣带与旁扣带脑回、右杏仁核、嗅皮质和左杏仁核,这些结果证实了基于二分假设端到端深度学习模型的合理性。 展开更多
关键词 注意缺陷多动障碍 二分假设 低频波动振幅 端到端结构 生物标识
在线阅读 下载PDF
基于卷积神经网络的高分辨率遥感影像目标边界提取方法
18
作者 王小红 《现代电子技术》 北大核心 2026年第1期49-53,共5页
为有效应对高分辨率遥感影像遮挡、旋转等因素对目标边界提取效果的影响,文中提出基于卷积神经网络(CNN)的高分辨率遥感影像目标边界提取方法。以卷积神经网络实现高分辨率遥感影像目标边界提取框架为基础,引入了特征增强模块,避免网络... 为有效应对高分辨率遥感影像遮挡、旋转等因素对目标边界提取效果的影响,文中提出基于卷积神经网络(CNN)的高分辨率遥感影像目标边界提取方法。以卷积神经网络实现高分辨率遥感影像目标边界提取框架为基础,引入了特征增强模块,避免网络目标边界浅层、深层特征提取时存在语义信息的表征不足以及丢失细节信息问题;同时,优化网络损失函数,通过预处理目标边界图,将其转化为边界信息的概率图,并设定阈值来排除不确定性像素点,增强模型目标边界提取鲁棒性和精确度。实验结果显示,该方法可实现目标边界精准提取且不易受遥感影像旋转影响,在不同遮挡程度下均具备较为优异的目标边界提取能力。 展开更多
关键词 卷积神经网络 高分辨率遥感影像 目标边界提取 深层特征 特征增强 边界概率图
在线阅读 下载PDF
基于细粒度特征增强的多模态视觉问答研究
19
作者 王志伟 陆振宇 《南京信息工程大学学报》 北大核心 2026年第1期35-47,共13页
现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视... 现有多模态视觉问答(Visual Question Answering,VQA)模型忽略了图像中局部显著信息与文本中局部基本词之间的细粒度交互作用,图像与文本之间的语义相关性有待提高.为此,本文提出一种基于细粒度特征增强的多模态视觉问答方法.首先,对视觉和文本分别增加一种细粒度特征提取方法,以便更全面准确地提取图像和问题的语义特征;然后,为了利用不同层次模态之间的对齐信息,提出一种对齐引导的自注意力模块来对齐单一模态内(视觉或文本)细粒度特征和全局语义特征之间的对应关系,并以统一的方式融合不同层次的单模态信息;最后,在VQA v2.0和VQA-CP v2数据集上进行实验,结果表明,本文所提方法在各项视觉问答评估指标上的表现优于现有的模型. 展开更多
关键词 视觉问答 多模态 细粒度 特征增强 实体对齐 特征融合
在线阅读 下载PDF
自动化装车系统粗-精视觉定位引导技术研究
20
作者 郑元杰 李春奇 +3 位作者 张岩 王剑琨 朱人杰 宋新伟 《工业控制计算机》 2026年第1期6-8,共3页
自动化装车撬与槽车气液相法兰的自动对接技术,其核心挑战在于槽车气液相法兰的精确识别与定位。实际应用中,由于定位距离较远、光照条件变化以及近距离装车臂对槽车法兰的遮挡等问题,传统的定位方法难以满足需求。为此,提出了一种结合... 自动化装车撬与槽车气液相法兰的自动对接技术,其核心挑战在于槽车气液相法兰的精确识别与定位。实际应用中,由于定位距离较远、光照条件变化以及近距离装车臂对槽车法兰的遮挡等问题,传统的定位方法难以满足需求。为此,提出了一种结合激光雷达粗定位与反光Aruco标签间接精确定位法兰的组合定位策略。该策略通过激光雷达实现初步定位,再利用反光Aruco标签进行高精度法兰定位,有效解决了大空间环境下槽车法兰的定位难题。实验结果表明,该定位系统功能测试结果符合设计要求,具备较高的实用性和可靠性。 展开更多
关键词 法兰 激光雷达 Aruco标签 视觉定位
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部