期刊文献+
共找到347篇文章
< 1 2 18 >
每页显示 20 50 100
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:7
1
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
在线阅读 下载PDF
EYE-YOLO: a multi-spatial pyramid pooling and Focal-EIOU loss inspired tiny YOLOv7 for fundus eye disease detection
2
作者 Akhil Kumar R.Dhanalakshmi 《International Journal of Intelligent Computing and Cybernetics》 2024年第3期503-522,共20页
Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically fo... Purpose:The purpose of this work is to present an approach for autonomous detection of eye disease in fundus images.Furthermore,this work presents an improved variant of the Tiny YOLOv7 model developed specifically for eye disease detection.The model proposed in this work is a highly useful tool for the development of applications for autonomous detection of eye diseases in fundus images that can help and assist ophthalmologists.Design/methodology/approach:The approach adopted to carry out this work is twofold.Firstly,a richly annotated dataset consisting of eye disease classes,namely,cataract,glaucoma,retinal disease and normal eye,was created.Secondly,an improved variant of the Tiny YOLOv7 model was developed and proposed as EYE-YOLO.The proposed EYE-YOLO model has been developed by integrating multi-spatial pyramid pooling in the feature extraction network and Focal-EIOU loss in the detection network of the Tiny YOLOv7 model.Moreover,at run time,the mosaic augmentation strategy has been utilized with the proposed model to achieve benchmark results.Further,evaluations have been carried out for performance metrics,namely,precision,recall,F1 Score,average precision(AP)and mean average precision(mAP).Findings:The proposed EYE-YOLO achieved 28%higher precision,18%higher recall,24%higher F1 Score and 30.81%higher mAP than the Tiny YOLOv7 model.Moreover,in terms of AP for each class of the employed dataset,it achieved 9.74%higher AP for cataract,27.73%higher AP for glaucoma,72.50%higher AP for retina disease and 13.26%higher AP for normal eye.In comparison to the state-of-the-art Tiny YOLOv5,Tiny YOLOv6 and Tiny YOLOv8 models,the proposed EYE-YOLO achieved 6:23.32%higher mAP.Originality/value:This work addresses the problem of eye disease recognition as a bounding box regression and detection problem.Whereas,the work in the related research is largely based on eye disease classification.The other highlight of this work is to propose a richly annotated dataset for different eye diseases useful for training deep learning-based object detectors.The major highlight of this work lies in the proposal of an improved variant of the Tiny YOLOv7 model focusing on eye disease detection.The proposed modifications in the Tiny YOLOv7 aided the proposed model in achieving better results as compared to the state-of-the-art Tiny YOLOv8 and YOLOv8 Nano. 展开更多
关键词 Tiny YOLOv7 spatial pyramid pooling Focal-EIOU loss Eye disease detection
在线阅读 下载PDF
DrownACB-YOLO:an Improved YOLO for Drowning Detection in Swimming Pools
3
作者 ZENG Xiaoya XU Wujun ZHANG Xiunian 《Journal of Donghua University(English Edition)》 2025年第4期417-424,共8页
With the rise in drowning accidents in swimming pools,the demand for the precision and speed in artificial intelligence(AI)drowning detection methods has become increasingly crucial.Here,an improved YOLO-based method,... With the rise in drowning accidents in swimming pools,the demand for the precision and speed in artificial intelligence(AI)drowning detection methods has become increasingly crucial.Here,an improved YOLO-based method,named DrownACB-YOLO,for drowning detection in swimming pools is proposed.Since existing methods focus on the drowned state,a transition label is added to the original dataset to provide timely alerts.Following this expanded dataset,two improvements are implemented in the original YOLOv5.Firstly,the spatial pyramid pooling(SPP)module and the default upsampling operator are replaced by the atrous spatial pyramid pooling(ASPP)module and the content-aware reassembly of feature(CARAFE)module,respectively.Secondly,the cross stage partial bottleneck with three convolutions(C3)module at the end of the backbone is replaced with the bottleneck transformer(BotNet)module.The results of comparison experiments demonstrate that DrownACB-YOLO performs better than other models. 展开更多
关键词 drowning detection YOLO atrous spatial pyramid pooling(ASPP) content-aware reassembly of feature(CARAFE)
在线阅读 下载PDF
基于多模态融合的抗噪声故障诊断方法
4
作者 宋庆军 孙世荣 +3 位作者 宋庆辉 陆丽娜 陈俊龙 姜海燕 《机电工程》 北大核心 2025年第11期2129-2140,共12页
随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角... 随着工业设备运行环境日益复杂,在噪声环境下的故障诊断中,单一模态的数据往往无法提供全面且准确的故障信息,为此,提出了基于多模态融合的抗噪声故障诊断方法(MMFD),旨在提高噪声干扰环境下的故障诊断性能。首先,分别使用了改进型GAF角场(GAGM)转换方法和变分模态分解(VMD)对振动信号进行了预处理;然后,时序信号通过双向门控循环单元(BIGRU)与多头注意力机制(MA)协同捕获动态时序特征;接着,将振动信号编码为二维图谱,并设计了多尺度卷积网络(MCNN)集成空洞空间金字塔池化(ASPP)和卷积注意力模块(CBAM),以提取空间深层特征;为强化跨模态特征融合,设计了特征交互网络(FIN)实现时频特征的深度交互,并构建了门控多模态单元(GMU)动态加权多源特征,挖掘了多模态数据间的互补信息;最后,采用了凯斯西储大学轴承故障数据集进行了多组鲁棒性实验。研究结果表明:在强噪声环境(信噪比为-6 dB)下,MMFD相比于其他故障诊断方法,诊断准确率提升超过10%;此外,MMFD在不同信噪比下均能保持80%以上的准确率。该研究为复杂噪声环境中的智能故障诊断提供了一种新的思路。 展开更多
关键词 格拉姆角场 空洞空间金字塔池化模块 多头注意力机制 双向门控循环单元 卷积注意力模块 特征交互网络 门控多模态单元
在线阅读 下载PDF
DCA-YOLO:Detection Algorithm for YOLOv8 Pulmonary Nodules Based on Attention Mechanism Optimization 被引量:1
5
作者 SONG Yongsheng LIU Guohua 《Journal of Donghua University(English Edition)》 2025年第1期78-87,共10页
Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially... Pulmonary nodules represent an early manifestation of lung cancer.However,pulmonary nodules only constitute a small portion of the overall image,posing challenges for physicians in image interpretation and potentially leading to false positives or missed detections.To solve these problems,the YOLOv8 network is enhanced by adding deformable convolution and atrous spatial pyramid pooling(ASPP),along with the integration of a coordinate attention(CA)mechanism.This allows the network to focus on small targets while expanding the receptive field without losing resolution.At the same time,context information on the target is gathered and feature expression is enhanced by attention modules in different directions.It effectively improves the positioning accuracy and achieves good results on the LUNA16 dataset.Compared with other detection algorithms,it improves the accuracy of pulmonary nodule detection to a certain extent. 展开更多
关键词 pulmonary nodule YOLOv8 network object detection deformable convolution atrous spatial pyramid pooling(ASPP) coordinate attention(CA)mechanism
在线阅读 下载PDF
改进U-Net模型的隧道掌子面图像语义分割研究
6
作者 陈登峰 程静 +1 位作者 赵蕾 何拓航 《防灾减灾工程学报》 北大核心 2025年第4期776-783,共8页
隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征... 隧道掌子面岩体结构是判断岩土工程地质条件、制定施工和支护方案、预防塌方及涌水等事故的直观依据。将U-Net模型应用于掌子面岩体结构图像分割与识别时,下采样过程中缩小图像尺寸会导致岩体部分细节信息丢失,上采样过程中将低层特征传递到高层的跳跃连接导致特征映射过大。因此,提出加入空洞空间卷积池化金字塔模块ASPP和卷积注意力模块CBAM的改进U-Net模型。在U-Net模型的跳跃连接过程中加ASPP,利用不同膨胀率的空洞卷积捕获不同尺度的上下文信息,融合不同感受野的信息,从而更全面的理解图像内容;U-Net模型的下采样过程中加入CBAM,使网络模型更加关注有用的特征,从而增强特征的表达能力。实验结果表明,改进的网络模型相较于原始U-Net模型分割和识别性能有显著提升,在某隧道工程掌子面岩体图像数据集上Precision达到93.04%,mIoU达到74.98%,mPA达到78.89%。 展开更多
关键词 隧道掌子面 图像语义分割 卷积注意力模块 空洞空间卷积池化金字塔模块
原文传递
基于多尺度特征融合与重构卷积的肝肿瘤图像分割方法
7
作者 马金林 酒志青 +4 位作者 马自萍 夏明格 张凯 程叶霞 马瑞士 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期94-108,共15页
针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核... 针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核重构模块,使编码器保留更多的细节信息,并使解码器能更有效地恢复信息,以提升肝肿瘤图像特征的表达能力。然后,为丰富全局上下文信息的传递,设计了三分支空间金字塔池化模块来优化瓶颈结构的信息传递,打破单一路径的限制。接着,设计了多尺度特征融合模块来优化编码器信息的复用机制,增强模型对全局上下文信息的建模能力,并提升其在提取不同尺度肝肿瘤图像特征时的效能。最后,在LiTS2017和3DIRCADb数据集上对该文方法的性能进行了测试。实验结果表明:在LiTS2017数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.56%和95.25%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.71%和81.58%;在3DIRCADb数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.63%和95.39%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.62%和81.63%。 展开更多
关键词 肝肿瘤图像分割 卷积核重构 空间金字塔池化 多尺度特征融合
在线阅读 下载PDF
增强人体关键点特征的姿态估计算法
8
作者 刘赏 代娆 +1 位作者 周煜炜 董林芳 《计算机辅助设计与图形学学报》 北大核心 2025年第9期1607-1618,共12页
二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进... 二维多人姿态估计是计算机视觉中一项具有挑战性的任务,其中基于回归的单阶段方法大多缺乏对多人姿态特征学习的针对性,对人体关节结构特征提取能力不足和关键点位置特征融合能力不足.针对上述人体关键点特征约束能力不足的问题进行改进,提出一种增强人体关键点特征的算法.首先基于MixFormer思想给出多头自注意力机制和深度卷积并行的策略,以增强人体姿态的局部和全局特征,在获取高质量视觉表征的同时学习更多的人体关节结构信息;然后给出坐标注意力机制和空洞空间卷积池化金字塔串行融合策略,先将人体姿态特征进行拆分来捕获跨通道信息,再采用空洞卷积扩大感受野,减少小目标信息的丢失,提高多尺度特征融合能力;最后结合YOLO-Pose算法进行姿态估计.在2个数据集上进行实验的结果表明, COCO2017数据集上,所提算法的AP值提高0.9个百分点, AR值提高1.2个百分点;OC_Human遮挡数据集上, AP值提高2.3个百分点;该算法可以在保证运行速度的同时增强人体关键点特征,提高整体性能. 展开更多
关键词 多人姿态估计 多头自注意力机制 坐标注意力机制 空洞空间卷积池化金字塔
在线阅读 下载PDF
RAUGAN:基于循环生成对抗网络的红外图像彩色化方法
9
作者 朴燕 康继元 《吉林大学学报(工学版)》 北大核心 2025年第8期2722-2731,共10页
针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的S... 针对近红外图像彩色化过程中的色彩失真、语义模糊和纹理形状不清晰的问题,提出了一种红外图像彩色化方法(RAUGAN)。该算法首先改进了CycleGAN网络的生成器,设计并融合了一种Res-ASPP-Unet网络,将空洞空间金字塔池化(ASPP)在原始UNet的Skip connection结构处连接,使解码分支中的不同尺度输出特征图都能与编码器中对应的输出特征图相结合;其次,设计了由残差块与通道和空间注意力模块(CBAM)构成的深度瓶颈层块替换UNet网络中的瓶颈层,用于增强局部区域特征,提高其识别能力;最后,在判别网络中引用感知损失函数从而解决色彩恢复失真的问题。实验结果表明:该方法彩色化效果明显优于其他方法。 展开更多
关键词 计算机应用 红外图像彩色化 循环生成对抗网络 空洞空间金字塔池化 注意力模块
原文传递
基于改进Hyper-YOLO的煤矿输送带异物检测方法
10
作者 李刚 朱宇 +6 位作者 杨庆贺 邹军鹏 才天 贺鹏 张亚兵 赵艺鸣 田鑫浩 《工矿自动化》 北大核心 2025年第7期114-121,共8页
基于YOLO系列的输送带异物检测技术已取得丰富的研究成果,但其颈部网络无法使相隔较远的特征层直接交换特征信息,引发小目标漏检、重复检测等问题。Hyper-YOLO可在颈部网络实现特征层之间跨层、跨位置的高阶关联,但会增加计算量,且降低... 基于YOLO系列的输送带异物检测技术已取得丰富的研究成果,但其颈部网络无法使相隔较远的特征层直接交换特征信息,引发小目标漏检、重复检测等问题。Hyper-YOLO可在颈部网络实现特征层之间跨层、跨位置的高阶关联,但会增加计算量,且降低对高频特征信息的敏感性,导致在噪声较为敏感的区域特征提取能力下降,预测边界框发生偏移。针对上述问题,提出一种基于改进Hyper-YOLO的煤矿输送带异物检测方法。在图像预处理阶段采用动态对比度受限自适应直方图均衡化(Dy-CLAHE)方法,将Laplacian算子引入对比度受限自适应直方图均衡化(CLAHE)框架,建立噪声水平与对比度限制阈值之间的动态映射关系,有效解决了粉尘环境下图像细节丢失和噪声放大的问题;对Hyper-YOLO进行改进,采用高效交并比(EIoU)损失函数优化边界框回归过程,提升了预测边界框定位精度,并在混合聚合网络(MANet)的深层和浅层嵌入高效通道注意力机制(ECA)模块,通过局部跨通道交互动态调整通道权重,有效平衡对高频和低频特征信息的敏感性,降低小目标异物的漏检率,同时通过简化快速空间金字塔池化(SimSPPF)模块,减少了冗余计算,在保证精度的同时提升了推理速度。实验结果表明:改进Hyper-YOLO在准确率和mAP@0.5指标上分别为94.2%和93.4%,相较于Hyper-YOLO提高了5.0%和3.5%,参数量为3.26×10^(6)个,召回率为87.7%,检测速度为158帧/s,满足煤矿井下异物实时检测的需求;在不同煤矿输送带异物检测场景下无漏检及重复检测情况,预测边界框更贴合异物。 展开更多
关键词 煤矿输送带 异物检测 Hyper-YOLO 动态对比度受限自适应直方图均衡 EIoU 高效通道注意力机制 简化快速空间金字塔池化
在线阅读 下载PDF
基于改进DeepLabV3+的城市列车轨道区域分割方法
11
作者 胡波 刘培文 刘瑞琪 《菏泽学院学报》 2025年第5期76-82,共7页
针对城市列车轨道区域与路面背景相似度较高而导致的轨道区域提取效果较差的问题,提出一种基于改进DeeplabV3+模型的轨道区域的分割算法.首先,针对列车轨道区域长宽比例较大的特点,使用条形池化卷积层代替ASPP结构中的全局池化层,以提... 针对城市列车轨道区域与路面背景相似度较高而导致的轨道区域提取效果较差的问题,提出一种基于改进DeeplabV3+模型的轨道区域的分割算法.首先,针对列车轨道区域长宽比例较大的特点,使用条形池化卷积层代替ASPP结构中的全局池化层,以提升算法对条形轨道区域的提取能力;其次设计使用特征分组注意力(FGA)机制,提升模型对细节的关注度;最后改变上采样频率,降低因快速上采样而造成边界信息的模糊化影响.将3192张城市轨道图像作为数据集,经验证与原网络相比,改进网络在数据集中的平均交并比以及召回率分别提高了3.65%、3.83%,达到93.88%以及97.35%,有效提升了轨道区域提取效果. 展开更多
关键词 区域提取 Deeplabv3+ 条形池化 注意力 空间金字塔
在线阅读 下载PDF
Steel surface defect detection based on lightweight YOLOv7
12
作者 SHI Tao WU Rongxin +1 位作者 ZHU Wenxu MA Qingliang 《Optoelectronics Letters》 2025年第5期306-313,共8页
Aiming at the problems of low detection efficiency and difficult positioning of traditional steel surface defect detection methods,a lightweight steel surface defect detection model based on you only look once version... Aiming at the problems of low detection efficiency and difficult positioning of traditional steel surface defect detection methods,a lightweight steel surface defect detection model based on you only look once version 7(YOLOv7)is proposed.First,a cascading style sheets(CSS)block module is proposed,which uses more lightweight operations to obtain redundant information in the feature map,reduces the amount of computation,and effectively improves the detection speed.Secondly,the improved spatial pyramid pooling with cross stage partial convolutions(SPPCSPC)structure is adopted to ensure that the model can also pay attention to the defect location information while predicting the defect category information,obtain richer defect features.In addition,the convolution operation in the original model is simplified,which significantly reduces the size of the model and helps to improve the detection speed.Finally,using efficient intersection over union(EIOU)loss to focus on high-quality anchors,speed up convergence and improve positioning accuracy.Experiments were carried out on the Northeastern University-defect(NEU-DET)steel surface defect dataset.Compared with the original YOLOv7 model,the number of parameters of this model was reduced by 40%,the frames per second(FPS)reached 112,and the average accuracy reached 79.1%,the detection accuracy and speed have been improved,which can meet the needs of steel surface defect detection. 展开更多
关键词 obtain redundant information defect detection steel surface cascading style sheets block module lightweight yolov lightweight operations spatial pyramid pooling steel surface defect detection
原文传递
基于卷积金字塔网络的PPO算法求解作业车间调度问题 被引量:1
13
作者 徐帅 李艳武 +1 位作者 谢辉 牛晓伟 《现代制造工程》 北大核心 2025年第3期19-30,共12页
作业车间调度问题是一个经典的NP-hard组合优化问题,其调度方案的优劣直接影响制造系统的运行效率。为得到更优的调度策略,以最小化最大完工时间为优化目标,提出了一种基于近端策略优化(Proximal Policy Optimization,PPO)和卷积神经网... 作业车间调度问题是一个经典的NP-hard组合优化问题,其调度方案的优劣直接影响制造系统的运行效率。为得到更优的调度策略,以最小化最大完工时间为优化目标,提出了一种基于近端策略优化(Proximal Policy Optimization,PPO)和卷积神经网络(Convolutional Neural Network,CNN)的深度强化学习(Deep Reinforcement Learning,DRL)调度方法。设计了一种三通道状态表示方法,选取16种启发式调度规则作为动作空间,将奖励函数等价为最小化机器总空闲时间。为使训练得到的调度策略能够处理不同规模的调度算例,在卷积神经网络中使用空间金字塔池化(Spatial Pyramid Pooling,SPP),将不同维度的特征矩阵转化为固定长度的特征向量。在公开OR-Library的42个作业车间调度(Job-Shop Scheduling Problem,JSSP)算例上进行了计算实验。仿真实验结果表明,该算法优于单一启发式调度规则和遗传算法,在大部分算例中取得了比现有深度强化学习算法更好的结果,且平均完工时间最小。 展开更多
关键词 深度强化学习 作业车间调度 卷积神经网络 近端策略优化 空间金字塔池化
在线阅读 下载PDF
基于改进的YOLOv8n海洋动物目标检测算法:DPSC-YOLO 被引量:1
14
作者 梁佳杰 徐慧英 +3 位作者 朱信忠 王舒梦 刘子洋 李琛 《计算机工程与科学》 北大核心 2025年第4期695-705,共11页
在海洋复杂的环境中,由于图像拍摄模糊、背景复杂,导致基于深度学习的目标检测算法存在特征提取困难和目标漏检等问题,因此海洋目标检测算法需要更加高效且性能优越。为此提出了一种基于YOLOv8n改进的海洋动物目标检测算法:DPSC-YOLO。... 在海洋复杂的环境中,由于图像拍摄模糊、背景复杂,导致基于深度学习的目标检测算法存在特征提取困难和目标漏检等问题,因此海洋目标检测算法需要更加高效且性能优越。为此提出了一种基于YOLOv8n改进的海洋动物目标检测算法:DPSC-YOLO。在主干网络中引入DCNv2模块,通过增强空间建模能力来适应对象的几何变化;在主干网络末端引入空间金字塔池化SPPFCSPC,在保持模型感知场不变的同时减少模型的计算量;在颈部网络增加F 2极小目标检测头,结合其余3个尺度,使用4个不同的感受野检测层提高小目标检测精度;在颈部网络的C2f模块中结合CoTAttention注意力机制更好地利用相邻键之间的上下文信息,并根据数据的特点动态调整注意力分配。实验结果表明,DPSC-YOLO目标检测算法与YOLOv8n相比mAP@0.5提升了1.1%,mAP@0.5:0.95提升了4.6%,同时仅有较少的参数量和计算量的增加,证明DPSC-YOLO更适合复杂海洋环境中的目标检测任务。 展开更多
关键词 YOLOv8 DCNv2 SPPFCSPC 上下文注意力机制 小目标检测头
在线阅读 下载PDF
基于改进YOLOv5的半监督车辆检测算法 被引量:1
15
作者 高睿 安国成 +1 位作者 邹丹平 裴凌 《计算机工程》 北大核心 2025年第3期300-309,共10页
目前,交通场景中的车辆检测存在目标尺度差异显著以及遮挡重叠严重等问题,且对大规模数据进行完全标注需要较高的成本。针对以上情况,提出一种基于改进YOLOv5的半监督车辆检测算法。引入SimOTA样本匹配方法,优化次优匹配现象,改善目标... 目前,交通场景中的车辆检测存在目标尺度差异显著以及遮挡重叠严重等问题,且对大规模数据进行完全标注需要较高的成本。针对以上情况,提出一种基于改进YOLOv5的半监督车辆检测算法。引入SimOTA样本匹配方法,优化次优匹配现象,改善目标尺度形状变化导致的检测困难;提出一种新的空间金字塔池化网络SPPFA,通过引入LSKA,在增大感受野的同时实现空间和通道的自适应性,缓解大尺度目标和遮挡问题产生的影响;将CIoU替换为SIoU,优化回归损失函数。在此基础上,提出一种改进的半监督深度学习算法,通过优化损失函数设计,增强算法学习未标注样本中有益信息的能力,有效提高模型对车辆的检测精度。实验结果表明,改进后的算法在自制车辆数据集上mAP@0.5指标达到了58.2%,相较YOLOv5n基线模型提升了11.1百分点,且模型体积远小于主流目标检测算法,具有良好的工程应用前景。 展开更多
关键词 YOLOv5 车辆检测 样本匹配 空间金字塔池化 半监督学习
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
16
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
时空网络特征融合的病理步态识别方法
17
作者 李聪聪 王斌 +1 位作者 李亚南 李一帆 《计算机工程与设计》 北大核心 2025年第7期2109-2116,共8页
针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融... 针对病理步态识别方法中存在空间信息或时序信息丢失的问题,提出一种时空网络特征融合的病理步态识别方法。结合卷积网络和时序网络,学习更具判别性的步态时空特征。卷积网络中引入阶梯融合式空洞空间金字塔池化,获得更鲁棒的多尺度融合步态表征。联合卷积核替换和残差块改进对卷积网络进一步优化。时序网络中引入全局与局部时空特征融合模块,形成对时空特征的更细节表达。融合空间特征和时空特征,减轻Bi LSTM学习空间特征中时间模式的过程中丢失空间特征的影响。所提模型在自建数据集和GAIT-IST数据集上的准确率分别达到了97.69%和94.16%,实验结果表明,该方法较其它方法取得了更优的性能。 展开更多
关键词 病理步态识别 时空网络 特征融合 时空特征 阶梯融合式空洞空间金字塔池化 多尺度特征 全局与局部时空特征融合模块
在线阅读 下载PDF
基于YOLOv8改进的雾天场景下多目标检测 被引量:1
18
作者 赵伟康 李军 《长江信息通信》 2025年第1期91-95,共5页
针对在雾天条件下能见度降低和特征信息的丢失,行人车辆检测效果差的问题,提出了一种基于Yolov8改进的I-Yolov8网络模型。首先引入双向加权特征融合金字塔网络并新增了小目标检测头,以增强对多尺度目标的检测能力更有效地捕捉雾天条件... 针对在雾天条件下能见度降低和特征信息的丢失,行人车辆检测效果差的问题,提出了一种基于Yolov8改进的I-Yolov8网络模型。首先引入双向加权特征融合金字塔网络并新增了小目标检测头,以增强对多尺度目标的检测能力更有效地捕捉雾天条件下小目标的特征;其次对空间金字塔池化层进行优化,以提升模型对不同分辨率特征的整合能力;模型还集成了ECA注意力机制,以增强模型对图像关键特征的提取;最后采用WIOUV3损失函数以提高目标边界框的预测精度。在RTTS真实雾天场景数据集上的实验结果表明,改进模型的平均准确率达到76.6%,相较于基线模型提升了5.6%,同时保持了125的帧率,实现了检测精度与速度的平衡。 展开更多
关键词 雾天 目标检测 金字塔网络 金字塔池化 注意力机制
在线阅读 下载PDF
基于改进YOLOv5s的轻量级光伏板缺陷检测网络 被引量:1
19
作者 陈子璇 陈辉 《山东理工大学学报(自然科学版)》 2025年第3期70-78,共9页
针对已有光伏板缺陷检测算法模型参数多、识别速度与精度难以取得较好平衡的问题,以YOLOv5s模型为基础,提出用于光伏板表面缺陷检测的轻量级网络LPV-YOLO。为降低模型的参数量,利用Ghost模块和Mish激活函数提出GhostMConv和C3MGhost模块... 针对已有光伏板缺陷检测算法模型参数多、识别速度与精度难以取得较好平衡的问题,以YOLOv5s模型为基础,提出用于光伏板表面缺陷检测的轻量级网络LPV-YOLO。为降低模型的参数量,利用Ghost模块和Mish激活函数提出GhostMConv和C3MGhost模块,将其用于YOLOv5s模型中,实现骨干网络轻量化;提出一种融合SimAM注意力机制和空间金字塔池化层的注意力金字塔池化,在不增加参数和计算量的前提下,弥补骨干网络轻量化带来的精度丢失;在颈部网络中嵌入SE通道注意力模块,以提升模型对缺陷关键信息的捕捉能力。实验表明:与原始的YOLOv5s相比,改进后LPV-YOLO网络的参数量降低49%,体积减少46%,计算量减少50%,而mAP只下降0.6%,在可接受范围之内;在光伏板缺陷数据集上的mAP仍然能够达到93.8%,帧率可以达到70.42 FPS,满足实时性的要求;与YOLOv7、SSD300、RetinaNet等端到端网络相比,LPV-YOLO检测精度最优,模型参数量也最小。该模型在保持较高检测精度的同时,大幅降低了模型复杂度,可为采用资源有限的移动端设备进行光伏板缺陷检测提供一种有效的方法。 展开更多
关键词 光伏板缺陷检测 实时检测 YOLOv5s 空间金字塔池化 轻量级注意力
在线阅读 下载PDF
基于Python和DCNN的仪表智能识别研究 被引量:1
20
作者 谷力 《自动化与仪器仪表》 2025年第1期103-106,111,共5页
针对传统的仪表识别主要依靠人力,导致效率和准确率较低的问题,研究提出了一种基于Python和深度卷积神经网络的仪表智能识别模型。该模型首先基于Python设计和图像二值化对仪表图像进行预处理。然后,采用MobileNet V2作为DCNN的主干特... 针对传统的仪表识别主要依靠人力,导致效率和准确率较低的问题,研究提出了一种基于Python和深度卷积神经网络的仪表智能识别模型。该模型首先基于Python设计和图像二值化对仪表图像进行预处理。然后,采用MobileNet V2作为DCNN的主干特征提取网络,结合深度卷积神经网络和注意机制来对仪表图像进行识别。最后,通过实验验证模型的识别性能。结果表明,所提模型的识别准确率和F1值较高,分别为98.63%和94.32%。在视图变化和光照变化的情况下,研究所提模型的查准率和召回率均高于另外三种模型,在视图变化时分别为0.71和0.75,在光照变化时分别为0.78和0.90。研究能够为工业生产中的仪表自动识别提供一定的技术支持,促进工业生产的自动化和智能化发展。 展开更多
关键词 仪表识别 PYTHON 深度卷积神经网络 卷积块注意力模块 空间金字塔池化
原文传递
上一页 1 2 18 下一页 到第
使用帮助 返回顶部