期刊文献+
共找到1,664篇文章
< 1 2 84 >
每页显示 20 50 100
Action Recognition in Surveillance Videos with Combined Deep Network Models
1
作者 ZHANG Diankai ZHAO Rui-Wei +3 位作者 SHEN Lin CHEN Shaoxiang SUN Zhenfeng JIANG Yu-Gang 《ZTE Communications》 2016年第B12期54-60,共7页
Action recognition is an important topic in computer vision. Recently, deep learning technologies have been successfully used in lots of applications including video data for sloving recognition problems. However, mos... Action recognition is an important topic in computer vision. Recently, deep learning technologies have been successfully used in lots of applications including video data for sloving recognition problems. However, most existing deep learning based recognition frameworks are not optimized for action in the surveillance videos. In this paper, we propose a novel method to deal with the recognition of different types of actions in outdoor surveillance videos. The proposed method first introduces motion compensation to improve the detection of human target. Then, it uses three different types of deep models with single and sequenced images as inputs for the recognition of different types of actions. Finally, predictions from different models are fused with a linear model. Experimental results show that the proposed method works well on the real surveillance videos. 展开更多
关键词 action recognition deep network models model fusion surveillance video
在线阅读 下载PDF
Deep Neural Network Based Behavioral Model of Nonlinear Circuits
2
作者 Zhe Jin Sekouba Kaba 《Journal of Applied Mathematics and Physics》 2021年第3期403-412,共10页
With the rapid growth of complexity and functionality of modern electronic systems, creating precise behavioral models of nonlinear circuits has become an attractive topic. Deep neural networks (DNNs) have been recogn... With the rapid growth of complexity and functionality of modern electronic systems, creating precise behavioral models of nonlinear circuits has become an attractive topic. Deep neural networks (DNNs) have been recognized as a powerful tool for nonlinear system modeling. To characterize the behavior of nonlinear circuits, a DNN based modeling approach is proposed in this paper. The procedure is illustrated by modeling a power amplifier (PA), which is a typical nonlinear circuit in electronic systems. The PA model is constructed based on a feedforward neural network with three hidden layers, and then Multisim circuit simulator is applied to generating the raw training data. Training and validation are carried out in Tensorflow deep learning framework. Compared with the commonly used polynomial model, the proposed DNN model exhibits a faster convergence rate and improves the mean squared error by 13 dB. The results demonstrate that the proposed DNN model can accurately depict the input-output characteristics of nonlinear circuits in both training and validation data sets. 展开更多
关键词 Nonlinear Circuits deep Neural networks Behavioral model Power Amplifier
在线阅读 下载PDF
A Scalable Model of the Substrate Network in Deep n-Well RF MOSFETs with Multiple Fingers
3
作者 Jun Liu Marissa Condon 《Circuits and Systems》 2011年第2期91-100,共10页
A novel scalable model of substrate components for deep n-well (DNW) RF MOSFETs with different number of fingers is presented for the first time. The test structure developed in [1] is employed to directly access the ... A novel scalable model of substrate components for deep n-well (DNW) RF MOSFETs with different number of fingers is presented for the first time. The test structure developed in [1] is employed to directly access the characteristics of the substrate to extract the different substrate components. A methodology is developed to directly extract the parameters for the substrate network from the measured data. By using the measured two-port data of a set of nMOSFETs with different number of fingers, with the DNW in grounded and float configuration, respectively, the parameters of the scalable substrate model are obtained. The method and the substrate model are further verified and validated by matching the measured and simulated output admittances. Excellent agreement up to 40 GHz for configurations in common-source has been achieved. 展开更多
关键词 deep N-Well (DNW) RF MOSFETS Substrate network SCALABLE model
暂未订购
Brain Encoding and Decoding in fMRI with Bidirectional Deep Generative Models 被引量:2
4
作者 Changde Du Jinpeng Li +1 位作者 Lijie Huang Huiguang He 《Engineering》 SCIE EI 2019年第5期948-953,共6页
Brain encoding and decoding via functional magnetic resonance imaging(fMRI)are two important aspects of visual perception neuroscience.Although previous researchers have made significant advances in brain encoding and... Brain encoding and decoding via functional magnetic resonance imaging(fMRI)are two important aspects of visual perception neuroscience.Although previous researchers have made significant advances in brain encoding and decoding models,existing methods still require improvement using advanced machine learning techniques.For example,traditional methods usually build the encoding and decoding models separately,and are prone to overfitting on a small dataset.In fact,effectively unifying the encoding and decoding procedures may allow for more accurate predictions.In this paper,we first review the existing encoding and decoding methods and discuss the potential advantages of a“bidirectional”modeling strategy.Next,we show that there are correspondences between deep neural networks and human visual streams in terms of the architecture and computational rules.Furthermore,deep generative models(e.g.,variational autoencoders(VAEs)and generative adversarial networks(GANs))have produced promising results in studies on brain encoding and decoding.Finally,we propose that the dual learning method,which was originally designed for machine translation tasks,could help to improve the performance of encoding and decoding models by leveraging large-scale unpaired data. 展开更多
关键词 BRAIN encoding and DECODING Functional magnetic resonance imaging deep neural networks deep GENERATIVE models Dual learning
在线阅读 下载PDF
Aquaculture area extraction and vulnerability assessment in Sanduao based on richer convolutional features network model 被引量:5
5
作者 LIU Yueming YANG Xiaomei +3 位作者 WANG Zhihua LU Chen LI Zhi YANG Fengshuo 《Journal of Oceanology and Limnology》 SCIE CAS CSCD 2019年第6期1941-1954,共14页
Sanduao is an important sea-breeding bay in Fujian,South China and holds a high economic status in aquaculture.Quickly and accurately obtaining information including the distribution area,quantity,and aquaculture area... Sanduao is an important sea-breeding bay in Fujian,South China and holds a high economic status in aquaculture.Quickly and accurately obtaining information including the distribution area,quantity,and aquaculture area is important for breeding area planning,production value estimation,ecological survey,and storm surge prevention.However,as the aquaculture area expands,the seawater background becomes increasingly complex and spectral characteristics differ dramatically,making it difficult to determine the aquaculture area.In this study,we used a high-resolution remote-sensing satellite GF-2 image to introduce a deep-learning Richer Convolutional Features(RCF)network model to extract the aquaculture area.Then we used the density of aquaculture as an assessment index to assess the vulnerability of aquaculture areas in Sanduao.The results demonstrate that this method does not require land and water separation of the area in advance,and good extraction can be achieved in the areas with more sediment and waves,with an extraction accuracy>93%,which is suitable for large-scale aquaculture area extraction.Vulnerability assessment results indicate that the density of aquaculture in the eastern part of Sanduao is considerably high,reaching a higher vulnerability level than other parts. 展开更多
关键词 AQUACULTURE area VULNERABILITY assessment Richer Convolutional Features(RCF)network model deep learning HIGH-RESOLUTION REMOTE SENSING
在线阅读 下载PDF
基于PI-DeepONet模型的IGBT模块结温估算方法
6
作者 项江鑫 霍思佳 +2 位作者 乐应波 杨程 崔昊杨 《半导体技术》 北大核心 2025年第7期746-755,共10页
时变高功率工况下,IGBT模块结温的实时准确估算是高效实施热管理策略的基础。但现有方法中,有限元分析(FEA)法难以实时响应,热网络模型法估算准确率低,两者均无法满足结温估算实时性和准确率的均衡性需求。针对这些问题,提出了一种基于... 时变高功率工况下,IGBT模块结温的实时准确估算是高效实施热管理策略的基础。但现有方法中,有限元分析(FEA)法难以实时响应,热网络模型法估算准确率低,两者均无法满足结温估算实时性和准确率的均衡性需求。针对这些问题,提出了一种基于物理约束深度算子网络(PI-DeepONet)模型的IGBT模块结温实时准确估算方法。首先,在算子网络的损失函数中引入物理约束,设计了具有物理约束的PI-DeepONet模型;随后,将FEA计算的IGBT模块热特性参数与时空位置信息作为输入对模型进行训练;最后,利用训练所得的最优算子估算模块结温。仿真结果表明,该模型兼顾了结温估算的准确率和实时性,能够适应复杂工况,为IGBT模块热管理策略的高效实施提供了可靠的理论支持与技术保障。 展开更多
关键词 IGBT 结温估算 物理约束深度算子网络(PI-deepONet)模型 有限元分析(FEA)法 热网络模型 热管理策略
原文传递
HMM-Based Photo-Realistic Talking Face Synthesis Using Facial Expression Parameter Mapping with Deep Neural Networks
7
作者 Kazuki Sato Takashi Nose Akinori Ito 《Journal of Computer and Communications》 2017年第10期50-65,共16页
This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate represent... This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate representation that has a good correspondence with both of the input contexts and the output pixel data of face images. The sequences of the facial expression parameters are modeled using context-dependent HMMs with static and dynamic features. The mapping from the expression parameters to the target pixel images are trained using DNNs. We examine the required amount of the training data for HMMs and DNNs and compare the performance of the proposed technique with the conventional PCA-based technique through objective and subjective evaluation experiments. 展开更多
关键词 Visual-Speech SYNTHESIS TALKING Head Hidden MARKOV models (HMMs) deep Neural networks (DNNs) FACIAL Expression Parameter
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
8
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
Review of Artificial Intelligence for Oil and Gas Exploration: Convolutional Neural Network Approaches and the U-Net 3D Model
9
作者 Weiyan Liu 《Open Journal of Geology》 CAS 2024年第4期578-593,共16页
Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Ou... Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Our review traces the evolution of CNN, emphasizing the adaptation and capabilities of the U-Net 3D model in automating seismic fault delineation with unprecedented accuracy. We find: 1) The transition from basic neural networks to sophisticated CNN has enabled remarkable advancements in image recognition, which are directly applicable to analyzing seismic data. The U-Net 3D model, with its innovative architecture, exemplifies this progress by providing a method for detailed and accurate fault detection with reduced manual interpretation bias. 2) The U-Net 3D model has demonstrated its superiority over traditional fault identification methods in several key areas: it has enhanced interpretation accuracy, increased operational efficiency, and reduced the subjectivity of manual methods. 3) Despite these achievements, challenges such as the need for effective data preprocessing, acquisition of high-quality annotated datasets, and achieving model generalization across different geological conditions remain. Future research should therefore focus on developing more complex network architectures and innovative training strategies to refine fault identification performance further. Our findings confirm the transformative potential of deep learning, particularly CNN like the U-Net 3D model, in geosciences, advocating for its broader integration to revolutionize geological exploration and seismic analysis. 展开更多
关键词 deep Learning Convolutional Neural networks (CNN) Seismic Fault Identification U-Net 3D model Geological Exploration
在线阅读 下载PDF
神经网络滤波器剪枝技术研究综述
10
作者 王琳 宋权润 +1 位作者 耿世超 栾钟治 《计算机工程与应用》 北大核心 2026年第2期1-25,共25页
随着软硬件资源水平和计算能力的提高,深度神经网络在计算机视觉、自然语言处理、图像生成等多个领域迅速发展,引领深度学习在自动驾驶、医疗诊断等方向上不断突破。然而,随着模型深度的增加,庞大的参数量和计算资源消耗导致模型变得过... 随着软硬件资源水平和计算能力的提高,深度神经网络在计算机视觉、自然语言处理、图像生成等多个领域迅速发展,引领深度学习在自动驾驶、医疗诊断等方向上不断突破。然而,随着模型深度的增加,庞大的参数量和计算资源消耗导致模型变得过于复杂,难以在资源受限的环境进行训练和部署。为了减少网络模型的复杂度,提高模型的效率,研究者们提出了剪枝方法,通过减少模型中的冗余参数和连接实现模型的压缩和加速。滤波器剪枝是优化卷积神经网络的重要方法之一,通过改变网络中滤波器组和特征通道的数目来加速网络,且不依赖于特定算法或硬件平台。梳理了近年来国内外滤波器剪枝技术的研究进展,从滤波器重要性评估、剪枝及微调方式设计两个方面进行分类总结,并对主流滤波器剪枝方法的实验进行归纳,分析滤波器剪枝对模型精度和参数量的影响,并对未来的研究方向加以探讨。 展开更多
关键词 深度学习 深度卷积神经网络 模型压缩 滤波器剪枝 模型优化加速
在线阅读 下载PDF
地铁深基坑施工坍塌风险耦合研究
11
作者 方俊 黄金艳 +1 位作者 徐小琴 王景昌 《安全与环境学报》 北大核心 2026年第2期483-495,共13页
为实现地铁深基坑施工坍塌事故多因素耦合致灾机制解析与精准风险管控策略制定,提出了一种基于N-K模型和贝叶斯网络(Bayesian Network,BN)的定量耦合风险评估方法。通过对113份地铁深基坑施工坍塌事故报告的分析,识别出5类主要风险因素... 为实现地铁深基坑施工坍塌事故多因素耦合致灾机制解析与精准风险管控策略制定,提出了一种基于N-K模型和贝叶斯网络(Bayesian Network,BN)的定量耦合风险评估方法。通过对113份地铁深基坑施工坍塌事故报告的分析,识别出5类主要风险因素(人、物、管、环和技)。通过N-K模型解构多风险耦合效应,揭示风险耦合演化规律,基于N-K模型计算结果确定贝叶斯网络模型结构及参数,利用贝叶斯网络敏感性分析评估风险因素对显著风险耦合情境的影响,逆向溯源关键风险因素。结果表明,地铁深基坑施工坍塌风险随耦合因素种类的增加而变大,其中人-物-管-环-技风险耦合值最大、发生概率最高。风险因素c_(4)(施工现场安全监管和隐患排查不到位)、d_(1)(地质水文条件恶劣)、b_(4)(材料、构件质量或强度不合格)、a_(1)(安全风险意识差)和a_(5)(违规违章施工)在高风险耦合情境中表现出高敏感性,对地铁深基坑施工坍塌风险耦合起着关键作用。 展开更多
关键词 安全工程 地铁深基坑 施工坍塌 风险耦合 N-K模型 贝叶斯网络
原文传递
考虑骨料级配和衍生特征的Stacking深度集成混凝土强度预测
12
作者 蔡志坚 王晓玲 +3 位作者 张君 王栋 吴斌平 余红玲 《水力发电学报》 北大核心 2026年第2期15-30,共16页
抗压强度预测对于混凝土施工质量控制具有重要意义。现有抗压强度预测模型多关注于初始配合比的影响,缺乏考虑骨料级配及衍生特征的影响及其可解释性分析。针对上述问题,本研究提出一种综合考虑骨料级配和衍生特征的Stacking深度集成抗... 抗压强度预测对于混凝土施工质量控制具有重要意义。现有抗压强度预测模型多关注于初始配合比的影响,缺乏考虑骨料级配及衍生特征的影响及其可解释性分析。针对上述问题,本研究提出一种综合考虑骨料级配和衍生特征的Stacking深度集成抗压强度预测模型,用于提升抗压强度预测精度和可解释性。该模型采用三种主流集成学习模型与卷积神经网络作为基学习器,以充分利用各主流算法的多样性和异质性。其中,为弥补基于树的模型对超参数敏感以及对高维特征提取能力弱的不足,引入通道注意力机制对卷积神经网络进行改进,进而提升特征提取能力。采用融合注意力机制的多层感知机模型作为元学习器,以降低模型过拟合风险。基于SHAP理论,深入挖掘混凝土强度预测的关键特征及特征交互影响。结果表明,所提模型综合考虑了骨料级配和衍生特征,抗压强度预测精度提高了27.53%。SHAP分析表明,水胶比,水,粉煤灰/水,水泥以及31.5~40 mm粒径的骨料质量分数为关键的模型驱动因素。本研究所提模型不仅提升了强度预测准确性,还通过可解释性分析揭示了影响混凝土强度的核心参数,为混凝土智能化管控提供了理论指导。 展开更多
关键词 混凝土 抗压强度预测 骨料级配 卷积神经网络 Stacking深度集成模型 SHAP分析
在线阅读 下载PDF
融合ResNet-18与水动力模型的洪水演进快速预测
13
作者 童超 詹晗煜 +3 位作者 崔罡 刘康 欧阳磊 肖宏宇 《水资源保护》 北大核心 2026年第1期129-136,共8页
为实现高精度和高效率洪水演进预测,结合数据驱动与物理建模的双重优势,提出了融合残差神经网络(ResNet-18)与水动力模型Telemac2D的洪水演进快速预测算法,将Telemac2D生成的高精度洪水淹没数据作为训练样本,构建了基于一维ResNet-18的... 为实现高精度和高效率洪水演进预测,结合数据驱动与物理建模的双重优势,提出了融合残差神经网络(ResNet-18)与水动力模型Telemac2D的洪水演进快速预测算法,将Telemac2D生成的高精度洪水淹没数据作为训练样本,构建了基于一维ResNet-18的深度神经网络模型,并利用该模型对黄柏河流域下游尚家河河段洪水淹没水深与演进路径进行了实时动态预测和对比验证。结果表明:构建的ResNet-18模型对240组测试集预报结果的平均绝对误差和均方根误差分别为0.0332 m和0.0898 m,淹没范围的空间分布与Telemac2D模拟结果高度一致,相关系数达0.9981,对测量点水深的预测结果比卷积神经网络模型更精确,且计算效率相较传统水动力模型提升超300倍。 展开更多
关键词 洪水演进 残差神经网络 深度神经网络 Telemac2D 卷积神经网络模型 黄柏河流域
在线阅读 下载PDF
生成式网络研究及应用综述
14
作者 沈淦杰 张琳 +1 位作者 李泽慧 山显英 《计算机工程与应用》 北大核心 2026年第3期21-39,共19页
生成对抗网络(GAN)自提出以来,就成为了深度学习领域最具影响力的生成模型之一,其在计算机视觉、自然语言处理、医学影像等多个领域均有所应用。GAN由生成器和判别器构成,通过对抗训练不断优化,以生成高度逼真的数据。过去十余年间GAN... 生成对抗网络(GAN)自提出以来,就成为了深度学习领域最具影响力的生成模型之一,其在计算机视觉、自然语言处理、医学影像等多个领域均有所应用。GAN由生成器和判别器构成,通过对抗训练不断优化,以生成高度逼真的数据。过去十余年间GAN迅速发展,涌现出众多变种,大幅提升了训练稳定性和生成质量,并逐步与Transformer、大语言模型、扩散模型等新兴的深度学习技术融合,拓展了应用范围。但其仍面临模式崩溃、训练不稳定、评估标准不足及计算资源消耗高等挑战,研究人员也在不断探索优化策略来提升它的稳定性和泛化能力。系统回顾了GAN的发展历程,重点介绍其基本架构、主要变种及关键应用,涵盖计算机视觉、自然语言处理、医学影像、音乐生成和时间序列分析等领域;探讨了GAN目前的核心挑战及优化策略,并展望了未来发展趋势。 展开更多
关键词 生成对抗网络(GAN) 深度学习 生成模型 变体及应用
在线阅读 下载PDF
表面肌电肌力估计模型研究进展
15
作者 于丰帆 魏德健 +2 位作者 冯妍妍 马一凡 李振江 《传感器与微系统》 北大核心 2026年第1期8-13,共6页
表面肌电(sEMG)作为一种非侵入式技术,因易采集并含有人体肌肉的相关信息,而被用于肌力估计,在评估和治疗肌肉疾病方面具有广阔的研究前景。为了实现对肌力的准确估计,目前研究主要分为两类:一是改进sEMG信号处理方法;二是改进sEMG—肌... 表面肌电(sEMG)作为一种非侵入式技术,因易采集并含有人体肌肉的相关信息,而被用于肌力估计,在评估和治疗肌肉疾病方面具有广阔的研究前景。为了实现对肌力的准确估计,目前研究主要分为两类:一是改进sEMG信号处理方法;二是改进sEMG—肌力模型。该综述详细总结了sEMG肌力估计模型研究进展,首先概述了肌力与sEMG信号的关系;其次从传感器和数据集方面总结了sEMG信号的采集方式,并分析了现阶段sEMG信号预处理和特征提取的处理方法;然后针对sEMG—肌力模型研究方法的不同,将其分为深度学习、混合网络和其他肌力估计算法,对比总结了它们各自优势、局限性和实际应用;最后讨论了目前肌力估计的挑战与未来发展趋势。 展开更多
关键词 表面肌电 肌肉力量 预测模型 神经网络 深度学习
在线阅读 下载PDF
基于鲁棒分区水印的深度学习模型保护方法
16
作者 吕正浩 咸鹤群 《计算机科学》 北大核心 2026年第1期423-429,共7页
机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类... 机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类似于数字水印技术将水印嵌入图像的方式,模型水印通过将特定的标识嵌入机器学习模型中,以达到版权确认的目的。然而,现有的水印方案在实际应用中存在一些局限性。首先,水印的嵌入不可避免地会对模型性能产生一定影响;其次,水印可能会通过微调等技术手段被移除。针对此类问题,提出一种新型的神经网络水印方案,采用区域化和分阶段的嵌入方式。这种方法不仅旨在最大限度地减少对模型性能的影响,还力图提升水印本身的鲁棒性。在MNIST,CIFAR-10和CIFAR-100数据集上的实验验证了该方案的有效性。实验结果表明,该水印方案在保持水印存活率的同时,对模型性能的影响极小,相较于现有的基线水印方案,模型性能提升幅度最高可达18个百分点。此外,所提出的方案对微调等攻击手段表现出较强的鲁棒性,并且不受模型剪枝操作的影响。即便攻击者试图完全移除水印,也必须以显著降低模型性能为代价。 展开更多
关键词 深度神经网络 模型水印 版权验证 人工智能安全 水印鲁棒性 模型性能
在线阅读 下载PDF
基于改进YOLO v3模型与Deep-SORT算法的道路车辆检测方法 被引量:34
17
作者 马永杰 马芸婷 +1 位作者 程时升 马义德 《交通运输工程学报》 EI CSCD 北大核心 2021年第2期222-231,共10页
针对道路车辆实时检测遮挡严重与小目标车辆漏检率高的问题,提出了基于改进YOLO v3模型和Deep-SORT算法的车辆检测方法;为提高模型对道路车辆的检测能力,采用K-meansSymbolk@pSymbolk@p聚类算法对目标候选框进行聚类分析,选择合适的... 针对道路车辆实时检测遮挡严重与小目标车辆漏检率高的问题,提出了基于改进YOLO v3模型和Deep-SORT算法的车辆检测方法;为提高模型对道路车辆的检测能力,采用K-meansSymbolk@pSymbolk@p聚类算法对目标候选框进行聚类分析,选择合适的Anchor box数量,并在网络浅层增加了特征提取层,可提取到更精细的车辆特征;为加强网络对远近不同目标的鲁棒性,在保留原YOLO v3模型输出层的同时,增加了一层输出层,将52像素×52像素输出特征图经过上采样后得到104像素×104像素特征图,并将其与浅层同尺寸特征图进行拼接,实现车辆目标的检测;为了降低目标遮挡对检测效果的影响,提高对视频上下帧之间关联信息的关注度,将改进YOLO v3模型和Deep-SORT算法相结合,以此来弥补两者之间的不足。试验结果表明:改进YOLO v3模型有效地提高了车辆检测的性能,与在网络浅层增加特征提取层的模型相比,平均精度提高了1.4%,与增加一层输出层的模型相比,平均精确度提高了0.8%,说明改进YOLO v3模型提取的特征表达能力更强,增强了网络对小目标的检测能力;改进YOLO v3模型在引入Deep-SORT算法后,查准率和召回率分别达到90.16%和91.34%,相比改进YOLO v3模型,查准率和召回率分别提高了1.48%和4.20%,同时保证了检测速度,对于不同大小目标的检测具有良好的鲁棒性。 展开更多
关键词 交通图像识别 卷积神经网络 车辆检测 YOLO v3模型 deep-SORT算法 K-means++聚类算法
原文传递
基于GRU-Transformer与随机矩阵的机动群目标跟踪
18
作者 陈烨 梁苑 +1 位作者 李银伢 戚国庆 《兵工学报》 北大核心 2026年第1期282-295,共14页
针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更... 针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更新,实现群目标质心与扩展外形的联合跟踪。基于机动群目标时间序列量测数据,提取群目标运动多项特征参数,输入所提深度神经网络,实现机动群目标运动模型(匀速(Constant Velocity,CV)模型、匀加速(Constant Acceleration,CA)模型、CS模型)的精准辨别,若目标模型为CS运动模型,同时输出机动频率参数α的精确估计结果。运用随机矩阵群目标跟踪理论,提出一种基于贝叶斯状态估计架构的椭圆机动群目标跟踪方法。仿真实验结果分析表明:新方法可实现对机动椭圆群目标的精确稳健跟踪,相较于传统交互式多模型群目标跟踪方法,跟踪精度有显著提升。 展开更多
关键词 机动群目标跟踪 注意力GRU-Transformer深度神经网络 群目标跟踪 运动模型辨识 机动频率参数估计
在线阅读 下载PDF
基于UMAP-GWO-DNN的转炉终点磷含量预测模型
19
作者 王雪原 张力彬 周春芳 《特殊钢》 2026年第2期41-50,共10页
转炉终点磷含量的精准控制是提升钢材质量和冶炼效率的核心环节。本研究针对42CrMo钢种,创新性地融合统一流形逼近与投影(UMAP)、灰狼优化算法(GWO)和深度神经网络(DNN)技术,构建了多模态智能预测模型。通过UMAP算法对高维冶炼参数(如... 转炉终点磷含量的精准控制是提升钢材质量和冶炼效率的核心环节。本研究针对42CrMo钢种,创新性地融合统一流形逼近与投影(UMAP)、灰狼优化算法(GWO)和深度神经网络(DNN)技术,构建了多模态智能预测模型。通过UMAP算法对高维冶炼参数(如温度、氧枪高度、渣碱度等)进行非线性降维,有效提取关键特征;采用GWO优化DNN的初始权重和超参数,显著提升模型收敛速度与稳定性。实验基于钢厂200炉次实际生产数据,对比BP神经网络、标准DNN及GWO-DNN模型,UMAP-GWO-DNN模型在±0.001%和±0.002%误差区间的命中率分别达到86.7%和95.4%,均方根误差(RMSE)降低23.6%。工业验证表明,该模型使终点磷含量波动标准差减少41%,平均值从0.0012%稳定至0.0009%,成功实现"窄窗口"控制目标。本研究为转炉冶炼过程的数字化升级提供了可推广的技术路径。 展开更多
关键词 终点磷含量 转炉炼钢 深度神经网络 预测模型 工业应用
在线阅读 下载PDF
基于M-DeepLab网络的速度建模技术研究
20
作者 徐秀刚 张浩楠 +1 位作者 许文德 郭鹏 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期145-155,共11页
本文提出了一种适用于速度建模方法的M-DeepLab网络框架,该网络将地震炮集记录作为输入,网络主体使用轻量级MobileNet,以此提升网络训练速度;并在编码环节ASPP模块后添加了Attention模块,且在解码环节将不同网络深度的速度特征进行了融... 本文提出了一种适用于速度建模方法的M-DeepLab网络框架,该网络将地震炮集记录作为输入,网络主体使用轻量级MobileNet,以此提升网络训练速度;并在编码环节ASPP模块后添加了Attention模块,且在解码环节将不同网络深度的速度特征进行了融合,既获得了更多的速度特征,又保留了网络浅部的速度信息,防止出现网络退化和过拟合问题。模型测试证明,M-DeepLab网络能够实现智能、精确的速度建模,简单模型、复杂模型以及含有噪声数据复杂模型的智能速度建模,均取得了良好的效果。相较DeepLabV3+网络,本文方法对于速度模型界面处的预测,特别是速度突变区域的预测,具有更高的预测精度,从而验证了该方法精确性、高效性、实用性和抗噪性。 展开更多
关键词 深度学习 速度建模 M-deepLab网络 监督学习
在线阅读 下载PDF
上一页 1 2 84 下一页 到第
使用帮助 返回顶部