期刊文献+
共找到1,038篇文章
< 1 2 52 >
每页显示 20 50 100
Tensor Low-Rank Orthogonal Compression for Convolutional Neural Networks
1
作者 Yaping He Xin Luo 《IEEE/CAA Journal of Automatica Sinica》 2026年第1期227-229,共3页
Dear Editor,The letter proposes a tensor low-rank orthogonal compression(TLOC)model for a convolutional neural network(CNN),which facilitates its efficient and highly-accurate low-rank representation.Model compression... Dear Editor,The letter proposes a tensor low-rank orthogonal compression(TLOC)model for a convolutional neural network(CNN),which facilitates its efficient and highly-accurate low-rank representation.Model compression is crucial for deploying deep neural network(DNN)models on resource-constrained embedded devices. 展开更多
关键词 model compression convolutional neural network cnn which tensor low rank orthogonal compression deep neural network dnn models embedded devices convolutional neural networks
在线阅读 下载PDF
Deep Neural Network Based Behavioral Model of Nonlinear Circuits
2
作者 Zhe Jin Sekouba Kaba 《Journal of Applied Mathematics and Physics》 2021年第3期403-412,共10页
With the rapid growth of complexity and functionality of modern electronic systems, creating precise behavioral models of nonlinear circuits has become an attractive topic. Deep neural networks (DNNs) have been recogn... With the rapid growth of complexity and functionality of modern electronic systems, creating precise behavioral models of nonlinear circuits has become an attractive topic. Deep neural networks (DNNs) have been recognized as a powerful tool for nonlinear system modeling. To characterize the behavior of nonlinear circuits, a DNN based modeling approach is proposed in this paper. The procedure is illustrated by modeling a power amplifier (PA), which is a typical nonlinear circuit in electronic systems. The PA model is constructed based on a feedforward neural network with three hidden layers, and then Multisim circuit simulator is applied to generating the raw training data. Training and validation are carried out in Tensorflow deep learning framework. Compared with the commonly used polynomial model, the proposed DNN model exhibits a faster convergence rate and improves the mean squared error by 13 dB. The results demonstrate that the proposed DNN model can accurately depict the input-output characteristics of nonlinear circuits in both training and validation data sets. 展开更多
关键词 Nonlinear Circuits deep neural networks Behavioral model Power Amplifier
在线阅读 下载PDF
基于DeepONet的高自由度频率选择表面代理模型
3
作者 王铭恺 魏准 《电波科学学报》 北大核心 2026年第1期117-123,共7页
针对频率选择表面(frequency selective surface,FSS)在高维参数空间和复杂拓扑结构下建模效率低、仿真成本高的问题,提出了一种基于人工智能的电磁正向建模方法。构建以深度算子网络(deep operator network,DeepONet)为核心的神经网络... 针对频率选择表面(frequency selective surface,FSS)在高维参数空间和复杂拓扑结构下建模效率低、仿真成本高的问题,提出了一种基于人工智能的电磁正向建模方法。构建以深度算子网络(deep operator network,DeepONet)为核心的神经网络架构,分支网络引入改进型ResNet-18结构,有效提取FSS拓扑图像的多尺度空间特征;主干网络采用将频率作为显示输入,从而提升模型对频率响应的建模能力。本研究采用线下训练、线上测试的方法,建立拓扑结构与频率响应之间的非线性映射关系,实现对FSS在2~20 GHz频段内S21参数的高效预测。实验结果得到,所建模型在验证集上的平均相对误差为0.047 8、决定系数R2为0.994 41、平均单次预测时间为6 ms,表明模型在计算精度与推理效率上均具备良好性能。与传统有限元法和时域有限差分法相比,提出的基于人工智能的建模方法无需重复建模与网格剖分,显著降低了计算资源开销,为FSS等复杂电磁结构的快速建模与智能计算提供了一条可行的技术路径。 展开更多
关键词 频率选择表面(FSS) 人工智能 深度神经网络 正向代理模型 卷积神经网络 深度算子网络(deepONet)
在线阅读 下载PDF
HMM-Based Photo-Realistic Talking Face Synthesis Using Facial Expression Parameter Mapping with Deep Neural Networks
4
作者 Kazuki Sato Takashi Nose Akinori Ito 《Journal of Computer and Communications》 2017年第10期50-65,共16页
This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate represent... This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate representation that has a good correspondence with both of the input contexts and the output pixel data of face images. The sequences of the facial expression parameters are modeled using context-dependent HMMs with static and dynamic features. The mapping from the expression parameters to the target pixel images are trained using DNNs. We examine the required amount of the training data for HMMs and DNNs and compare the performance of the proposed technique with the conventional PCA-based technique through objective and subjective evaluation experiments. 展开更多
关键词 Visual-Speech SYNTHESIS TALKING Head Hidden MARKOV models (HMMs) deep neural networks (DNNs) FACIAL Expression Parameter
在线阅读 下载PDF
Review of Artificial Intelligence for Oil and Gas Exploration: Convolutional Neural Network Approaches and the U-Net 3D Model
5
作者 Weiyan Liu 《Open Journal of Geology》 CAS 2024年第4期578-593,共16页
Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Ou... Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Our review traces the evolution of CNN, emphasizing the adaptation and capabilities of the U-Net 3D model in automating seismic fault delineation with unprecedented accuracy. We find: 1) The transition from basic neural networks to sophisticated CNN has enabled remarkable advancements in image recognition, which are directly applicable to analyzing seismic data. The U-Net 3D model, with its innovative architecture, exemplifies this progress by providing a method for detailed and accurate fault detection with reduced manual interpretation bias. 2) The U-Net 3D model has demonstrated its superiority over traditional fault identification methods in several key areas: it has enhanced interpretation accuracy, increased operational efficiency, and reduced the subjectivity of manual methods. 3) Despite these achievements, challenges such as the need for effective data preprocessing, acquisition of high-quality annotated datasets, and achieving model generalization across different geological conditions remain. Future research should therefore focus on developing more complex network architectures and innovative training strategies to refine fault identification performance further. Our findings confirm the transformative potential of deep learning, particularly CNN like the U-Net 3D model, in geosciences, advocating for its broader integration to revolutionize geological exploration and seismic analysis. 展开更多
关键词 deep Learning Convolutional neural networks (CNN) Seismic Fault Identification U-Net 3D model Geological Exploration
在线阅读 下载PDF
Brain Encoding and Decoding in fMRI with Bidirectional Deep Generative Models 被引量:2
6
作者 Changde Du Jinpeng Li +1 位作者 Lijie Huang Huiguang He 《Engineering》 SCIE EI 2019年第5期948-953,共6页
Brain encoding and decoding via functional magnetic resonance imaging(fMRI)are two important aspects of visual perception neuroscience.Although previous researchers have made significant advances in brain encoding and... Brain encoding and decoding via functional magnetic resonance imaging(fMRI)are two important aspects of visual perception neuroscience.Although previous researchers have made significant advances in brain encoding and decoding models,existing methods still require improvement using advanced machine learning techniques.For example,traditional methods usually build the encoding and decoding models separately,and are prone to overfitting on a small dataset.In fact,effectively unifying the encoding and decoding procedures may allow for more accurate predictions.In this paper,we first review the existing encoding and decoding methods and discuss the potential advantages of a“bidirectional”modeling strategy.Next,we show that there are correspondences between deep neural networks and human visual streams in terms of the architecture and computational rules.Furthermore,deep generative models(e.g.,variational autoencoders(VAEs)and generative adversarial networks(GANs))have produced promising results in studies on brain encoding and decoding.Finally,we propose that the dual learning method,which was originally designed for machine translation tasks,could help to improve the performance of encoding and decoding models by leveraging large-scale unpaired data. 展开更多
关键词 BRAIN encoding and DECODING Functional magnetic resonance imaging deep neural networks deep GENERATIVE models Dual learning
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
7
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
神经网络滤波器剪枝技术研究综述
8
作者 王琳 宋权润 +1 位作者 耿世超 栾钟治 《计算机工程与应用》 北大核心 2026年第2期1-25,共25页
随着软硬件资源水平和计算能力的提高,深度神经网络在计算机视觉、自然语言处理、图像生成等多个领域迅速发展,引领深度学习在自动驾驶、医疗诊断等方向上不断突破。然而,随着模型深度的增加,庞大的参数量和计算资源消耗导致模型变得过... 随着软硬件资源水平和计算能力的提高,深度神经网络在计算机视觉、自然语言处理、图像生成等多个领域迅速发展,引领深度学习在自动驾驶、医疗诊断等方向上不断突破。然而,随着模型深度的增加,庞大的参数量和计算资源消耗导致模型变得过于复杂,难以在资源受限的环境进行训练和部署。为了减少网络模型的复杂度,提高模型的效率,研究者们提出了剪枝方法,通过减少模型中的冗余参数和连接实现模型的压缩和加速。滤波器剪枝是优化卷积神经网络的重要方法之一,通过改变网络中滤波器组和特征通道的数目来加速网络,且不依赖于特定算法或硬件平台。梳理了近年来国内外滤波器剪枝技术的研究进展,从滤波器重要性评估、剪枝及微调方式设计两个方面进行分类总结,并对主流滤波器剪枝方法的实验进行归纳,分析滤波器剪枝对模型精度和参数量的影响,并对未来的研究方向加以探讨。 展开更多
关键词 深度学习 深度卷积神经网络 模型压缩 滤波器剪枝 模型优化加速
在线阅读 下载PDF
融合ResNet-18与水动力模型的洪水演进快速预测
9
作者 童超 詹晗煜 +3 位作者 崔罡 刘康 欧阳磊 肖宏宇 《水资源保护》 北大核心 2026年第1期129-136,共8页
为实现高精度和高效率洪水演进预测,结合数据驱动与物理建模的双重优势,提出了融合残差神经网络(ResNet-18)与水动力模型Telemac2D的洪水演进快速预测算法,将Telemac2D生成的高精度洪水淹没数据作为训练样本,构建了基于一维ResNet-18的... 为实现高精度和高效率洪水演进预测,结合数据驱动与物理建模的双重优势,提出了融合残差神经网络(ResNet-18)与水动力模型Telemac2D的洪水演进快速预测算法,将Telemac2D生成的高精度洪水淹没数据作为训练样本,构建了基于一维ResNet-18的深度神经网络模型,并利用该模型对黄柏河流域下游尚家河河段洪水淹没水深与演进路径进行了实时动态预测和对比验证。结果表明:构建的ResNet-18模型对240组测试集预报结果的平均绝对误差和均方根误差分别为0.0332 m和0.0898 m,淹没范围的空间分布与Telemac2D模拟结果高度一致,相关系数达0.9981,对测量点水深的预测结果比卷积神经网络模型更精确,且计算效率相较传统水动力模型提升超300倍。 展开更多
关键词 洪水演进 残差神经网络 深度神经网络 Telemac2D 卷积神经网络模型 黄柏河流域
在线阅读 下载PDF
耦合物理机制和数据驱动的城市洪涝潮淹没快速模拟
10
作者 唐雯雯 刘立军 +1 位作者 张文婷 刘永志 《水电能源科学》 北大核心 2026年第2期16-21,共6页
城市洪水突发性强、损失巨大,传统的基于物理机制的水动力学洪水淹没模拟方法存在建模复杂、计算耗时等缺陷。为了满足城市洪涝潮灾害快速预报预警需求,尝试采用耦合物理机制和数据驱动的方法,以沿海洪涝高风险城市——浙江省临海市为... 城市洪水突发性强、损失巨大,传统的基于物理机制的水动力学洪水淹没模拟方法存在建模复杂、计算耗时等缺陷。为了满足城市洪涝潮灾害快速预报预警需求,尝试采用耦合物理机制和数据驱动的方法,以沿海洪涝高风险城市——浙江省临海市为例进行实证研究,利用基于物理机制的水动力学模型构建大规模样本集,建立洪水淹没深度学习模型,并开展洪水淹没深度学习模型精度评价及性能分析。研究结果表明,与水动力模型相比,耦合模型可以敏感地捕捉洪水演进过程中产生的洪水动态变化,高效准确地模拟淹没水深。由于计算效率高、性能优越和建模过程简单,研究结果有望为洪水淹没的实时短临预报提供支持。 展开更多
关键词 水动力学模型 深度学习模型 卷积神经网络 洪水淹没模拟 临海市
原文传递
考虑骨料级配和衍生特征的Stacking深度集成混凝土强度预测
11
作者 蔡志坚 王晓玲 +3 位作者 张君 王栋 吴斌平 余红玲 《水力发电学报》 北大核心 2026年第2期15-30,共16页
抗压强度预测对于混凝土施工质量控制具有重要意义。现有抗压强度预测模型多关注于初始配合比的影响,缺乏考虑骨料级配及衍生特征的影响及其可解释性分析。针对上述问题,本研究提出一种综合考虑骨料级配和衍生特征的Stacking深度集成抗... 抗压强度预测对于混凝土施工质量控制具有重要意义。现有抗压强度预测模型多关注于初始配合比的影响,缺乏考虑骨料级配及衍生特征的影响及其可解释性分析。针对上述问题,本研究提出一种综合考虑骨料级配和衍生特征的Stacking深度集成抗压强度预测模型,用于提升抗压强度预测精度和可解释性。该模型采用三种主流集成学习模型与卷积神经网络作为基学习器,以充分利用各主流算法的多样性和异质性。其中,为弥补基于树的模型对超参数敏感以及对高维特征提取能力弱的不足,引入通道注意力机制对卷积神经网络进行改进,进而提升特征提取能力。采用融合注意力机制的多层感知机模型作为元学习器,以降低模型过拟合风险。基于SHAP理论,深入挖掘混凝土强度预测的关键特征及特征交互影响。结果表明,所提模型综合考虑了骨料级配和衍生特征,抗压强度预测精度提高了27.53%。SHAP分析表明,水胶比,水,粉煤灰/水,水泥以及31.5~40 mm粒径的骨料质量分数为关键的模型驱动因素。本研究所提模型不仅提升了强度预测准确性,还通过可解释性分析揭示了影响混凝土强度的核心参数,为混凝土智能化管控提供了理论指导。 展开更多
关键词 混凝土 抗压强度预测 骨料级配 卷积神经网络 Stacking深度集成模型 SHAP分析
在线阅读 下载PDF
表面肌电肌力估计模型研究进展
12
作者 于丰帆 魏德健 +2 位作者 冯妍妍 马一凡 李振江 《传感器与微系统》 北大核心 2026年第1期8-13,共6页
表面肌电(sEMG)作为一种非侵入式技术,因易采集并含有人体肌肉的相关信息,而被用于肌力估计,在评估和治疗肌肉疾病方面具有广阔的研究前景。为了实现对肌力的准确估计,目前研究主要分为两类:一是改进sEMG信号处理方法;二是改进sEMG—肌... 表面肌电(sEMG)作为一种非侵入式技术,因易采集并含有人体肌肉的相关信息,而被用于肌力估计,在评估和治疗肌肉疾病方面具有广阔的研究前景。为了实现对肌力的准确估计,目前研究主要分为两类:一是改进sEMG信号处理方法;二是改进sEMG—肌力模型。该综述详细总结了sEMG肌力估计模型研究进展,首先概述了肌力与sEMG信号的关系;其次从传感器和数据集方面总结了sEMG信号的采集方式,并分析了现阶段sEMG信号预处理和特征提取的处理方法;然后针对sEMG—肌力模型研究方法的不同,将其分为深度学习、混合网络和其他肌力估计算法,对比总结了它们各自优势、局限性和实际应用;最后讨论了目前肌力估计的挑战与未来发展趋势。 展开更多
关键词 表面肌电 肌肉力量 预测模型 神经网络 深度学习
在线阅读 下载PDF
基于鲁棒分区水印的深度学习模型保护方法
13
作者 吕正浩 咸鹤群 《计算机科学》 北大核心 2026年第1期423-429,共7页
机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类... 机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类似于数字水印技术将水印嵌入图像的方式,模型水印通过将特定的标识嵌入机器学习模型中,以达到版权确认的目的。然而,现有的水印方案在实际应用中存在一些局限性。首先,水印的嵌入不可避免地会对模型性能产生一定影响;其次,水印可能会通过微调等技术手段被移除。针对此类问题,提出一种新型的神经网络水印方案,采用区域化和分阶段的嵌入方式。这种方法不仅旨在最大限度地减少对模型性能的影响,还力图提升水印本身的鲁棒性。在MNIST,CIFAR-10和CIFAR-100数据集上的实验验证了该方案的有效性。实验结果表明,该水印方案在保持水印存活率的同时,对模型性能的影响极小,相较于现有的基线水印方案,模型性能提升幅度最高可达18个百分点。此外,所提出的方案对微调等攻击手段表现出较强的鲁棒性,并且不受模型剪枝操作的影响。即便攻击者试图完全移除水印,也必须以显著降低模型性能为代价。 展开更多
关键词 深度神经网络 模型水印 版权验证 人工智能安全 水印鲁棒性 模型性能
在线阅读 下载PDF
基于GRU-Transformer与随机矩阵的机动群目标跟踪
14
作者 陈烨 梁苑 +1 位作者 李银伢 戚国庆 《兵工学报》 北大核心 2026年第1期282-295,共14页
针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更... 针对机动群目标跟踪问题,提出基于多任务多头门控循环单元变换器(Gated Recurrent Unit Transformer,GRU-Transformer)的机动模型辨识与当前统计(Current Statistical,CS)模型机动频率参数α回归,并将判别结果融入随机矩阵椭球-贝叶斯更新,实现群目标质心与扩展外形的联合跟踪。基于机动群目标时间序列量测数据,提取群目标运动多项特征参数,输入所提深度神经网络,实现机动群目标运动模型(匀速(Constant Velocity,CV)模型、匀加速(Constant Acceleration,CA)模型、CS模型)的精准辨别,若目标模型为CS运动模型,同时输出机动频率参数α的精确估计结果。运用随机矩阵群目标跟踪理论,提出一种基于贝叶斯状态估计架构的椭圆机动群目标跟踪方法。仿真实验结果分析表明:新方法可实现对机动椭圆群目标的精确稳健跟踪,相较于传统交互式多模型群目标跟踪方法,跟踪精度有显著提升。 展开更多
关键词 机动群目标跟踪 注意力GRU-Transformer深度神经网络 群目标跟踪 运动模型辨识 机动频率参数估计
在线阅读 下载PDF
基于机器学习的地震震相走时分析
15
作者 朱祥 陈凯 +3 位作者 张致伟 杨亚运 易江 张巡 《四川地震》 2026年第1期27-30,共4页
基于重庆地震台2009—2023年地震观测数据,通过对比实际走时、J-B走时和深度学习模型预测结果,系统评估了深度学习模型在地震震相走时预测中的应用效果。结果表明:(1)构建的深度学习模型对P、S等关键震相的预测准确率显著优于理论模型,... 基于重庆地震台2009—2023年地震观测数据,通过对比实际走时、J-B走时和深度学习模型预测结果,系统评估了深度学习模型在地震震相走时预测中的应用效果。结果表明:(1)构建的深度学习模型对P、S等关键震相的预测准确率显著优于理论模型,验证集平均准确率达99.8%;(2)震相走时误差的中位数绝对值稳定控制在3.0 s以内,较理论模型具有显著改善;(3)深度学习模型在提升预测精度的同时,还展现出一定的稳定性。该成果可为地震实时监测提供高精度的自动化震相识别解决方案。 展开更多
关键词 震相走时 机器学习 神经网络 深度学习模型
在线阅读 下载PDF
基于结构增强的层次化任务导向提示策略的对话推荐系统SetaCRS
16
作者 姜皓骞 张东 +1 位作者 李冠宇 陈恒 《计算机应用》 北大核心 2026年第2期368-377,共10页
近年来,许多对话推荐系统的研究采用预训练语言模型作为统一框架,旨在解决传统多模块架构中模块间协同不当的问题;然而,这些方法难以发挥任务之间的协同作用,且无法有效捕获输入中潜在的结构化信息,这些问题很大程度上削弱了对话推荐系... 近年来,许多对话推荐系统的研究采用预训练语言模型作为统一框架,旨在解决传统多模块架构中模块间协同不当的问题;然而,这些方法难以发挥任务之间的协同作用,且无法有效捕获输入中潜在的结构化信息,这些问题很大程度上削弱了对话推荐系统在实际应用场景中的表现。因此,提出一种基于结构增强的层次化任务导向提示策略的对话推荐系统SetaCRS。SetaCRS利用异质图注意力神经网络建模用户系统历史对话中的序列共现信息。此外,构造层次化的全局任务描述和特定子任务描述,从而帮助模型捕获并利用当前子任务和总任务序列之间的联系。在DuRecDial与TG-ReDial这2个公开数据集上的实验结果表明,相较于UniMIND(Unified MultI-goal conversational recommeNDer system),SetaCRS在语义F1上分别提升了8.53%和1.55%,并在平均倒数排名(MRR)@10上分别提升了3.02%和9.54%。可见,SetaCRS能够利用所捕捉的任务关联性与对话结构信息来有效提升推荐准确性和回复质量。 展开更多
关键词 对话推荐系统 提示工程 预训练语言模型 图神经网络 深度学习
在线阅读 下载PDF
基于改进YOLO v3模型与Deep-SORT算法的道路车辆检测方法 被引量:34
17
作者 马永杰 马芸婷 +1 位作者 程时升 马义德 《交通运输工程学报》 EI CSCD 北大核心 2021年第2期222-231,共10页
针对道路车辆实时检测遮挡严重与小目标车辆漏检率高的问题,提出了基于改进YOLO v3模型和Deep-SORT算法的车辆检测方法;为提高模型对道路车辆的检测能力,采用K-meansSymbolk@pSymbolk@p聚类算法对目标候选框进行聚类分析,选择合适的... 针对道路车辆实时检测遮挡严重与小目标车辆漏检率高的问题,提出了基于改进YOLO v3模型和Deep-SORT算法的车辆检测方法;为提高模型对道路车辆的检测能力,采用K-meansSymbolk@pSymbolk@p聚类算法对目标候选框进行聚类分析,选择合适的Anchor box数量,并在网络浅层增加了特征提取层,可提取到更精细的车辆特征;为加强网络对远近不同目标的鲁棒性,在保留原YOLO v3模型输出层的同时,增加了一层输出层,将52像素×52像素输出特征图经过上采样后得到104像素×104像素特征图,并将其与浅层同尺寸特征图进行拼接,实现车辆目标的检测;为了降低目标遮挡对检测效果的影响,提高对视频上下帧之间关联信息的关注度,将改进YOLO v3模型和Deep-SORT算法相结合,以此来弥补两者之间的不足。试验结果表明:改进YOLO v3模型有效地提高了车辆检测的性能,与在网络浅层增加特征提取层的模型相比,平均精度提高了1.4%,与增加一层输出层的模型相比,平均精确度提高了0.8%,说明改进YOLO v3模型提取的特征表达能力更强,增强了网络对小目标的检测能力;改进YOLO v3模型在引入Deep-SORT算法后,查准率和召回率分别达到90.16%和91.34%,相比改进YOLO v3模型,查准率和召回率分别提高了1.48%和4.20%,同时保证了检测速度,对于不同大小目标的检测具有良好的鲁棒性。 展开更多
关键词 交通图像识别 卷积神经网络 车辆检测 YOLO v3模型 deep-SORT算法 K-means++聚类算法
原文传递
基于TCN-Attention-LSTM的大沽河流域场次洪水预测模型
18
作者 翟明慧 桑国庆 +2 位作者 吴先敏 刘薇 刘阳 《水电能源科学》 北大核心 2026年第2期22-27,共6页
为提升深度学习模型在径流模拟中的预测性能,构建了融合时域卷积网络(TCN)、注意力机制(Attention)、长短期记忆网络(LSTM)的耦合模型,探究了耦合模型在不同预见期下的径流模拟和预测能力,并与其他深度学习模型进行了对比分析。在大沽... 为提升深度学习模型在径流模拟中的预测性能,构建了融合时域卷积网络(TCN)、注意力机制(Attention)、长短期记忆网络(LSTM)的耦合模型,探究了耦合模型在不同预见期下的径流模拟和预测能力,并与其他深度学习模型进行了对比分析。在大沽河流域的应用结果表明,相同预见期条件下,TCN-Attention-LSTM模型表现出了较好的径流模拟效果,模拟精度优于其他对比模型,在预见期为1~6 h时纳什效率系数N_(NSE)均在0.80以上;随着预见期增加,TCN-Attention-LSTM耦合模型在预见期为4~6 h时优势更显著,当预见期为6 h时,TCN-Attention-LSTM模型的纳什效率系数N_(NSE)仍达到0.82,模型预报性能明显优于其他模型,预报精度呈现缓慢下降趋势,具有更好的鲁棒性。研究结果可为流域洪水预报提供新思路。 展开更多
关键词 径流模拟及预测 深度学习模型 时间卷积神经网络 LSTM模型 注意力机制
原文传递
基于扩散模型的无人机遥感目标检测物理对抗攻击方法研究
19
作者 夏筱彦 张宇 +1 位作者 胡锡坤 钟平 《空天防御》 2026年第1期52-62,共11页
深度神经网络虽然在各类视觉任务中取得了显著进展,但易受到对抗样本的攻击;相较于数字域对抗攻击,物理域对抗攻击更具挑战;针对无人机遥感图像目标检测的对抗攻击需在多视角、距离变化及光照差异等复杂条件下保持稳定的有效性,攻击方... 深度神经网络虽然在各类视觉任务中取得了显著进展,但易受到对抗样本的攻击;相较于数字域对抗攻击,物理域对抗攻击更具挑战;针对无人机遥感图像目标检测的对抗攻击需在多视角、距离变化及光照差异等复杂条件下保持稳定的有效性,攻击方法的优化过程需充分考虑真实物理成像环境的动态性与多样性。现有物理域对抗攻击方法虽能降低目标检测模型性能,但这些方法通常仅依赖像素级的局部纹理优化,导致生成的对抗纹理模式单一、适应性有限。为解决上述问题,本文提出一种基于扩散模型的物理对抗攻击方法。该方法以预训练扩散模型作为生成器,结合图像与文本先验特征引导对抗纹理的生成,基于全覆盖的物理对抗攻击框架实现无人机遥感目标检测任务下的车辆伪装。实验结果表明:本文方法在多个目标检测模型上均表现出较高的攻击成功率与良好的跨模型迁移能力,且在纹理多样性和稳定性方面均优于对比方法。 展开更多
关键词 无人机遥感图像 深度神经网络 物理对抗攻击 扩散模型 目标检测
在线阅读 下载PDF
基于贝叶斯优化和特征融合混合模型的短期风电功率预测
20
作者 付锦程 杨仕友 《计算机应用》 北大核心 2026年第2期652-658,共7页
为了提高短期风电功率预测的准确性,提出一种基于贝叶斯优化和特征融合的xLSTM(extended Long Short-Term Memory)-Transformer模型。该模型综合应用长短期记忆(LSTM)网络的时序处理能力和Transformer的自注意力机制的动态特征融合能力... 为了提高短期风电功率预测的准确性,提出一种基于贝叶斯优化和特征融合的xLSTM(extended Long Short-Term Memory)-Transformer模型。该模型综合应用长短期记忆(LSTM)网络的时序处理能力和Transformer的自注意力机制的动态特征融合能力。借助贝叶斯优化方法,模型可在较少的迭代次数条件下优化超参数,显著降低模型对计算资源的依赖。实验结果表明,内蒙古某风电场数据集上,与单一的LSTM模型、Transformer模型、门控循环单元(GRU)模型以及未采用贝叶斯优化和特征融合的xLSTM-Transformer模型相比,当步长(LookBack)为4和8时,所提模型的决定系数R2较基准模型平均提升1.2%~11.3%;平均绝对误差(MAE)平均降低12.8%~38.4%;均方根误差(RMSE)平均降低8.6%~35.8%。结果表明,所提模型在短历史输入条件下具有更高的预测精度与稳定性。 展开更多
关键词 风电功率预测 神经网络模型 贝叶斯优化 特征融合 深度学习
在线阅读 下载PDF
上一页 1 2 52 下一页 到第
使用帮助 返回顶部