期刊文献+
共找到1,663篇文章
< 1 2 84 >
每页显示 20 50 100
Action Recognition in Surveillance Videos with Combined Deep Network Models
1
作者 ZHANG Diankai ZHAO Rui-Wei +3 位作者 SHEN Lin CHEN Shaoxiang SUN Zhenfeng JIANG Yu-Gang 《ZTE Communications》 2016年第B12期54-60,共7页
Action recognition is an important topic in computer vision. Recently, deep learning technologies have been successfully used in lots of applications including video data for sloving recognition problems. However, mos... Action recognition is an important topic in computer vision. Recently, deep learning technologies have been successfully used in lots of applications including video data for sloving recognition problems. However, most existing deep learning based recognition frameworks are not optimized for action in the surveillance videos. In this paper, we propose a novel method to deal with the recognition of different types of actions in outdoor surveillance videos. The proposed method first introduces motion compensation to improve the detection of human target. Then, it uses three different types of deep models with single and sequenced images as inputs for the recognition of different types of actions. Finally, predictions from different models are fused with a linear model. Experimental results show that the proposed method works well on the real surveillance videos. 展开更多
关键词 action recognition deep network models model fusion surveillance video
在线阅读 下载PDF
基于DeepONet的高自由度频率选择表面代理模型
2
作者 王铭恺 魏准 《电波科学学报》 北大核心 2026年第1期117-123,共7页
针对频率选择表面(frequency selective surface,FSS)在高维参数空间和复杂拓扑结构下建模效率低、仿真成本高的问题,提出了一种基于人工智能的电磁正向建模方法。构建以深度算子网络(deep operator network,DeepONet)为核心的神经网络... 针对频率选择表面(frequency selective surface,FSS)在高维参数空间和复杂拓扑结构下建模效率低、仿真成本高的问题,提出了一种基于人工智能的电磁正向建模方法。构建以深度算子网络(deep operator network,DeepONet)为核心的神经网络架构,分支网络引入改进型ResNet-18结构,有效提取FSS拓扑图像的多尺度空间特征;主干网络采用将频率作为显示输入,从而提升模型对频率响应的建模能力。本研究采用线下训练、线上测试的方法,建立拓扑结构与频率响应之间的非线性映射关系,实现对FSS在2~20 GHz频段内S21参数的高效预测。实验结果得到,所建模型在验证集上的平均相对误差为0.047 8、决定系数R2为0.994 41、平均单次预测时间为6 ms,表明模型在计算精度与推理效率上均具备良好性能。与传统有限元法和时域有限差分法相比,提出的基于人工智能的建模方法无需重复建模与网格剖分,显著降低了计算资源开销,为FSS等复杂电磁结构的快速建模与智能计算提供了一条可行的技术路径。 展开更多
关键词 频率选择表面(FSS) 人工智能 深度神经网络 正向代理模型 卷积神经网络 深度算子网络(deepONet)
在线阅读 下载PDF
Deep Neural Network Based Behavioral Model of Nonlinear Circuits
3
作者 Zhe Jin Sekouba Kaba 《Journal of Applied Mathematics and Physics》 2021年第3期403-412,共10页
With the rapid growth of complexity and functionality of modern electronic systems, creating precise behavioral models of nonlinear circuits has become an attractive topic. Deep neural networks (DNNs) have been recogn... With the rapid growth of complexity and functionality of modern electronic systems, creating precise behavioral models of nonlinear circuits has become an attractive topic. Deep neural networks (DNNs) have been recognized as a powerful tool for nonlinear system modeling. To characterize the behavior of nonlinear circuits, a DNN based modeling approach is proposed in this paper. The procedure is illustrated by modeling a power amplifier (PA), which is a typical nonlinear circuit in electronic systems. The PA model is constructed based on a feedforward neural network with three hidden layers, and then Multisim circuit simulator is applied to generating the raw training data. Training and validation are carried out in Tensorflow deep learning framework. Compared with the commonly used polynomial model, the proposed DNN model exhibits a faster convergence rate and improves the mean squared error by 13 dB. The results demonstrate that the proposed DNN model can accurately depict the input-output characteristics of nonlinear circuits in both training and validation data sets. 展开更多
关键词 Nonlinear Circuits deep Neural networks Behavioral model Power Amplifier
在线阅读 下载PDF
A Scalable Model of the Substrate Network in Deep n-Well RF MOSFETs with Multiple Fingers
4
作者 Jun Liu Marissa Condon 《Circuits and Systems》 2011年第2期91-100,共10页
A novel scalable model of substrate components for deep n-well (DNW) RF MOSFETs with different number of fingers is presented for the first time. The test structure developed in [1] is employed to directly access the ... A novel scalable model of substrate components for deep n-well (DNW) RF MOSFETs with different number of fingers is presented for the first time. The test structure developed in [1] is employed to directly access the characteristics of the substrate to extract the different substrate components. A methodology is developed to directly extract the parameters for the substrate network from the measured data. By using the measured two-port data of a set of nMOSFETs with different number of fingers, with the DNW in grounded and float configuration, respectively, the parameters of the scalable substrate model are obtained. The method and the substrate model are further verified and validated by matching the measured and simulated output admittances. Excellent agreement up to 40 GHz for configurations in common-source has been achieved. 展开更多
关键词 deep N-Well (DNW) RF MOSFETS Substrate network SCALABLE model
暂未订购
Brain Encoding and Decoding in fMRI with Bidirectional Deep Generative Models 被引量:2
5
作者 Changde Du Jinpeng Li +1 位作者 Lijie Huang Huiguang He 《Engineering》 SCIE EI 2019年第5期948-953,共6页
Brain encoding and decoding via functional magnetic resonance imaging(fMRI)are two important aspects of visual perception neuroscience.Although previous researchers have made significant advances in brain encoding and... Brain encoding and decoding via functional magnetic resonance imaging(fMRI)are two important aspects of visual perception neuroscience.Although previous researchers have made significant advances in brain encoding and decoding models,existing methods still require improvement using advanced machine learning techniques.For example,traditional methods usually build the encoding and decoding models separately,and are prone to overfitting on a small dataset.In fact,effectively unifying the encoding and decoding procedures may allow for more accurate predictions.In this paper,we first review the existing encoding and decoding methods and discuss the potential advantages of a“bidirectional”modeling strategy.Next,we show that there are correspondences between deep neural networks and human visual streams in terms of the architecture and computational rules.Furthermore,deep generative models(e.g.,variational autoencoders(VAEs)and generative adversarial networks(GANs))have produced promising results in studies on brain encoding and decoding.Finally,we propose that the dual learning method,which was originally designed for machine translation tasks,could help to improve the performance of encoding and decoding models by leveraging large-scale unpaired data. 展开更多
关键词 BRAIN encoding and DECODING Functional magnetic resonance imaging deep neural networks deep GENERATIVE models Dual learning
在线阅读 下载PDF
Aquaculture area extraction and vulnerability assessment in Sanduao based on richer convolutional features network model 被引量:5
6
作者 LIU Yueming YANG Xiaomei +3 位作者 WANG Zhihua LU Chen LI Zhi YANG Fengshuo 《Journal of Oceanology and Limnology》 SCIE CAS CSCD 2019年第6期1941-1954,共14页
Sanduao is an important sea-breeding bay in Fujian,South China and holds a high economic status in aquaculture.Quickly and accurately obtaining information including the distribution area,quantity,and aquaculture area... Sanduao is an important sea-breeding bay in Fujian,South China and holds a high economic status in aquaculture.Quickly and accurately obtaining information including the distribution area,quantity,and aquaculture area is important for breeding area planning,production value estimation,ecological survey,and storm surge prevention.However,as the aquaculture area expands,the seawater background becomes increasingly complex and spectral characteristics differ dramatically,making it difficult to determine the aquaculture area.In this study,we used a high-resolution remote-sensing satellite GF-2 image to introduce a deep-learning Richer Convolutional Features(RCF)network model to extract the aquaculture area.Then we used the density of aquaculture as an assessment index to assess the vulnerability of aquaculture areas in Sanduao.The results demonstrate that this method does not require land and water separation of the area in advance,and good extraction can be achieved in the areas with more sediment and waves,with an extraction accuracy>93%,which is suitable for large-scale aquaculture area extraction.Vulnerability assessment results indicate that the density of aquaculture in the eastern part of Sanduao is considerably high,reaching a higher vulnerability level than other parts. 展开更多
关键词 AQUACULTURE area VULNERABILITY assessment Richer Convolutional Features(RCF)network model deep learning HIGH-RESOLUTION REMOTE SENSING
在线阅读 下载PDF
基于PI-DeepONet模型的IGBT模块结温估算方法
7
作者 项江鑫 霍思佳 +2 位作者 乐应波 杨程 崔昊杨 《半导体技术》 北大核心 2025年第7期746-755,共10页
时变高功率工况下,IGBT模块结温的实时准确估算是高效实施热管理策略的基础。但现有方法中,有限元分析(FEA)法难以实时响应,热网络模型法估算准确率低,两者均无法满足结温估算实时性和准确率的均衡性需求。针对这些问题,提出了一种基于... 时变高功率工况下,IGBT模块结温的实时准确估算是高效实施热管理策略的基础。但现有方法中,有限元分析(FEA)法难以实时响应,热网络模型法估算准确率低,两者均无法满足结温估算实时性和准确率的均衡性需求。针对这些问题,提出了一种基于物理约束深度算子网络(PI-DeepONet)模型的IGBT模块结温实时准确估算方法。首先,在算子网络的损失函数中引入物理约束,设计了具有物理约束的PI-DeepONet模型;随后,将FEA计算的IGBT模块热特性参数与时空位置信息作为输入对模型进行训练;最后,利用训练所得的最优算子估算模块结温。仿真结果表明,该模型兼顾了结温估算的准确率和实时性,能够适应复杂工况,为IGBT模块热管理策略的高效实施提供了可靠的理论支持与技术保障。 展开更多
关键词 IGBT 结温估算 物理约束深度算子网络(PI-deepONet)模型 有限元分析(FEA)法 热网络模型 热管理策略
原文传递
HMM-Based Photo-Realistic Talking Face Synthesis Using Facial Expression Parameter Mapping with Deep Neural Networks
8
作者 Kazuki Sato Takashi Nose Akinori Ito 《Journal of Computer and Communications》 2017年第10期50-65,共16页
This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate represent... This paper proposes a technique for synthesizing a pixel-based photo-realistic talking face animation using two-step synthesis with HMMs and DNNs. We introduce facial expression parameters as an intermediate representation that has a good correspondence with both of the input contexts and the output pixel data of face images. The sequences of the facial expression parameters are modeled using context-dependent HMMs with static and dynamic features. The mapping from the expression parameters to the target pixel images are trained using DNNs. We examine the required amount of the training data for HMMs and DNNs and compare the performance of the proposed technique with the conventional PCA-based technique through objective and subjective evaluation experiments. 展开更多
关键词 Visual-Speech SYNTHESIS TALKING Head Hidden MARKOV models (HMMs) deep Neural networks (DNNs) FACIAL Expression Parameter
在线阅读 下载PDF
面向视觉算法的知识蒸馏研究综述
9
作者 潘海为 于丰铭 +3 位作者 张可佳 兰海燕 孟庆宇 李哲 《计算机研究与发展》 北大核心 2026年第1期90-122,共33页
知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研... 知识蒸馏作为深度学习中的关键技术,通过将大型教师模型的知识传递给较小的学生模型,实现了模型的压缩与加速。在保证性能的前提下,显著减少了计算资源和存储需求,促进了高性能模型在资源受限的边缘设备上的部署。围绕知识蒸馏的最新研究进展进行了系统性的综述,从知识类型和师生模型架构2个角度对知识蒸馏进行分类,详细汇总了输出特征知识、中间特征知识、关系特征知识3种典型知识类型的蒸馏方法,以及卷积架构到卷积架构、卷积架构到ViT(vision Transformer)架构、ViT架构到卷积架构和ViT架构到ViT架构的蒸馏方法;探讨了离线蒸馏、在线蒸馏、自蒸馏、无数据蒸馏、多教师蒸馏和助理蒸馏的学习方式;归纳了基于蒸馏过程、知识结构、温度系数及损失函数的蒸馏优化方法,分析了对抗性技术、自动机器学习、强化学习和扩散模型对蒸馏的改进,并总结了蒸馏技术在常见应用中的实现。尽管知识蒸馏取得了显著进展,但在实际应用和理论研究中仍面临诸多挑战。最后,对这些问题进行了深入分析,并对未来发展方向提出了见解。 展开更多
关键词 知识蒸馏 模型压缩 深度学习 卷积神经网络 视觉Transformer
在线阅读 下载PDF
Review of Artificial Intelligence for Oil and Gas Exploration: Convolutional Neural Network Approaches and the U-Net 3D Model
10
作者 Weiyan Liu 《Open Journal of Geology》 CAS 2024年第4期578-593,共16页
Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Ou... Deep learning, especially through convolutional neural networks (CNN) such as the U-Net 3D model, has revolutionized fault identification from seismic data, representing a significant leap over traditional methods. Our review traces the evolution of CNN, emphasizing the adaptation and capabilities of the U-Net 3D model in automating seismic fault delineation with unprecedented accuracy. We find: 1) The transition from basic neural networks to sophisticated CNN has enabled remarkable advancements in image recognition, which are directly applicable to analyzing seismic data. The U-Net 3D model, with its innovative architecture, exemplifies this progress by providing a method for detailed and accurate fault detection with reduced manual interpretation bias. 2) The U-Net 3D model has demonstrated its superiority over traditional fault identification methods in several key areas: it has enhanced interpretation accuracy, increased operational efficiency, and reduced the subjectivity of manual methods. 3) Despite these achievements, challenges such as the need for effective data preprocessing, acquisition of high-quality annotated datasets, and achieving model generalization across different geological conditions remain. Future research should therefore focus on developing more complex network architectures and innovative training strategies to refine fault identification performance further. Our findings confirm the transformative potential of deep learning, particularly CNN like the U-Net 3D model, in geosciences, advocating for its broader integration to revolutionize geological exploration and seismic analysis. 展开更多
关键词 deep Learning Convolutional Neural networks (CNN) Seismic Fault Identification U-Net 3D model Geological Exploration
在线阅读 下载PDF
神经网络滤波器剪枝技术研究综述
11
作者 王琳 宋权润 +1 位作者 耿世超 栾钟治 《计算机工程与应用》 北大核心 2026年第2期1-25,共25页
随着软硬件资源水平和计算能力的提高,深度神经网络在计算机视觉、自然语言处理、图像生成等多个领域迅速发展,引领深度学习在自动驾驶、医疗诊断等方向上不断突破。然而,随着模型深度的增加,庞大的参数量和计算资源消耗导致模型变得过... 随着软硬件资源水平和计算能力的提高,深度神经网络在计算机视觉、自然语言处理、图像生成等多个领域迅速发展,引领深度学习在自动驾驶、医疗诊断等方向上不断突破。然而,随着模型深度的增加,庞大的参数量和计算资源消耗导致模型变得过于复杂,难以在资源受限的环境进行训练和部署。为了减少网络模型的复杂度,提高模型的效率,研究者们提出了剪枝方法,通过减少模型中的冗余参数和连接实现模型的压缩和加速。滤波器剪枝是优化卷积神经网络的重要方法之一,通过改变网络中滤波器组和特征通道的数目来加速网络,且不依赖于特定算法或硬件平台。梳理了近年来国内外滤波器剪枝技术的研究进展,从滤波器重要性评估、剪枝及微调方式设计两个方面进行分类总结,并对主流滤波器剪枝方法的实验进行归纳,分析滤波器剪枝对模型精度和参数量的影响,并对未来的研究方向加以探讨。 展开更多
关键词 深度学习 深度卷积神经网络 模型压缩 滤波器剪枝 模型优化加速
在线阅读 下载PDF
地铁深基坑施工坍塌风险耦合研究
12
作者 方俊 黄金艳 +1 位作者 徐小琴 王景昌 《安全与环境学报》 北大核心 2026年第2期483-495,共13页
为实现地铁深基坑施工坍塌事故多因素耦合致灾机制解析与精准风险管控策略制定,提出了一种基于N-K模型和贝叶斯网络(Bayesian Network,BN)的定量耦合风险评估方法。通过对113份地铁深基坑施工坍塌事故报告的分析,识别出5类主要风险因素... 为实现地铁深基坑施工坍塌事故多因素耦合致灾机制解析与精准风险管控策略制定,提出了一种基于N-K模型和贝叶斯网络(Bayesian Network,BN)的定量耦合风险评估方法。通过对113份地铁深基坑施工坍塌事故报告的分析,识别出5类主要风险因素(人、物、管、环和技)。通过N-K模型解构多风险耦合效应,揭示风险耦合演化规律,基于N-K模型计算结果确定贝叶斯网络模型结构及参数,利用贝叶斯网络敏感性分析评估风险因素对显著风险耦合情境的影响,逆向溯源关键风险因素。结果表明,地铁深基坑施工坍塌风险随耦合因素种类的增加而变大,其中人-物-管-环-技风险耦合值最大、发生概率最高。风险因素c_(4)(施工现场安全监管和隐患排查不到位)、d_(1)(地质水文条件恶劣)、b_(4)(材料、构件质量或强度不合格)、a_(1)(安全风险意识差)和a_(5)(违规违章施工)在高风险耦合情境中表现出高敏感性,对地铁深基坑施工坍塌风险耦合起着关键作用。 展开更多
关键词 安全工程 地铁深基坑 施工坍塌 风险耦合 N-K模型 贝叶斯网络
原文传递
考虑骨料级配和衍生特征的Stacking深度集成混凝土强度预测
13
作者 蔡志坚 王晓玲 +3 位作者 张君 王栋 吴斌平 余红玲 《水力发电学报》 北大核心 2026年第2期15-30,共16页
抗压强度预测对于混凝土施工质量控制具有重要意义。现有抗压强度预测模型多关注于初始配合比的影响,缺乏考虑骨料级配及衍生特征的影响及其可解释性分析。针对上述问题,本研究提出一种综合考虑骨料级配和衍生特征的Stacking深度集成抗... 抗压强度预测对于混凝土施工质量控制具有重要意义。现有抗压强度预测模型多关注于初始配合比的影响,缺乏考虑骨料级配及衍生特征的影响及其可解释性分析。针对上述问题,本研究提出一种综合考虑骨料级配和衍生特征的Stacking深度集成抗压强度预测模型,用于提升抗压强度预测精度和可解释性。该模型采用三种主流集成学习模型与卷积神经网络作为基学习器,以充分利用各主流算法的多样性和异质性。其中,为弥补基于树的模型对超参数敏感以及对高维特征提取能力弱的不足,引入通道注意力机制对卷积神经网络进行改进,进而提升特征提取能力。采用融合注意力机制的多层感知机模型作为元学习器,以降低模型过拟合风险。基于SHAP理论,深入挖掘混凝土强度预测的关键特征及特征交互影响。结果表明,所提模型综合考虑了骨料级配和衍生特征,抗压强度预测精度提高了27.53%。SHAP分析表明,水胶比,水,粉煤灰/水,水泥以及31.5~40 mm粒径的骨料质量分数为关键的模型驱动因素。本研究所提模型不仅提升了强度预测准确性,还通过可解释性分析揭示了影响混凝土强度的核心参数,为混凝土智能化管控提供了理论指导。 展开更多
关键词 混凝土 抗压强度预测 骨料级配 卷积神经网络 Stacking深度集成模型 SHAP分析
在线阅读 下载PDF
融合ResNet-18与水动力模型的洪水演进快速预测
14
作者 童超 詹晗煜 +3 位作者 崔罡 刘康 欧阳磊 肖宏宇 《水资源保护》 北大核心 2026年第1期129-136,共8页
为实现高精度和高效率洪水演进预测,结合数据驱动与物理建模的双重优势,提出了融合残差神经网络(ResNet-18)与水动力模型Telemac2D的洪水演进快速预测算法,将Telemac2D生成的高精度洪水淹没数据作为训练样本,构建了基于一维ResNet-18的... 为实现高精度和高效率洪水演进预测,结合数据驱动与物理建模的双重优势,提出了融合残差神经网络(ResNet-18)与水动力模型Telemac2D的洪水演进快速预测算法,将Telemac2D生成的高精度洪水淹没数据作为训练样本,构建了基于一维ResNet-18的深度神经网络模型,并利用该模型对黄柏河流域下游尚家河河段洪水淹没水深与演进路径进行了实时动态预测和对比验证。结果表明:构建的ResNet-18模型对240组测试集预报结果的平均绝对误差和均方根误差分别为0.0332 m和0.0898 m,淹没范围的空间分布与Telemac2D模拟结果高度一致,相关系数达0.9981,对测量点水深的预测结果比卷积神经网络模型更精确,且计算效率相较传统水动力模型提升超300倍。 展开更多
关键词 洪水演进 残差神经网络 深度神经网络 Telemac2D 卷积神经网络模型 黄柏河流域
在线阅读 下载PDF
生成式网络研究及应用综述
15
作者 沈淦杰 张琳 +1 位作者 李泽慧 山显英 《计算机工程与应用》 北大核心 2026年第3期21-39,共19页
生成对抗网络(GAN)自提出以来,就成为了深度学习领域最具影响力的生成模型之一,其在计算机视觉、自然语言处理、医学影像等多个领域均有所应用。GAN由生成器和判别器构成,通过对抗训练不断优化,以生成高度逼真的数据。过去十余年间GAN... 生成对抗网络(GAN)自提出以来,就成为了深度学习领域最具影响力的生成模型之一,其在计算机视觉、自然语言处理、医学影像等多个领域均有所应用。GAN由生成器和判别器构成,通过对抗训练不断优化,以生成高度逼真的数据。过去十余年间GAN迅速发展,涌现出众多变种,大幅提升了训练稳定性和生成质量,并逐步与Transformer、大语言模型、扩散模型等新兴的深度学习技术融合,拓展了应用范围。但其仍面临模式崩溃、训练不稳定、评估标准不足及计算资源消耗高等挑战,研究人员也在不断探索优化策略来提升它的稳定性和泛化能力。系统回顾了GAN的发展历程,重点介绍其基本架构、主要变种及关键应用,涵盖计算机视觉、自然语言处理、医学影像、音乐生成和时间序列分析等领域;探讨了GAN目前的核心挑战及优化策略,并展望了未来发展趋势。 展开更多
关键词 生成对抗网络(GAN) 深度学习 生成模型 变体及应用
在线阅读 下载PDF
表面肌电肌力估计模型研究进展
16
作者 于丰帆 魏德健 +2 位作者 冯妍妍 马一凡 李振江 《传感器与微系统》 北大核心 2026年第1期8-13,共6页
表面肌电(sEMG)作为一种非侵入式技术,因易采集并含有人体肌肉的相关信息,而被用于肌力估计,在评估和治疗肌肉疾病方面具有广阔的研究前景。为了实现对肌力的准确估计,目前研究主要分为两类:一是改进sEMG信号处理方法;二是改进sEMG—肌... 表面肌电(sEMG)作为一种非侵入式技术,因易采集并含有人体肌肉的相关信息,而被用于肌力估计,在评估和治疗肌肉疾病方面具有广阔的研究前景。为了实现对肌力的准确估计,目前研究主要分为两类:一是改进sEMG信号处理方法;二是改进sEMG—肌力模型。该综述详细总结了sEMG肌力估计模型研究进展,首先概述了肌力与sEMG信号的关系;其次从传感器和数据集方面总结了sEMG信号的采集方式,并分析了现阶段sEMG信号预处理和特征提取的处理方法;然后针对sEMG—肌力模型研究方法的不同,将其分为深度学习、混合网络和其他肌力估计算法,对比总结了它们各自优势、局限性和实际应用;最后讨论了目前肌力估计的挑战与未来发展趋势。 展开更多
关键词 表面肌电 肌肉力量 预测模型 神经网络 深度学习
在线阅读 下载PDF
基于鲁棒分区水印的深度学习模型保护方法
17
作者 吕正浩 咸鹤群 《计算机科学》 北大核心 2026年第1期423-429,共7页
机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类... 机器学习涉及到昂贵的数据收集和训练成本,模型所有者可能会担心自己的模型遭到未授权的复制或使用,损害到模型所有者的知识产权。因此,如何有效保护这些模型的知识产权成为一个亟待解决的问题。为此,研究人员提出了模型水印的概念。类似于数字水印技术将水印嵌入图像的方式,模型水印通过将特定的标识嵌入机器学习模型中,以达到版权确认的目的。然而,现有的水印方案在实际应用中存在一些局限性。首先,水印的嵌入不可避免地会对模型性能产生一定影响;其次,水印可能会通过微调等技术手段被移除。针对此类问题,提出一种新型的神经网络水印方案,采用区域化和分阶段的嵌入方式。这种方法不仅旨在最大限度地减少对模型性能的影响,还力图提升水印本身的鲁棒性。在MNIST,CIFAR-10和CIFAR-100数据集上的实验验证了该方案的有效性。实验结果表明,该水印方案在保持水印存活率的同时,对模型性能的影响极小,相较于现有的基线水印方案,模型性能提升幅度最高可达18个百分点。此外,所提出的方案对微调等攻击手段表现出较强的鲁棒性,并且不受模型剪枝操作的影响。即便攻击者试图完全移除水印,也必须以显著降低模型性能为代价。 展开更多
关键词 深度神经网络 模型水印 版权验证 人工智能安全 水印鲁棒性 模型性能
在线阅读 下载PDF
基于大语言模型和深度网络的认知评估量表自动诊断
18
作者 陈涵 徐泽锋 +4 位作者 蒋究 樊凡 章军建 何楚 王文伟 《计算机科学》 北大核心 2026年第3期41-51,共11页
认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究... 认知评估量表是认知障碍快速筛查的重要评定工具之一,传统方法依赖于医生的经验和判断,难以保证诊断结果客观准确。深度网络技术的发展和大语言模型的兴起推动了医疗智能辅助诊断的进步,开展针对医学认知评估量表自动化辅助诊断的研究有较大意义。针对这一问题,聚焦于一个常用认知评估量表——蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA),提出由大语言模型和基于深度网络的图像分类模型组成的自动诊断MoCA的框架,并在此框架下选用模型。为增强基础模型对量表题目的处理能力,提出了融合线性注意力的CSWin-FLA Transformer(Cross-Shaped Window With Focused Linear Attention Transfromer)和基于少样本的自动生成提示方法AGPoFS(Automatic Generation of Prompts Based on Fewer Samples),并设计了一个MoCA诊断流程。鉴于不存在公开的MoCA数据集,收集整理了武汉大学中南医院提供的量表数据组成数据集,从各个方法到整体系统分别进行实验,结果表明,该系统在提出的数据集上取得了最好的应用性能,证明了相关改进和整体系统的有效性。 展开更多
关键词 认知评估量表 深度网络 图像分类 注意力 TRANSFORMER 大语言模型 自然语言处理
在线阅读 下载PDF
基于结构增强的层次化任务导向提示策略的对话推荐系统SetaCRS
19
作者 姜皓骞 张东 +1 位作者 李冠宇 陈恒 《计算机应用》 北大核心 2026年第2期368-377,共10页
近年来,许多对话推荐系统的研究采用预训练语言模型作为统一框架,旨在解决传统多模块架构中模块间协同不当的问题;然而,这些方法难以发挥任务之间的协同作用,且无法有效捕获输入中潜在的结构化信息,这些问题很大程度上削弱了对话推荐系... 近年来,许多对话推荐系统的研究采用预训练语言模型作为统一框架,旨在解决传统多模块架构中模块间协同不当的问题;然而,这些方法难以发挥任务之间的协同作用,且无法有效捕获输入中潜在的结构化信息,这些问题很大程度上削弱了对话推荐系统在实际应用场景中的表现。因此,提出一种基于结构增强的层次化任务导向提示策略的对话推荐系统SetaCRS。SetaCRS利用异质图注意力神经网络建模用户系统历史对话中的序列共现信息。此外,构造层次化的全局任务描述和特定子任务描述,从而帮助模型捕获并利用当前子任务和总任务序列之间的联系。在DuRecDial与TG-ReDial这2个公开数据集上的实验结果表明,相较于UniMIND(Unified MultI-goal conversational recommeNDer system),SetaCRS在语义F1上分别提升了8.53%和1.55%,并在平均倒数排名(MRR)@10上分别提升了3.02%和9.54%。可见,SetaCRS能够利用所捕捉的任务关联性与对话结构信息来有效提升推荐准确性和回复质量。 展开更多
关键词 对话推荐系统 提示工程 预训练语言模型 图神经网络 深度学习
在线阅读 下载PDF
基于改进YOLO v3模型与Deep-SORT算法的道路车辆检测方法 被引量:34
20
作者 马永杰 马芸婷 +1 位作者 程时升 马义德 《交通运输工程学报》 EI CSCD 北大核心 2021年第2期222-231,共10页
针对道路车辆实时检测遮挡严重与小目标车辆漏检率高的问题,提出了基于改进YOLO v3模型和Deep-SORT算法的车辆检测方法;为提高模型对道路车辆的检测能力,采用K-meansSymbolk@pSymbolk@p聚类算法对目标候选框进行聚类分析,选择合适的... 针对道路车辆实时检测遮挡严重与小目标车辆漏检率高的问题,提出了基于改进YOLO v3模型和Deep-SORT算法的车辆检测方法;为提高模型对道路车辆的检测能力,采用K-meansSymbolk@pSymbolk@p聚类算法对目标候选框进行聚类分析,选择合适的Anchor box数量,并在网络浅层增加了特征提取层,可提取到更精细的车辆特征;为加强网络对远近不同目标的鲁棒性,在保留原YOLO v3模型输出层的同时,增加了一层输出层,将52像素×52像素输出特征图经过上采样后得到104像素×104像素特征图,并将其与浅层同尺寸特征图进行拼接,实现车辆目标的检测;为了降低目标遮挡对检测效果的影响,提高对视频上下帧之间关联信息的关注度,将改进YOLO v3模型和Deep-SORT算法相结合,以此来弥补两者之间的不足。试验结果表明:改进YOLO v3模型有效地提高了车辆检测的性能,与在网络浅层增加特征提取层的模型相比,平均精度提高了1.4%,与增加一层输出层的模型相比,平均精确度提高了0.8%,说明改进YOLO v3模型提取的特征表达能力更强,增强了网络对小目标的检测能力;改进YOLO v3模型在引入Deep-SORT算法后,查准率和召回率分别达到90.16%和91.34%,相比改进YOLO v3模型,查准率和召回率分别提高了1.48%和4.20%,同时保证了检测速度,对于不同大小目标的检测具有良好的鲁棒性。 展开更多
关键词 交通图像识别 卷积神经网络 车辆检测 YOLO v3模型 deep-SORT算法 K-means++聚类算法
原文传递
上一页 1 2 84 下一页 到第
使用帮助 返回顶部