期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于改进Mask R-CNN的无人船视觉检测 被引量:2
1
作者 佟剑峰 于雨 《船海工程》 北大核心 2025年第1期6-12,共7页
针对无人船视觉检测算法准确率低及水界线检测困难的问题,构造自定义数据集并提出改进Mask R-CNN网络模型的无人船视觉检测算法。改进后的算法以Mask R-CNN网络模型为检测框架,将骨干网络由ResNet50替换成ResNeXt50并加入SENet注意力机... 针对无人船视觉检测算法准确率低及水界线检测困难的问题,构造自定义数据集并提出改进Mask R-CNN网络模型的无人船视觉检测算法。改进后的算法以Mask R-CNN网络模型为检测框架,将骨干网络由ResNet50替换成ResNeXt50并加入SENet注意力机制模块提高模型的特征提取能力;在特征金字塔网络(feature pyramid network,FPN)中加入多尺度的特征提取模块(inception模块),提高特征图的融合效果;加入多尺度锚框(anchors),提高模型对于多尺度目标的检测效果;通过直方图均衡化、调整对比度的方式对输入图像进行预处理,优化输入图像。结果表明,改进后的Mask R-CNN网络模型相比于原始的网络模型在目标检测任务中平均精度均值(mean average precision,mAP)提高了8.86%,交并比为0.5条件下的平均精度(IOU=0.5 average precision,AP 50)提高了9.39%;在实例分割任务中mAP提高了4.55%,AP 50提高了4.63%。相关改进,提高了无人船视觉检测的效率。 展开更多
关键词 无人船视觉 mask r-cnn网络模型 骨干网络 注意力机制 特征融合
在线阅读 下载PDF
Mask R-CNN and multifeature clustering model for catenary insulator recognition and defect detection 被引量:12
2
作者 Ping TAN Xu-feng LI +5 位作者 Jin DING Zhi-sheng CUI Ji-en MA Yue-lan SUN Bing-qiang HUANG You-tong FANG 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2022年第9期745-756,共12页
Rod insulators are vital parts of the catenary of high speed railways(HSRs).There are many different catenary insulators,and the background of the insulator image is complicated.It is difficult to recognise insulators... Rod insulators are vital parts of the catenary of high speed railways(HSRs).There are many different catenary insulators,and the background of the insulator image is complicated.It is difficult to recognise insulators and detect defects automatically.In this paper,we propose a catenary intelligent defect detection algorithm based on Mask region-convolutional neural network(R-CNN)and an image processing model.Vertical projection technology is used to achieve single shed positioning and precise cutting of the insulator.Gradient,texture,and gray feature fusion(GTGFF)and a K-means clustering analysis model(KCAM)are proposed to detect broken insulators,dirt,foreign bodies,and flashover.Using this model,insulator recognition and defect detection can achieve a high recall rate and accuracy,and generalized defect detection.The algorithm is tested and verified on a dataset of realistic insulator images,and the accuracy and reliability of the algorithm satisfy current requirements for HSR catenary automatic inspection and intelligent maintenance. 展开更多
关键词 High speed railway(HSR)catenary insulator mask region-convolutional neural network(r-cnn) Multifeature fusion K-means clustering analysis model(KCAM) Defect detection
原文传递
基于改进Mask R-CNN模型的电力场景目标检测方法 被引量:22
3
作者 孔英会 王维维 +1 位作者 张珂 戚银城 《科学技术与工程》 北大核心 2020年第8期3134-3142,共9页
为了解决电力施工现场中安全帽佩戴情况以及危险区域行人入侵检测问题,提出一种基于改进Mask R-CNN模型的目标检测方法。首先依据迁移学习策略对Mask R-CNN主干网络进行参数初始化,以提取图像基本特征;然后引入特征金字塔结构进行自下... 为了解决电力施工现场中安全帽佩戴情况以及危险区域行人入侵检测问题,提出一种基于改进Mask R-CNN模型的目标检测方法。首先依据迁移学习策略对Mask R-CNN主干网络进行参数初始化,以提取图像基本特征;然后引入特征金字塔结构进行自下而上的特征图提取,完成多尺度特征融合;接着,通过多尺度变换方法对区域推荐网络进行调整,获取锚点进行回归计算完成检测实验;最终对结果进行分析评价,多目标平均准确率达到了95.22%。将改进后的Mask R-CNN模型用于监控视频分析,针对监控视频像素过低问题,加入拉普拉斯算法锐化边缘,精准率提高到90.9%,验证了拉普拉斯算法对低质量监控视频检测的有效性。 展开更多
关键词 mask r-cnn模型 电力施工现场 目标检测 特征金字塔 区域推荐网络
在线阅读 下载PDF
改进Mask R-CNN的温室环境下不同成熟度番茄果实分割方法 被引量:53
4
作者 龙洁花 赵春江 +3 位作者 林森 郭文忠 文朝武 张宇 《农业工程学报》 EI CAS CSCD 北大核心 2021年第18期100-108,共9页
基于深度神经网络的果实识别和分割是采摘机器人作业成功的关键步骤,但由于网络参数多、计算量大,导致训练时间长,当模型部署到采摘机器人上则存在运行速度慢,识别精度低等问题。针对这些问题,该研究提出了一种改进Mask R-CNN的温室环... 基于深度神经网络的果实识别和分割是采摘机器人作业成功的关键步骤,但由于网络参数多、计算量大,导致训练时间长,当模型部署到采摘机器人上则存在运行速度慢,识别精度低等问题。针对这些问题,该研究提出了一种改进Mask R-CNN的温室环境下不同成熟度番茄果实分割方法,采用跨阶段局部网络(Cross Stage Partial Network,CSPNet)与Mask R-CNN网络中的残差网络(Residual Network,ResNet)进行融合,通过跨阶段拆分与级联策略,减少反向传播过程中重复的特征信息,降低网络计算量的同时提高准确率。在番茄果实测试集上进行试验,结果表明以层数为50的跨阶段局部残差网络(Cross Stage Partial ResNet50,CSP-ResNet50)为主干的改进Mask R-CNN模型对绿熟期、半熟期、成熟期番茄果实分割的平均精度均值为95.45%,F1分数为91.2%,单张图像分割时间为0.658 s。该方法相比金字塔场景解析网络(Pyramid Scene Parsing Network,PSPNet)、DeepLab v3+模型和以ResNet50为主干的Mask R-CNN模型平均精度均值分别提高了16.44、14.95和2.29个百分点,相比以ResNet50为主干的Mask R-CNN模型分割时间减少了1.98%。最后将以CSP-ResNet50为主干的改进Mask R-CNN模型部署到采摘机器人上,在大型玻璃温室中开展不同成熟度番茄果实识别试验,该模型识别正确率达到90%。该研究在温室环境下对不同成熟度番茄果实具有较好的识别性能,可为番茄采摘机器人精准作业提供依据。 展开更多
关键词 图像处理 机器视觉 模型 番茄 成熟度分割 mask r-cnn 残差网络 跨阶段局部网络
在线阅读 下载PDF
深度网络自适应优化的Mask R-CNN模型在铸件表面缺陷检测中的应用研究 被引量:12
5
作者 马宇超 付华良 +4 位作者 吴鹏 陈信华 王鼎 陈帅 曹晨雨 《现代制造工程》 CSCD 北大核心 2022年第4期112-118,共7页
针对传统铸件表面缺陷检测方法不能进行分类检测、检测效率低以及检测精度低等问题,提出了一种深度网络自适应优化的Mask R-CNN模型,将其应用于铸件表面缺陷检测中,实现缺陷的精确识别和分类。选择裂纹、气孔和缩松3种常见缺陷作为研究... 针对传统铸件表面缺陷检测方法不能进行分类检测、检测效率低以及检测精度低等问题,提出了一种深度网络自适应优化的Mask R-CNN模型,将其应用于铸件表面缺陷检测中,实现缺陷的精确识别和分类。选择裂纹、气孔和缩松3种常见缺陷作为研究对象,使用Labelme图像标注工具对铸件表面缺陷图像进行了标注,生成数据集。同时,运用PyTorch深度学习框架搭建Mask R-CNN模型,利用深度迁移学习的网络自适应策略优化模型的泛化能力。通过主干特征提取网络对输入的图形数据进行全图特征提取;采用区域建议网络(Regional Proposal Network,RPN)生成区域建议框;利用RoI Align获取感兴趣区域,通过分类、回归网络分别进行分类、回归,同时进行掩膜生成;在铸件表面缺陷检测平台上进行验证实验,并与其他深度学习检测方法进行对比。实验结果表明,优化后的Mask R-CNN模型整体性能优于原Mask R-CNN模型、Faster R-CNN模型和YOLO v3模型,能准确检测出常见的铸件表面缺陷,平均检测精度mAP达到92%,对铸件表面缺陷检测领域有较好的研究应用价值。 展开更多
关键词 缺陷检测 深度学习 mask r-cnn模型 迁移学习 深度网络自适应
在线阅读 下载PDF
基于改进Mask R-CNN的牛脸目标检测算法 被引量:3
6
作者 关忠榜 杨颜博 李敏超 《电子测量技术》 北大核心 2023年第24期133-138,共6页
针对牛脸检测时,存在的检测精度不高、牛脸较小被漏检或误检等问题,提出一种改进的Mask R-CNN+MResNet模型。首先,在ResNet101网络的基础上提出一种MResNet网络,通过对ResNet101网络的改进,提高了模型检测精度。其次,对模型的RPN网络的... 针对牛脸检测时,存在的检测精度不高、牛脸较小被漏检或误检等问题,提出一种改进的Mask R-CNN+MResNet模型。首先,在ResNet101网络的基础上提出一种MResNet网络,通过对ResNet101网络的改进,提高了模型检测精度。其次,对模型的RPN网络的锚框尺寸进行调整,提高了模型对较小目标的牛脸检测能力。实验结果表明,MResNet网络对牛脸检测精度相比较原始的网络模型,提高了12.6%;改进后的模型对于小目标检测能力平均精度较原始模型提高了2.4%。说明该模型能有效的实现小目标牛脸的检测,具有实际应用价值。 展开更多
关键词 牛脸检测 mask r-cnn模型 ResNet101网络 RPN网络
原文传递
Road Damage Detection and Classification Using Mask R-CNN with DenseNet Backbone 被引量:3
7
作者 Qiqiang Chen Xinxin Gan +2 位作者 Wei Huang Jingjing Feng H.Shim 《Computers, Materials & Continua》 SCIE EI 2020年第12期2201-2215,共15页
Automatic road damage detection using image processing is an important aspect of road maintenance.It is also a challenging problem due to the inhomogeneity of road damage and complicated background in the road images.... Automatic road damage detection using image processing is an important aspect of road maintenance.It is also a challenging problem due to the inhomogeneity of road damage and complicated background in the road images.In recent years,deep convolutional neural network based methods have been used to address the challenges of road damage detection and classification.In this paper,we propose a new approach to address those challenges.This approach uses densely connected convolution networks as the backbone of the Mask R-CNN to effectively extract image feature,a feature pyramid network for combining multiple scales features,a region proposal network to generate the road damage region,and a fully convolutional neural network to classify the road damage region and refine the region bounding box.This method can not only detect and classify the road damage,but also create a mask of the road damage.Experimental results show that the proposed approach can achieve better results compared with other existing methods. 展开更多
关键词 Road damage detection road damage classification mask r-cnn framework densely connected network
在线阅读 下载PDF
基于语料库与预训练模型的非遗实体识别
8
作者 张新生 杨颖洁 《计算机工程与设计》 北大核心 2026年第1期286-293,共8页
针对非遗领域文本语料稀缺,且非遗文本具有复杂语义特征导致命名实体识别精度不高的问题进行研究。构建非遗文本语料库ICHSX-NER,其实体字符串一致性和类型一致性分别为0.9530、0.9758。提出一种RBL-CFER实体识别模型,使用RoBERTa-wwm-... 针对非遗领域文本语料稀缺,且非遗文本具有复杂语义特征导致命名实体识别精度不高的问题进行研究。构建非遗文本语料库ICHSX-NER,其实体字符串一致性和类型一致性分别为0.9530、0.9758。提出一种RBL-CFER实体识别模型,使用RoBERTa-wwm-ext预训练语言模型提取高精度的词嵌入向量,借助BiLSTM提取非遗文本特征,CRF完成实体标签序列预测,实现对非遗文本语料中实体及其类别的识别。在自建语料库ICHSX-NER上进行多组实验,实验结果表明:模型的macro-F1值达90.62%,验证了在非遗文本实体识别任务中的有效性。 展开更多
关键词 命名实体识别 预训练语言模型 非遗文本语料库 动态全词掩码策略 双向长短期记忆网络 条件随机场 深度学习
在线阅读 下载PDF
Localization and Classification of Rice-grain Images Using Region Proposals-based Convolutional Neural Network 被引量:13
9
作者 Kittinun Aukkapinyo Suchakree Sawangwong +1 位作者 Parintorn Pooyoi Worapan Kusakunniran 《International Journal of Automation and computing》 EI CSCD 2020年第2期233-246,共14页
This paper proposes a solution to localization and classification of rice grains in an image.All existing related works rely on conventional based machine learning approaches.However,those techniques do not do well fo... This paper proposes a solution to localization and classification of rice grains in an image.All existing related works rely on conventional based machine learning approaches.However,those techniques do not do well for the problem designed in this paper,due to the high similarities between different types of rice grains.The deep learning based solution is developed in the proposed solution.It contains pre-processing steps of data annotation using the watershed algorithm,auto-alignment using the major axis orientation,and image enhancement using the contrast-limited adaptive histogram equalization(CLAHE)technique.Then,the mask region-based convolutional neural networks(R-CNN)is trained to localize and classify rice grains in an input image.The performance is enhanced by using the transfer learning and the dropout regularization for overfitting prevention.The proposed method is validated using many scenarios of experiments,reported in the forms of mean average precision(mAP)and a confusion matrix.It achieves above 80%mAP for main scenarios in the experiments.It is also shown to perform outstanding,when compared to human experts. 展开更多
关键词 mask region-based convolutional neural networks(r-cnn) computer VISION deep LEARNING RICE GRAIN classification transfer LEARNING
原文传递
DNN-Based Speech Enhancement Using Soft Audible Noise Masking for Wind Noise Reduction 被引量:1
10
作者 Haichuan Bai Fengpei Ge Yonghong Yan 《China Communications》 SCIE CSCD 2018年第9期235-243,共9页
This paper presents a deep neural network(DNN)-based speech enhancement algorithm based on the soft audible noise masking for the single-channel wind noise reduction. To reduce the low-frequency residual noise, the ps... This paper presents a deep neural network(DNN)-based speech enhancement algorithm based on the soft audible noise masking for the single-channel wind noise reduction. To reduce the low-frequency residual noise, the psychoacoustic model is adopted to calculate the masking threshold from the estimated clean speech spectrum. The gain for noise suppression is obtained based on soft audible noise masking by comparing the estimated wind noise spectrum with the masking threshold. To deal with the abruptly time-varying noisy signals, two separate DNN models are utilized to estimate the spectra of clean speech and wind noise components. Experimental results on the subjective and objective quality tests show that the proposed algorithm achieves the better performance compared with the conventional DNN-based wind noise reduction method. 展开更多
关键词 wind noise reduction speech enhancement soft audible noise masking psychoacoustic model deep neural network
在线阅读 下载PDF
A Deep Learning Model of Traffic Signs in Panoramic Images Detection
11
作者 Kha Tu Huynh Thi Phuong Linh Le +1 位作者 Muhammad Arif Thien Khai Tran 《Intelligent Automation & Soft Computing》 SCIE 2023年第7期401-418,共18页
To pursue the ideal of a safe high-tech society in a time when traffic accidents are frequent,the traffic signs detection system has become one of the necessary topics in recent years and in the future.The ultimate go... To pursue the ideal of a safe high-tech society in a time when traffic accidents are frequent,the traffic signs detection system has become one of the necessary topics in recent years and in the future.The ultimate goal of this research is to identify and classify the types of traffic signs in a panoramic image.To accomplish this goal,the paper proposes a new model for traffic sign detection based on the Convolutional Neural Network for com-prehensive traffic sign classification and Mask Region-based Convolutional Neural Networks(R-CNN)implementation for identifying and extracting signs in panoramic images.Data augmentation and normalization of the images are also applied to assist in classifying better even if old traffic signs are degraded,and considerably minimize the rates of discovering the extra boxes.The proposed model is tested on both the testing dataset and the actual images and gets 94.5%of the correct signs recognition rate,the classification rate of those signs discovered was 99.41%and the rate of false signs was only around 0.11. 展开更多
关键词 Deep learning convolutional neural network mask r-cnn traffic signs detection
在线阅读 下载PDF
Diagnosis of Middle Ear Diseases Based on Convolutional Neural Network
12
作者 Yunyoung Nam Seong Jun Choi +1 位作者 Jihwan Shin Jinseok Lee 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期1521-1532,共12页
An otoscope is traditionally used to examine the eardrum and ear canal.A diagnosis of otitis media(OM)relies on the experience of clinicians.If an examiner lacks experience,the examination may be difficult and time-co... An otoscope is traditionally used to examine the eardrum and ear canal.A diagnosis of otitis media(OM)relies on the experience of clinicians.If an examiner lacks experience,the examination may be difficult and time-consuming.This paper presents an ear disease classification method using middle ear images based on a convolutional neural network(CNN).Especially the segmentation and classification networks are used to classify an otoscopic image into six classes:normal,acute otitis media(AOM),otitis media with effusion(OME),chronic otitis media(COM),congenital cholesteatoma(CC)and traumatic perforations(TMPs).The Mask R-CNN is utilized for the segmentation network to extract the region of interest(ROI)from otoscopic images.The extracted ROIs are used as guiding features for the classification.The classification is based on transfer learning with an ensemble of two CNN classifiers:EfficientNetB0 and Inception-V3.The proposed model was trained with a 5-fold cross-validation technique.The proposed method was evaluated and achieved a classification accuracy of 97.29%. 展开更多
关键词 Otitis media convolutional neural network acute otitis media otitis media with effusion chronic otitis media congenital cholesteatoma traumatic perforation mask r-cnn
在线阅读 下载PDF
结合语言模型双编码和坐标注意力卷积的知识图谱补全 被引量:1
13
作者 王瑄 王晓霞 陈晓 《计算机工程与应用》 北大核心 2025年第14期206-213,共8页
知识图谱补全(KGC)旨在学习知识图谱中的现有知识实现对缺失三元组的补全。近期的相关研究表明,将语言模型(LM)应用于KGC任务能够改善模型在结构稀疏的知识图谱上的推理性能。针对现有结合LM的KGC模型性能仅依赖于LM捕获的语义特征,没... 知识图谱补全(KGC)旨在学习知识图谱中的现有知识实现对缺失三元组的补全。近期的相关研究表明,将语言模型(LM)应用于KGC任务能够改善模型在结构稀疏的知识图谱上的推理性能。针对现有结合LM的KGC模型性能仅依赖于LM捕获的语义特征,没有同时考虑知识图谱的结构信息和语义信息的问题,提出一种结合语言模型双编码和坐标注意的知识图谱补全方法LDCA。在编码时,通过引入掩码预训练的语言模型双编码结构,充分学习实体和关系的语义特征;在解码时,使用坐标注意力机制的卷积神经网络捕获实体和关系组合嵌入的跨通道信息、方向感知信息和位置感知信息。在WN18RR和FB15K-237数据集上的实验结果表明,LDCA模型在MR、MRR、Hits@1、Hits@3和Hits@10上的整体性能优于基准模型,验证了所提出模型的有效性和先进性。 展开更多
关键词 语言模型(LM) 掩码预训练 坐标注意力机制 卷积神经网络
在线阅读 下载PDF
Advanced classification of drill core rock type and weathering grade using detection transformer-based artificial intelligence techniques 被引量:1
14
作者 Keith Ki Chun Tse Louis Ngai Yuen Wong +1 位作者 Sai Hung Cheung Lequan Yu 《Journal of Rock Mechanics and Geotechnical Engineering》 2025年第7期4036-4045,共10页
Rock classification plays a crucial role in various fields such as geology,engineering,and environmental studies.Employing deep learning AI(artificial intelligence)methods has a high potential to significantly improve... Rock classification plays a crucial role in various fields such as geology,engineering,and environmental studies.Employing deep learning AI(artificial intelligence)methods has a high potential to significantly improve the accuracy and efficiency of this task.The paper delves into the exploration of two cuttingedge AI techniques,namely Mask DINO and Mask R-CNN(convolutional neural network),as means to identify rock weathering grades and rock types.The results demonstrate that Mask DINO,which is a Detection Transformer(DETR),outperforms Mask R-CNN for the aforementioned purposes.Mask DINO achieved f-1 scores of 91% and 86% in weathering grade detection and rock type detection,as opposed to the Mask R-CNN's f-1 scores of 84% and 75%,respectively.These findings underscore the substantial potential of employing DETR algorithms like Mask DINO for automatic classification of both rock type and weathering states.Although the study examines only two AI models,the data processing and other techniques developed in this study may serve as a foundation for future advancements in the field.By incorporating these advanced AI techniques,logging personnel can obtain valuable references to aid their work,ultimately contributing to the advancement of geological and related fields. 展开更多
关键词 mask r-cnn(convolutional neural network) Detection transformer LITHOLOGY WEATHERING Artificial intelligence(AI)
在线阅读 下载PDF
基于层次掩码及多尺度特征融合的CAD模型表征
15
作者 苏增辉 马向宇 +1 位作者 白静 林淦 《计算机集成制造系统》 北大核心 2025年第8期2843-2856,共14页
在CAD领域,边界表示(B-rep)因其精确性被广泛采用,但其非结构化特性使基于B-rep的深度学习模型较少。现有方法多侧重几何信息的描述,虽提升性能,却增加了复杂度和数据提取成本,且对拓扑信息关注不足,限制了模型的泛化能力和整体表现。... 在CAD领域,边界表示(B-rep)因其精确性被广泛采用,但其非结构化特性使基于B-rep的深度学习模型较少。现有方法多侧重几何信息的描述,虽提升性能,却增加了复杂度和数据提取成本,且对拓扑信息关注不足,限制了模型的泛化能力和整体表现。为解决上述问题,本文提出了一种基于层次掩码及多尺度特征融合的CAD模型表征网络,同时支持模型分类和分割。具体而言,通过设计层次掩码几何编码器来消除信息冗余,减少网络对信息的过度依赖,提高了网络的鲁棒性和泛化性;同时,通过设计多尺度自适应拓扑编码器来自适应地提取多尺度特征,能够捕获从局部到全局的拓扑结构信息。广泛实验证明了新模型在多个公开分类和分割数据集上的先进性和有效性。 展开更多
关键词 边界表示 模型分类 分割 图卷积神经网络 掩码 拓扑
在线阅读 下载PDF
基于YOLOv5s模型的多场景口罩佩戴识别研究 被引量:1
16
作者 张航 余粟 《计算机与数字工程》 2025年第5期1476-1480,共5页
由于规范佩戴口罩在疫情期间有着不言而喻的重要性,论文基于一种新型卷积神经网络YOLOv5s模型,设计了一种用于识别检测多场景口罩佩戴的算法。首先,笔者从网上收集了9 240张多场景关于佩戴口罩的照片并通过labelimg标注,并按照训练集和... 由于规范佩戴口罩在疫情期间有着不言而喻的重要性,论文基于一种新型卷积神经网络YOLOv5s模型,设计了一种用于识别检测多场景口罩佩戴的算法。首先,笔者从网上收集了9 240张多场景关于佩戴口罩的照片并通过labelimg标注,并按照训练集和数据集比例为8∶2进行划分得到自制数据集mask-ms。随后开发环境选用PyCharm,框架选用Pytorch。并基于迁移学习使用官方给出的YOLOv5s的初始权值(该初始权重为COCO数据集上训练所得权值),对各项超参数进行设置,并进行下一步训练,最终使用训练好的YOLOv5s模型来对多场景的口罩佩戴进行检测。据实验结果表明:采用YOLOv5s模型来进行多场景口罩佩戴检测可以起到相当不错的效果,可使用tensorboard查看模型的各项指标。该模型的整体性能指标mAP值高可达97.45%,查准率P为96.35%,召回率R为95.01%。且模型小,仅13.7 MB。 展开更多
关键词 卷积神经网络 YOLOv5s模型 labelimg 迁移学习 口罩佩戴检测 多场景
在线阅读 下载PDF
一种随机掩膜和自适应特征蒸馏算法
17
作者 冯健 吴鹏 《电子科技》 2025年第10期1-9,共9页
现有特征蒸馏方法中教师-学生之间特征连接依靠人工设计,且难以确定特征之间的蒸馏强度,导致学生模型学习无用信息。针对该问题,文中提出了一种随机掩膜和自适应特征知识蒸馏(Random Mask and Adaptive Feature Distillation,MAFD)算法... 现有特征蒸馏方法中教师-学生之间特征连接依靠人工设计,且难以确定特征之间的蒸馏强度,导致学生模型学习无用信息。针对该问题,文中提出了一种随机掩膜和自适应特征知识蒸馏(Random Mask and Adaptive Feature Distillation,MAFD)算法。该算法通过引入自注意力机制来自适应地确定教师-学生候选特征层之间的蒸馏强度。在学生特征生成阶段,引入随机像素掩膜策略使教师模型指导学生特征生成,以提高剩余像素的代表性,从而增强学生网络的表征能力。实验结果表明,该知识蒸馏网络在CIFAR100和ImageNet数据集上使学生模型相对基线性能提升2.0~6.2百分点,在任务CUB-200、indoor、Actions和Dogs上相对于基线分别提高27.27百分点、14.75百分点、25.55百分点和12.55百分点。文中还验证了RetinaNet模型在COCO-2017数据集上的性能提升,说明MAFD能够更好地减少教师模型和学生模型之间的知识转移损失。 展开更多
关键词 特征蒸馏 模型轻量化 卷积神经网络 计算机视觉 深度学习 掩膜策略 自适应特征连接
在线阅读 下载PDF
正字法邻近字在汉字识别过程中的抑制效应 被引量:4
18
作者 王敬欣 李琳 +3 位作者 李莎 谢芳 常敏 张阔 《心理学探新》 CSSCI 北大核心 2015年第6期493-498,共6页
采用非掩蔽启动范式和掩蔽启动范式探讨了汉字识别中邻近字启动的抑制效应。要求汉语母语者大学生被试进行以汉字为识别材料的邻近字启动实验,完成词汇判断任务。结果发现,非掩蔽启动范式下没有发现汉字邻近字启动的抑制效应,但在掩蔽... 采用非掩蔽启动范式和掩蔽启动范式探讨了汉字识别中邻近字启动的抑制效应。要求汉语母语者大学生被试进行以汉字为识别材料的邻近字启动实验,完成词汇判断任务。结果发现,非掩蔽启动范式下没有发现汉字邻近字启动的抑制效应,但在掩蔽启动范式下存在邻近字启动的抑制效应,而且这种抑制效应不受启动字和目标字相对字频的调节。研究支持了词汇识别的竞争网络模型,同时也说明汉字作为一种表意文字具有独特的识别机制。 展开更多
关键词 汉字识别 邻近字 非掩蔽启动范式 掩蔽启动范式 竞争网络模型
在线阅读 下载PDF
基于注意力机制的稀疏化剪枝方法 被引量:4
19
作者 叶汉民 李志波 +1 位作者 程小辉 陶小梅 《计算机工程与设计》 北大核心 2023年第12期3642-3648,共7页
为在资源受限设备中部署先进神经网络模型,提出一种基于通道和空间注意力机制的网络稀疏化剪枝训练方法,将剪枝训练过程转化为约束优化问题。将通道和空间注意力融入稀疏化剪枝训练过程,利用连续空间损失变化情况评估不同网络层重要程度... 为在资源受限设备中部署先进神经网络模型,提出一种基于通道和空间注意力机制的网络稀疏化剪枝训练方法,将剪枝训练过程转化为约束优化问题。将通道和空间注意力融入稀疏化剪枝训练过程,利用连续空间损失变化情况评估不同网络层重要程度,通过稀疏化训练与动态计算及更新掩码矩阵和权重矩阵完成剪枝操作。方法实验基于CIFAR10、CIFAR100数据集上进行,实验结果表明,该方法在较为复杂数据集CIFAR100上剪枝率为90%、95%、98%时,分类准确率可达到69.91%、67.15%、60.18%,与同类方法相比,在不同数据集和剪枝率的条件下仍具有较高的分类精度。 展开更多
关键词 资源受限设备 深度神经网络 模型压缩 注意力机制 稀疏化训练 网络剪枝 掩码
在线阅读 下载PDF
基于掩码提示与门控记忆网络校准的关系抽取方法 被引量:3
20
作者 魏超 陈艳平 +2 位作者 王凯 秦永彬 黄瑞章 《计算机应用》 CSCD 北大核心 2024年第6期1713-1719,共7页
针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权... 针对关系抽取(RE)任务中实体关系语义挖掘困难和预测关系有偏差等问题,提出一种基于掩码提示与门控记忆网络校准(MGMNC)的RE方法。首先,利用提示中的掩码学习实体之间在预训练语言模型(PLM)语义空间中的潜在语义,通过构造掩码注意力权重矩阵,将离散的掩码语义空间相互关联;其次,采用门控校准网络将含有实体和关系语义的掩码表示融入句子的全局语义;再次,将它们作为关系提示校准关系信息,随后将句子表示的最终表示映射至相应的关系类别;最后,通过更好地利用提示中掩码,并结合传统微调方法的学习句子全局语义的优势,充分激发PLM的潜力。实验结果表明,所提方法在SemEval(SemEval-2010 Task 8)数据集的F1值达到91.4%,相较于RELA(Relation Extraction with Label Augmentation)生成式方法提高了1.0个百分点;在SciERC(Entities, Relations, and Coreference for Scientific knowledge graph construction)和CLTC(Chinese Literature Text Corpus)数据集上的F1值分别达到91.0%和82.8%。所提方法在上述3个数据集上均明显优于对比方法,验证了所提方法的有效性。相较于基于生成式的方法,所提方法实现了更优的抽取性能。 展开更多
关键词 关系抽取 掩码 门控神经网络 预训练语言模型 提示学习
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部