期刊文献+
共找到11,048篇文章
< 1 2 250 >
每页显示 20 50 100
基于RDS-Mask R-CNN的绵羊姿态自动检测方法研究
1
作者 甘霖惠 杜佳磊 +4 位作者 麻晓丽 余有信 朱文博 刘宇 王步钰 《中国农业大学学报》 北大核心 2026年第2期172-182,共11页
绵羊的姿态与其健康及福利密切相关。随着智能化畜牧业需求的增长,自动、准确地检测绵羊姿态尤为尤为重要。本研究提出基于Mask R-CNN基准网络的新型RDS-Mask R-CNN绵羊姿态检测算法,以Res2Net101作为特征提取网络,同时引入可变形卷积(D... 绵羊的姿态与其健康及福利密切相关。随着智能化畜牧业需求的增长,自动、准确地检测绵羊姿态尤为尤为重要。本研究提出基于Mask R-CNN基准网络的新型RDS-Mask R-CNN绵羊姿态检测算法,以Res2Net101作为特征提取网络,同时引入可变形卷积(Deformable convolution network,DCN),以更精准捕捉绵羊在不同位置的姿态特征,并运用软非极大值抑制(Soft non-maximum suppression,Soft NMS)算法实现重叠实例目标的准确分割。结果表明:1)目标检测框架算法对比:与该领域最经典的YOLOv3和Faster R-CNN相比,改进的算法在平均精度均值(Mean average precision,mAP)上分别提升了16.68%和8.64%;2)不同改进策略的算法对比:改进算法相较于基准网络,边界框平均精度均值(Bounding box mean average precision,Bbox mAP)提高6.21%,分割平均精度均值(Segmentation mean average precision,Segm mAP)提高6.61%,分别达到87.34%和81.50%;3)相较于Mask R-CNN,改进模型在识别绵羊站立与躺卧姿态时边界框平均精度(Bounding box average precision,Bbox AP)分别提高了6.84%和5.58%,分割平均精度(Segmentation average precision,Segm AP)分别提高了7.25%和5.17%;4)模型可解释性可视化结果表明RDS-Mask R-CNN能精准捕获绵羊站立和躺卧姿态关键部位深度特征,表明模型自动检测可行且具有可解释性。综上,本研究提出的RDS-Mask R-CNN算法,有效提升了绵羊姿态检测的精准度,为智慧养殖提供了技术支撑。 展开更多
关键词 绵羊姿态识别 RDS-mask R-CNN 可变形卷积
原文传递
一种预焙阳极表面氧化缺陷的Mask R-CNN检测方法
2
作者 刘博超 赵利平 +1 位作者 李国彦 刘立春 《机械设计与制造》 北大核心 2026年第2期33-36,41,共5页
为实现预焙阳极表面氧化缺陷的在线检测,采用Mask R-CNN对预焙阳极表面氧化缺陷进行检测。该方法以线扫描法采集到的图像数据作为输入,以ResNet101为网络骨架,经过特征提取网络获取图像中的特征信息,然后在区域推荐网络(RPN)中采用K-me... 为实现预焙阳极表面氧化缺陷的在线检测,采用Mask R-CNN对预焙阳极表面氧化缺陷进行检测。该方法以线扫描法采集到的图像数据作为输入,以ResNet101为网络骨架,经过特征提取网络获取图像中的特征信息,然后在区域推荐网络(RPN)中采用K-means聚类算法生成Anchor进而输出感兴趣区域(ROI),最终通过ROI Align以及预测网络输出类别信息以及边框信息,完成预焙阳极表面氧化缺陷的检测。试验结果表明,该方法能够有效的检测出预焙阳极表面氧化缺陷,并且准确率能达到95%,满足预焙阳极在线检测的标准。 展开更多
关键词 预焙阳极 氧化缺陷 深度学习 mask R-CNN K-MEANS聚类算法
在线阅读 下载PDF
数字孪生环境下基于改进Mask R-CNN的焊接零件完备性检测方法
3
作者 刘根 闫新宇 +5 位作者 李浩 张玉彦 李琳利 翟中尚 王朋静 杨新宇 《航空制造技术》 北大核心 2026年第6期61-70,共10页
随着智能化技术快速发展,生产线的全过程智能化程度决定了航空制造生产效率,航空制造中待焊接零件完备性的检测对零件的质量与安全性有着重要的影响。目前,焊接件完备性检测主要依靠人工检测和传感器检测。然而,当检测的目标过于细小,... 随着智能化技术快速发展,生产线的全过程智能化程度决定了航空制造生产效率,航空制造中待焊接零件完备性的检测对零件的质量与安全性有着重要的影响。目前,焊接件完备性检测主要依靠人工检测和传感器检测。然而,当检测的目标过于细小,同种类的零件区分度不够高时,传统方法易出现误检和漏检。本文提出了一种在数字孪生环境下基于改进Mask R-CNN的焊接零件完备性检测方法。利用数字孪生技术解决缺陷数据或危险区域数据难以获取的问题。采用Swin transformer网络替换Mask R-CNN的主干网络。为解决Swin transformer引起模型参数量增加的问题,使用深度可分离卷积代替网络中的原始卷积,减少参数量和计算量。试验表明,改进后Mask R-CNN的mAP提升了14.7个百分点,解决了同种类细微差别焊接零件检测困难的问题。 展开更多
关键词 航空制造 零件完备性检测 数字孪生 实例分割 改进mask R-CNN
在线阅读 下载PDF
基于Mask R-CNN的激光雷达测量数据特征点识别
4
作者 幸荔芸 李珊枝 《现代雷达》 北大核心 2026年第1期48-54,共7页
直接使用激光雷达测量数据中提取出关键信息进行特征点识别,无法直接区分点是否属于相同目标,仅提取局部特征点会导致数据特征识别精度下降的问题,文中提出基于卷积神经网络掩膜(Mask R-CNN)的激光雷达测量数据特征点识别,首先选取Point... 直接使用激光雷达测量数据中提取出关键信息进行特征点识别,无法直接区分点是否属于相同目标,仅提取局部特征点会导致数据特征识别精度下降的问题,文中提出基于卷积神经网络掩膜(Mask R-CNN)的激光雷达测量数据特征点识别,首先选取PointNet++作为Mask R-CNN的主干网络提取特征向量,并在主干分支旁构建特征金字塔网络提取多尺度特征,通过区域建议网络生成三维候选框,经由ROI Align输入至分类器网络中,展开目标类别预测、候选框位置回归和二值掩模,输出目标分割结果,然后以分割出的目标点云为基础,采用4D Shepard曲面估计目标点云曲率,得到体积积分不变量并将其单位化处理,最后通过K-means算法聚类体积积分不变量,实现激光雷达测量数据特征点识别。实验结果表明,文中方法能够在激光雷达测量数据中有效地分割出目标,简化率为37.68%,数据特征点识别性能和质量较高,AP、AP_(50)和AP_(75)检测结果均保持在90%以上,具有较好的应用效果。 展开更多
关键词 卷积神经网络掩膜 激光雷达测量数据 特征点识别 体积积分不变量 K-MEANS算法
原文传递
Effective Token Masking Augmentation Using Term-Document Frequency for Language Model-Based Legal Case Classification
5
作者 Ye-Chan Park Mohd Asyraf Zulkifley +1 位作者 Bong-Soo Sohn Jaesung Lee 《Computers, Materials & Continua》 2026年第4期928-945,共18页
Legal case classification involves the categorization of legal documents into predefined categories,which facilitates legal information retrieval and case management.However,real-world legal datasets often suffer from... Legal case classification involves the categorization of legal documents into predefined categories,which facilitates legal information retrieval and case management.However,real-world legal datasets often suffer from class imbalances due to the uneven distribution of case types across legal domains.This leads to biased model performance,in the form of high accuracy for overrepresented categories and underperformance for minority classes.To address this issue,in this study,we propose a data augmentation method that masks unimportant terms within a document selectively while preserving key terms fromthe perspective of the legal domain.This approach enhances data diversity and improves the generalization capability of conventional models.Our experiments demonstrate consistent improvements achieved by the proposed augmentation strategy in terms of accuracy and F1 score across all models,validating the effectiveness of the proposed method in legal case classification. 展开更多
关键词 Legal case classification class imbalance data augmentation token masking legal NLP
在线阅读 下载PDF
Infrared Thermography Study of Thermal Footprints Generated by Ordinary and Extraordinary Respiratory Activities in Persons Wearing Face Masks
6
作者 Luca Giammichele Valerio D’Alessandro +1 位作者 Matteo Falone Renato Ricci 《Frontiers in Heat and Mass Transfer》 2026年第1期375-390,共16页
The airborne diffusion of saliva droplets during respiratory activities is one of the major factors in the spread of infections.During the COVID-19 pandemic,the use of protective face masks was essential to reduce the... The airborne diffusion of saliva droplets during respiratory activities is one of the major factors in the spread of infections.During the COVID-19 pandemic,the use of protective face masks was essential to reduce the risk of infection and spread of SARS-CoV-2.The face mask is able to significantly reduce the saliva droplet emission in front of the person.However,the use of masks also produces a particle leakage towards the back of the person,which could increase the infection risk of people behind the subject.Most of the experimental investigations applied invasive and/or complex experimental techniques to evaluate the face masks leakage.The primary objective of this study is to develop a novel,non-invasive methodology for assessing rearward droplet emission associated with the use of protective face masks.Specifically,a thermographic analysis of the thermal footprint released during ordinary and extraordinary respiratory activities is presented,evaluating the maximum temperature,the detection time,and the spread area of the thermal footprint.Both surgical and FFP2 face masks were tested.Two different subjects were involved in the experimentation to evaluate the influence of face conformation.The findings indicate that the area influenced by droplet dispersion is larger when wearing a surgical mask compared to an FFP2 mask,with the highest recorded temperatures observed for the surgical mask.The thermal footprint was found to be strongly dependent on individual facial morphology and mask fit.Notably,the FFP2 mask also altered the position of the thermal footprint,which was primarily confined to the region near the neck. 展开更多
关键词 Infrared thermography SARS-CoV-2 face mask thermal footprint
在线阅读 下载PDF
Gearbox Fault Diagnosis under Varying Operating Conditions through Semi-Supervised Masked Contrastive Learning and Domain Adaptation
7
作者 Zhixiang Huang Jun Li 《Computer Modeling in Engineering & Sciences》 2026年第2期448-470,共23页
To address the issue of scarce labeled samples and operational condition variations that degrade the accuracy of fault diagnosis models in variable-condition gearbox fault diagnosis,this paper proposes a semi-supervis... To address the issue of scarce labeled samples and operational condition variations that degrade the accuracy of fault diagnosis models in variable-condition gearbox fault diagnosis,this paper proposes a semi-supervised masked contrastive learning and domain adaptation(SSMCL-DA)method for gearbox fault diagnosis under variable conditions.Initially,during the unsupervised pre-training phase,a dual signal augmentation strategy is devised,which simultaneously applies random masking in the time domain and random scaling in the frequency domain to unlabeled samples,thereby constructing more challenging positive sample pairs to guide the encoder in learning intrinsic features robust to condition variations.Subsequently,a ConvNeXt-Transformer hybrid architecture is employed,integrating the superior local detail modeling capacity of ConvNeXt with the robust global perception capability of Transformer to enhance feature extraction in complex scenarios.Thereafter,a contrastive learning model is constructed with the optimization objective of maximizing feature similarity across different masked instances of the same sample,enabling the extraction of consistent features from multiple masked perspectives and reducing reliance on labeled data.In the final supervised fine-tuning phase,a multi-scale attention mechanism is incorporated for feature rectification,and a domain adaptation module combining Local Maximum Mean Discrepancy(LMMD)with adversarial learning is proposed.This module embodies a dual mechanism:LMMD facilitates fine-grained class-conditional alignment,compelling features of identical fault classes to converge across varying conditions,while the domain discriminator utilizes adversarial training to guide the feature extractor toward learning domain-invariant features.Working in concert,they markedly diminish feature distribution discrepancies induced by changes in load,rotational speed,and other factors,thereby boosting the model’s adaptability to cross-condition scenarios.Experimental evaluations on the WT planetary gearbox dataset and the Case Western Reserve University(CWRU)bearing dataset demonstrate that the SSMCL-DA model effectively identifies multiple fault classes in gearboxes,with diagnostic performance substantially surpassing that of conventional methods.Under cross-condition scenarios,the model attains fault diagnosis accuracies of 99.21%for the WT planetary gearbox and 99.86%for the bearings,respectively.Furthermore,the model exhibits stable generalization capability in cross-device settings. 展开更多
关键词 GEARBOX variable working conditions fault diagnosis semi-supervised masked contrastive learning domain adaptation
在线阅读 下载PDF
Long-range masked autoencoder for pre-extraction of trajectory features in within-visual-range maneuver recognition
8
作者 Feilong Jiang Hutao Cui +2 位作者 Yuqing Li Minqiang Xu Rixin Wang 《Defence Technology(防务技术)》 2026年第1期301-315,共15页
In the field of intelligent air combat,real-time and accurate recognition of within-visual-range(WVR)maneuver actions serves as the foundational cornerstone for constructing autonomous decision-making systems.However,... In the field of intelligent air combat,real-time and accurate recognition of within-visual-range(WVR)maneuver actions serves as the foundational cornerstone for constructing autonomous decision-making systems.However,existing methods face two major challenges:traditional feature engineering suffers from insufficient effective dimensionality in the feature space due to kinematic coupling,making it difficult to distinguish essential differences between maneuvers,while end-to-end deep learning models lack controllability in implicit feature learning and fail to model high-order long-range temporal dependencies.This paper proposes a trajectory feature pre-extraction method based on a Long-range Masked Autoencoder(LMAE),incorporating three key innovations:(1)Random Fragment High-ratio Masking(RFH-Mask),which enforces the model to learn long-range temporal correlations by masking 80%of trajectory data while retaining continuous fragments;(2)Kalman Filter-Guided Objective Function(KFG-OF),integrating trajectory continuity constraints to align the feature space with kinematic principles;and(3)Two-stage Decoupled Architecture,enabling efficient and controllable feature learning through unsupervised pre-training and frozen-feature transfer.Experimental results demonstrate that LMAE significantly improves the average recognition accuracy for 20-class maneuvers compared to traditional end-to-end models,while significantly accelerating convergence speed.The contributions of this work lie in:introducing high-masking-rate autoencoders into low-informationdensity trajectory analysis,proposing a feature engineering framework with enhanced controllability and efficiency,and providing a novel technical pathway for intelligent air combat decision-making systems. 展开更多
关键词 Within-visual-range maneuver recognition Trajectory feature pre-extraction Long-range masked autoencoder Kalman filter constraints Intelligent air combat
在线阅读 下载PDF
Research on the Symbolic Value of Nuo Masks in the Context of Contemporary Intangible Cultural Heritage Preservation
9
作者 LIU Yuan-feng HUANG Li-na LIN Hai-tao 《Journal of Literature and Art Studies》 2026年第1期67-71,共5页
The Nuo mask is the core visual vehicle within China’s Nuo culture and constitutes a complex symbolic system through facial features(icons),patterns(indexes),and colors(symbols).Within the context of intangible cultu... The Nuo mask is the core visual vehicle within China’s Nuo culture and constitutes a complex symbolic system through facial features(icons),patterns(indexes),and colors(symbols).Within the context of intangible cultural heritage(ICH)preservation,its value lies in the continuation and revitalization of its dynamic symbolic functions.Grounded in semiotic theory,this paper elaborates on three core dimensions of symbolic value manifested by Nuo masks in ICH preservation:a ritual symbol for living transmission,a symbol of identity for collective memory,and an aesthetic symbol as a source of creativity. 展开更多
关键词 Nuo masks intangible cultural heritage preservation symbolic value sense of community for the Chinese nation cultural innovation
在线阅读 下载PDF
基于Mask R⁃CNN的多类建筑物损伤识别方法 被引量:2
10
作者 杨敬松 王煜鑫 +2 位作者 李智涛 卢泽葳 彭福民 《防灾减灾工程学报》 北大核心 2025年第3期562-570,共9页
地震发生后快速对建筑物损伤进行识别,可以提高灾害损失评估的效率,并为救援提供有效地决策支持。针对因背景干扰带来的重要特征表达能力弱的问题,提出一种基于深度学习框架Mask R‑CNN的多建筑物损伤识别方法。首先,对样本图像进行预处... 地震发生后快速对建筑物损伤进行识别,可以提高灾害损失评估的效率,并为救援提供有效地决策支持。针对因背景干扰带来的重要特征表达能力弱的问题,提出一种基于深度学习框架Mask R‑CNN的多建筑物损伤识别方法。首先,对样本图像进行预处理,克服复杂环境背景因素干扰,并进行多途径扩增,得到用于深度学习的扩增样本数据集。其次,优化特征提取网络,采用嵌入注意力机制模块SE的MobileNetv3网络作为主干网络,增加模型对建筑物损伤空间及语义信息的提取,有效避免背景对模型性能的影响,改进损失函数,避免遗漏类别和类别错分现象,同时引入迁移学习,降低训练成本;最后,采用定性分析和定量评估相结合的手段,多维度评估模型泛化能力和鲁棒性。改进后的Mask R‑CNN模型的平均精度达到了84.34%,相对于原始的Mask R‑CNN模型,精度提高了9.12%。结果表明,改进后的模型在识别含有多种损伤特征和噪声背景的建筑物损伤图像方面表现良好,可以为地震后建筑物的损伤评估提供有效地技术支持。 展开更多
关键词 人工智能 建筑物损伤识别 mask R‑CNN 实例分割
原文传递
基于改进Mask R-CNN的航空铸件智能检测技术研究
11
作者 张祥春 彭文胜 +4 位作者 楚峻溢 曾照洋 王振宇 魏明贤 徐然 《航空制造技术》 北大核心 2025年第23期26-33,共8页
针对航空产品研制生产过程中由于质量缺陷产生原因复杂、缺陷特征种类多、检测要求高而缺少有效智能检测方法的问题,首先通过系统梳理航空装备智能检测技术研究现状,总结了面向此应用场景和针对具体缺陷特征开展智能检测方法研究的思路... 针对航空产品研制生产过程中由于质量缺陷产生原因复杂、缺陷特征种类多、检测要求高而缺少有效智能检测方法的问题,首先通过系统梳理航空装备智能检测技术研究现状,总结了面向此应用场景和针对具体缺陷特征开展智能检测方法研究的思路和实施途径;其次,设计了融合全局特征金字塔网络的Mask R-CNN改进算法,并面向缺陷特征复杂和检测要求比较高的航空铸件,利用剪切、翻转、Overlap切图和Mosaic等数据增广技术构建了航空铸件数字射线检测缺陷特征数据集;最后利用改进算法及构建的数据集对航空铸件中的疏松、裂纹及高密度夹杂3类缺陷进行测试与验证试验。试验结果表明,所提改进算法的检测精度达93.25%,召回率达96.51%,具有良好检测效果。 展开更多
关键词 深度学习 智能检测 航空铸件 mask R-CNN 全局特征金字塔网络 数据增广
在线阅读 下载PDF
基于深度学习算法Mask R-CNN的甲状腺结节检测模型研究 被引量:2
12
作者 王杰 王至诚 +2 位作者 娄帅 董建成 曹新志 《医学信息学杂志》 2025年第3期84-89,共6页
目的/意义采用基于区域卷积神经网络的目标掩码分割算法(mask region-based convolutional neural network, Mask R-CNN)建立目标检测模型,智能识别甲状腺超声图像结节位置,为超声医生决策提供参考。方法/过程收集超声结节图像1 650张,... 目的/意义采用基于区域卷积神经网络的目标掩码分割算法(mask region-based convolutional neural network, Mask R-CNN)建立目标检测模型,智能识别甲状腺超声图像结节位置,为超声医生决策提供参考。方法/过程收集超声结节图像1 650张,使用labelme工具进行结节位置标注。对Mask R-CNN的主干网络分别采用MobileNetV3、ResNet50、ResNet101和ResNet152进行替换,并引入特征金字塔和感兴趣区域对齐,采用迁移学习训练策略训练模型,比较不同网络下目标检测效果。结果/结论主干网络采用ResNet101训练的模型平均精确度为86.8%,平均召回率为95.3%,平均F1分数为90.6%,优于其他主干网络,能更精确地检测甲状腺结节,具有一定临床应用价值。 展开更多
关键词 甲状腺结节 mask R-CNN 目标检测 神经网络
暂未订购
基于轻量化Mask R⁃CNN的车型检测算法
13
作者 许超 杨丰熙 +1 位作者 李博 王浩宇 《现代电子技术》 北大核心 2025年第21期127-136,共10页
车型检测对智能交通系统具有重要意义,其为智能交通系统的车辆管理能力提供了有效保障。针对现有算法通常较为复杂,并不能较好地适配于实际应用中的车型检测,文中提出一种基于改进Mask R⁃CNN的轻量化车型检测算法。首先,将特征提取网络... 车型检测对智能交通系统具有重要意义,其为智能交通系统的车辆管理能力提供了有效保障。针对现有算法通常较为复杂,并不能较好地适配于实际应用中的车型检测,文中提出一种基于改进Mask R⁃CNN的轻量化车型检测算法。首先,将特征提取网络替换为FasterNet特征提取网络,在降低算法复杂度的同时提升算法精度;其次,构建基于DO卷积的改进FPN特征融合网络,使算法既降低复杂度又提升精度;最后,将损失函数替换为Smooth L_(1)损失函数,在不改变当前算法复杂度的情况下对算法精度实现了进一步提升。实验结果表明,所提算法兼顾精度与实时性需求,且具有较好的泛化能力,更适配于实际应用中的车型检测。 展开更多
关键词 mask R⁃CNN 车型检测 主干网络 特征融合 损失函数 轻量化
在线阅读 下载PDF
基于改进Mask R-CNN的低空遥感实例分割算法
14
作者 李冰锋 王光耀 崔立志 《兵器装备工程学报》 北大核心 2025年第2期168-176,共9页
针对遥感领域图像目标繁杂、检测和分割精度不高的问题,提出一种改进Mask R-CNN算法。设计PMResNet-50结构作为主干网络,其中金字塔挤压注意模块可以促进局部和全局通道注意之间的信息交互作用,多层次特征聚合模块可以提高PMResNet-50... 针对遥感领域图像目标繁杂、检测和分割精度不高的问题,提出一种改进Mask R-CNN算法。设计PMResNet-50结构作为主干网络,其中金字塔挤压注意模块可以促进局部和全局通道注意之间的信息交互作用,多层次特征聚合模块可以提高PMResNet-50对输入通道语义信息的高效聚合作用。在RoI Align前引入自校准卷积模块来扩大卷积层的感受野大小并对边界框和掩码框执行校准操作。在分割分支使用掩码预测平衡损失函数,对每个类别的正负样本梯度进行平衡,实现对损失梯度的平滑降低处理。在自建低空遥感数据集和iSAID-Reduce100数据集上进行测试,实验结果表明:改进后的算法在自建数据集上box AP和mask AP分别提升17.9%和15.0%,在iSAID-Reduce100数据集上box AP和mask AP达到49.62%和50.27%,该算法很好地完成了对遥感目标的检测和分割。 展开更多
关键词 深度学习 图像处理 遥感图像 实例分割 改进mask R-CNN算法 ResNet-50
在线阅读 下载PDF
基于改进Mask R-CNN的建筑屋面光伏利用潜力评估研究——以长春市工业厂房为例 被引量:1
15
作者 周春艳 路少石 《建筑与文化》 2025年第3期244-247,共4页
近年来,中国的能源需求随着经济的发展而快速增长。在建筑屋面上利用太阳能资源是实现我国“碳达峰、碳中和”目标的重要途径。文章提出了一种改进后的Mask R-CNN深度学习算法,通过将原模型中的FPN网络改进为PAN网络来提升模型对于图像... 近年来,中国的能源需求随着经济的发展而快速增长。在建筑屋面上利用太阳能资源是实现我国“碳达峰、碳中和”目标的重要途径。文章提出了一种改进后的Mask R-CNN深度学习算法,通过将原模型中的FPN网络改进为PAN网络来提升模型对于图像特征的提取能力,从而提高光伏潜力的评估效率。文章以长春市中心城市区的工业厂房为研究对象并评估其屋面的光伏利用潜力,最终计算得到长春市中心城区的工业厂房屋面面积为82.48×10^(6)m^(2),光伏利用潜力为144.4375×10^(8)kWh/年,可为长春市城市工业厂房屋顶光伏发展规划提供依据。 展开更多
关键词 mask R-CNN 建筑屋面 光伏利用潜力 长春市工业厂房
在线阅读 下载PDF
基于Fishmeal-Mask2Former分割模型的掺假鱼粉显微图像识别方法
16
作者 牛智有 李武瑛妮 +2 位作者 孔宪锐 耿婕 王伟霞 《农业机械学报》 北大核心 2025年第7期679-690,共12页
针对传统显微镜检法在鱼粉掺假识别中面临的肉眼辨别难度大、识别效率低的问题,提出一种改进Maskedattention Mask Transformer(Mask2Former)的鱼粉显微图像掺假识别模型,以实现高分辨条件下、复杂鱼粉背景中对异状多目标掺假特征的自... 针对传统显微镜检法在鱼粉掺假识别中面临的肉眼辨别难度大、识别效率低的问题,提出一种改进Maskedattention Mask Transformer(Mask2Former)的鱼粉显微图像掺假识别模型,以实现高分辨条件下、复杂鱼粉背景中对异状多目标掺假特征的自动化识别与分割。以鱼粉中掺杂动物源性肉粉为研究对象,构建了:Fishmeal掺假鱼粉显微图像数据集,通过形态学分析将掺假特征细分为异常肌肉、骨骼、皮肤、血液和毛发5类组织;开发基于颜色阈值相似性的交互式标注软件,实现逐像素的提示性精确标注;改进Mask2Former分割模型架构,融合ResNet50骨干网络、多头注意力机制和多尺度特征处理机制,增强了鱼粉多样化特征的融合效果;引入重复加权双向特征金字塔网络(Bidirectional feature pyramid network,BiFPN)改进像素解码器,提升了小目标分割能力;引入可学习的尺度级嵌入和掩码注意力(Masked Attention)模块,通过限制交叉注意力关注范围提高了模型细节表现力;在Multi-head Attention层后加入dropout操作防止过拟合。实验结果表明,改进后的Fishmeal-Mask2Former在样本真伪判别阶段整体分类准确率达到98.56%,在精细分割阶段对异常掺假特征定性识别平均精确率达到80.52%、召回率为76.01%、F1分数为78.86%,分割模型平均准确度提升至82.08%,较传统方法具有显著优势。此外,设计分割结果可视化界面,为鱼粉品质检测中的掺假检测环节提供了一种直观、准确与高效的显微视觉自动化识别方法。 展开更多
关键词 鱼粉 掺假 语义分割 显微图像 mask2 Former 计算机辅助诊断
在线阅读 下载PDF
基于Mask R-CNN改进的树冠分割
17
作者 王春玲 温晓晖 《遥感信息》 北大核心 2025年第6期1-8,共8页
为解决自然森林中存在的树冠重叠、边界干扰等复杂环境因素对树冠难以精准识别分割的问题,提出一种改进的Mask R-CNN语义分割网络模型。以ResNet50为主干网络提取特征,提出了一种路径增强的特征金字塔网络(enhanced feature pyramid net... 为解决自然森林中存在的树冠重叠、边界干扰等复杂环境因素对树冠难以精准识别分割的问题,提出一种改进的Mask R-CNN语义分割网络模型。以ResNet50为主干网络提取特征,提出了一种路径增强的特征金字塔网络(enhanced feature pyramid network,EFPN),设计了一种多分支膨胀卷积模块(multiple branch dilated convolution,MBD),加强底层特征的提取,保证信息完整性和连续性;提出了一种联合注意力模块(united attention,UA),通过加强对重要特征的捕捉,提升了模型的泛化能力。在使用Labelme工具进行自主标注的森林树冠图像数据集中,树冠分割的平均交并比IoU和F1评分高达85.06%和91.91%,比其他先进模型有较明显的性能提升。该方法能够准确分割自然环境中的森林树冠,对于掌握森林生长状况、评估森林火灾、促进恢复工作以及优化森林管理具有重要的实际意义。 展开更多
关键词 mask R-CNN 树冠分割 特征增强 注意力机制 FPN
在线阅读 下载PDF
基于Mask R—CNN的轻量级草莓实例分割算法
18
作者 王成军 江诚婕 +1 位作者 丁凡 柳炜 《中国农机化学报》 北大核心 2025年第7期118-123,F0003,共7页
针对果园采摘环境复杂、草莓与周边环境难以精确分割、现有模型处理速度无法实现快速分割等问题,提出一种基于Mask R—CNN的轻量级草莓实例分割算法。在原始Mask R—CNN算法的基础上进行改进,采用MobileNetV3网络替代原始的ResNet101骨... 针对果园采摘环境复杂、草莓与周边环境难以精确分割、现有模型处理速度无法实现快速分割等问题,提出一种基于Mask R—CNN的轻量级草莓实例分割算法。在原始Mask R—CNN算法的基础上进行改进,采用MobileNetV3网络替代原始的ResNet101骨干网络来轻量化算法,且将原本MobileNetV3残差结构中的通道注意力机制替换成协同注意力机制模块,结合特征金字塔网络架构进行特征提取,实现草莓个体的精准快速定位分割。在标注数据集上进行对比实验,结果表明,改进的Mask R—CNN算法与原始Mask R—CNN算法相比,边框mAP和掩膜mAP分别提升1.75%和4.05%,检测速度提高20.09帧/s,减少模型对硬件存储空间和算力的依赖。 展开更多
关键词 草莓图像 实例分割 改进mask R—CNN CA注意力机制 轻量化网络
在线阅读 下载PDF
基于CGRU-Mask神经网络的超高层结构监测数据修复方法
19
作者 杨彬 潘立程 +2 位作者 朱海涛 孙思远 张其林 《建筑结构》 北大核心 2025年第7期89-96,共8页
结构健康监测是验证结构设计理论以及结构状态评估的重要方法。受外部环境因素和传感器设备不稳定的影响,超高层结构健康监测系统存在数据缺失问题,严重影响结构状态评估。以上海中心大厦加速度监测数据为研究对象,利用结构不同空间位... 结构健康监测是验证结构设计理论以及结构状态评估的重要方法。受外部环境因素和传感器设备不稳定的影响,超高层结构健康监测系统存在数据缺失问题,严重影响结构状态评估。以上海中心大厦加速度监测数据为研究对象,利用结构不同空间位置处振动响应之间的空间相关性,采用卷积-门控循环单元神经网络(CGRU),并引入掩码(Mask)层,对完全随机缺失的加速度监测数据进行修复,并对比了几种常见神经网络在不同缺失率下的数据修复效果。结果表明,CGRU-Mask神经网络模型能够有效解决加速度监测数据完全随机缺失的问题,且在高缺失率情况下含有Mask层神经网络的性能显著高于未引入Mask层的神经网络。此外,对修复数据进行模态分析的结果表明,高缺失率下的修复数据依旧能与完整数据的模态频率识别结果一致。 展开更多
关键词 超高层结构 结构健康监测 空间相关性 CGRU-mask神经网络 数据修复
在线阅读 下载PDF
基于改进Mask RCNN的遥感影像滑坡识别方法研究
20
作者 王建霞 郭玉凤 +1 位作者 杨春金 张晓明 《河北工业科技》 2025年第4期323-332,共10页
为了提升复杂背景下遥感影像的滑坡识别精度,提出了一种基于改进掩码区域卷积神经网络(mask region-based convolutional neural network,Mask RCNN)的遥感影像滑坡识别方法。首先,在Mask RCNN模型中将主干网络替换为残差网络101(residu... 为了提升复杂背景下遥感影像的滑坡识别精度,提出了一种基于改进掩码区域卷积神经网络(mask region-based convolutional neural network,Mask RCNN)的遥感影像滑坡识别方法。首先,在Mask RCNN模型中将主干网络替换为残差网络101(residual network101,ResNet101),并引入卷积块注意力模块(convolutional block attention module,CBAM)、路径聚合特征金字塔网络(path aggregation feature pyramid network,PAFPN)和级联检测器,构建一个遥感影像滑坡识别模型;然后,基于遥感影像滑坡数据集完成模型训练;最后,将测试影像输入训练后的模型进行检测与分割实验。结果表明:与原Mask RCNN模型相比,改进后模型的Box平均精度从80.2%提升至83.7%,Mask平均精度从79.1%提升至81.1%,预测时间整体变化幅度较小。改进后的Mask RCNN模型具有较高的检测精度和实时处理能力,为滑坡灾害预警提供了重要技术支撑。 展开更多
关键词 计算机图像处理 滑坡识别 mask RCNN 遥感影像 卷积块注意力模块
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部