期刊文献+
共找到366篇文章
< 1 2 19 >
每页显示 20 50 100
Masked Sentence Model Based on BERT for Move Recognition in Medical Scientific Abstracts 被引量:24
1
作者 Gaihong Yu Zhixiong Zhang +1 位作者 Huan Liu Liangping Ding 《Journal of Data and Information Science》 CSCD 2019年第4期42-55,共14页
Purpose:Mo ve recognition in scientific abstracts is an NLP task of classifying sentences of the abstracts into different types of language units.To improve the performance of move recognition in scientific abstracts,... Purpose:Mo ve recognition in scientific abstracts is an NLP task of classifying sentences of the abstracts into different types of language units.To improve the performance of move recognition in scientific abstracts,a novel model of move recognition is proposed that outperforms the BERT-based method.Design/methodology/approach:Prevalent models based on BERT for sentence classification often classify sentences without considering the context of the sentences.In this paper,inspired by the BERT masked language model(MLM),we propose a novel model called the masked sentence model that integrates the content and contextual information of the sentences in move recognition.Experiments are conducted on the benchmark dataset PubMed 20K RCT in three steps.Then,we compare our model with HSLN-RNN,BERT-based and SciBERT using the same dataset.Findings:Compared with the BERT-based and SciBERT models,the F1 score of our model outperforms them by 4.96%and 4.34%,respectively,which shows the feasibility and effectiveness of the novel model and the result of our model comes closest to the state-of-theart results of HSLN-RNN at present.Research limitations:The sequential features of move labels are not considered,which might be one of the reasons why HSLN-RNN has better performance.Our model is restricted to dealing with biomedical English literature because we use a dataset from PubMed,which is a typical biomedical database,to fine-tune our model.Practical implications:The proposed model is better and simpler in identifying move structures in scientific abstracts and is worthy of text classification experiments for capturing contextual features of sentences.Originality/value:T he study proposes a masked sentence model based on BERT that considers the contextual features of the sentences in abstracts in a new way.The performance of this classification model is significantly improved by rebuilding the input layer without changing the structure of neural networks. 展开更多
关键词 Move recognition BERT masked sentence model Scientific abstracts
在线阅读 下载PDF
基于改进Mask R-CNN的金刚石磨盘表面形态分割与评价
2
作者 索文隆 林燕芬 方从富 《金刚石与磨料磨具工程》 北大核心 2025年第3期416-426,共11页
金刚石磨盘广泛应用于各类硬脆材料的磨削加工中,磨盘表面形态对加工工件质量与磨盘磨削性能有着直接的影响。为对磨盘表面形态进行检测,提出基于改进Mask R-CNN模型的分割方法对磨盘表面图像中的磨粒、气孔进行识别与分割,并对模型进... 金刚石磨盘广泛应用于各类硬脆材料的磨削加工中,磨盘表面形态对加工工件质量与磨盘磨削性能有着直接的影响。为对磨盘表面形态进行检测,提出基于改进Mask R-CNN模型的分割方法对磨盘表面图像中的磨粒、气孔进行识别与分割,并对模型进行训练与验证。结果表明:使用该方法能够实现磨盘表面图像中磨粒、气孔的识别与分割,平均准确率为78.2%。为验证该方法分割的磨粒、气孔与实际结果的差异,提出目标数量识别准确率、目标分割面积准确率、目标位置误差3个参数来评价分割效果,结果表明:磨粒、气孔的数量识别准确率分别为82.1%与93.4%,分割面积准确率分别为89.9%与95.3%,位置误差分别为3.80%与2.80%,证明该方法有效。 展开更多
关键词 磨盘检测 深度学习 改进mask R-CNN模型 分割评价
在线阅读 下载PDF
基于改进Mask R-CNN的无人船视觉检测 被引量:1
3
作者 佟剑峰 于雨 《船海工程》 北大核心 2025年第1期6-12,共7页
针对无人船视觉检测算法准确率低及水界线检测困难的问题,构造自定义数据集并提出改进Mask R-CNN网络模型的无人船视觉检测算法。改进后的算法以Mask R-CNN网络模型为检测框架,将骨干网络由ResNet50替换成ResNeXt50并加入SENet注意力机... 针对无人船视觉检测算法准确率低及水界线检测困难的问题,构造自定义数据集并提出改进Mask R-CNN网络模型的无人船视觉检测算法。改进后的算法以Mask R-CNN网络模型为检测框架,将骨干网络由ResNet50替换成ResNeXt50并加入SENet注意力机制模块提高模型的特征提取能力;在特征金字塔网络(feature pyramid network,FPN)中加入多尺度的特征提取模块(inception模块),提高特征图的融合效果;加入多尺度锚框(anchors),提高模型对于多尺度目标的检测效果;通过直方图均衡化、调整对比度的方式对输入图像进行预处理,优化输入图像。结果表明,改进后的Mask R-CNN网络模型相比于原始的网络模型在目标检测任务中平均精度均值(mean average precision,mAP)提高了8.86%,交并比为0.5条件下的平均精度(IOU=0.5 average precision,AP 50)提高了9.39%;在实例分割任务中mAP提高了4.55%,AP 50提高了4.63%。相关改进,提高了无人船视觉检测的效率。 展开更多
关键词 无人船视觉 mask R-CNN网络模型 骨干网络 注意力机制 特征融合
在线阅读 下载PDF
KitWaSor:Pioneering pre-trained model for kitchen waste sorting with an innovative million-level benchmark dataset
4
作者 Leyuan Fang Shuaiyu Ding +3 位作者 Hao Feng Junwu Yu Lin Tang Pedram Ghamisi 《CAAI Transactions on Intelligence Technology》 2025年第1期94-114,共21页
Intelligent sorting is an important prerequisite for the full quantitative consumption and harmless disposal of kitchen waste.The existing object detection method based on an ImageNet pre-trained model is an effective... Intelligent sorting is an important prerequisite for the full quantitative consumption and harmless disposal of kitchen waste.The existing object detection method based on an ImageNet pre-trained model is an effective way of sorting.Owing to significant domain gaps between natural images and kitchen waste images,it is difficult to reflect the characteristics of diverse scales and dense distribution in kitchen waste based on an ImageNet pre-trained model,leading to poor generalisation.In this article,the authors propose the first pre-trained model for kitchen waste sorting called KitWaSor,which combines both contrastive learning(CL)and masked image modelling(MIM)through self-supervised learning(SSL).First,to address the issue of diverse scales,the authors propose a mixed masking strategy by introducing an incomplete masking branch based on the original random masking branch.It prevents the complete loss of small-scale objects while avoiding excessive leakage of large-scale object pixels.Second,to address the issue of dense distribution,the authors introduce semantic consistency constraints on the basis of the mixed masking strategy.That is,object semantic reasoning is performed through semantic consistency constraints to compensate for the lack of contextual information.To train KitWaSor,the authors construct the first million-level kitchen waste dataset across seasonal and regional distributions,named KWD-Million.Extensive experiments show that KitWaSor achieves state-of-the-art(SOTA)performance on the two most relevant downstream tasks for kitchen waste sorting(i.e.image classification and object detection),demonstrating the effectiveness of the proposed KitWaSor. 展开更多
关键词 contrastive learning kitchen waste masked image modeling pre-trained model self-supervised learning
在线阅读 下载PDF
基于改进Mask R-CNN的对虾部位分割方法
5
作者 蔡礼扬 宁萌 +3 位作者 杨九洲 陈义亮 马泓睿 王雨芊 《包装与食品机械》 北大核心 2025年第1期17-25,共9页
为解决对虾加工中部位精准分割的问题,提出一种基于深度学习的方法来完成对虾各部位的语义分割。融入SimAM空间注意力机制于语义分割模型Mask R-CNN的特征提取网络ResNet的残差块中,并采用Sobel算子进行边缘提取,增加边缘损失函数,提升... 为解决对虾加工中部位精准分割的问题,提出一种基于深度学习的方法来完成对虾各部位的语义分割。融入SimAM空间注意力机制于语义分割模型Mask R-CNN的特征提取网络ResNet的残差块中,并采用Sobel算子进行边缘提取,增加边缘损失函数,提升模型边缘分割精度。结果表明,模型的平均交并比为94.14%,平均像素准确率为97.06%,头部轮廓交并比为84.12%,躯干轮廓交并比为83.79%,尾部轮廓交并比为94.31%。采用相同的数据集和试验环境与Unet,PSPNet,SegNet,Segformer进行对比试验,所提出的方法分割效果优于其他经典分割模型,可较好地完成对虾部位的分割任务。研究结果为对虾加工领域提供一种新思路。 展开更多
关键词 对虾 部位分割 mask R-CNN模型 边缘监督 注意力机制
在线阅读 下载PDF
融合多源遥感数据和改进后Mask R-CNN深度学习模型的复杂高原地形区冰湖智能识别
6
作者 张世殊 李青春 +3 位作者 黎昊 向新建 董傲男 窦杰 《地球科学》 北大核心 2025年第8期3132-3143,共12页
冰湖识别是了解冰湖对气候变化的响应和评估冰湖溃决洪水潜在危险的先决条件.虽然遥感技术使全球冰湖演变的持续监测和评估成为可能,但准确可靠地提取复杂高原地形区的冰湖仍然具有挑战性.提出了融合多源遥感数据和改进后Mask R-CNN深... 冰湖识别是了解冰湖对气候变化的响应和评估冰湖溃决洪水潜在危险的先决条件.虽然遥感技术使全球冰湖演变的持续监测和评估成为可能,但准确可靠地提取复杂高原地形区的冰湖仍然具有挑战性.提出了融合多源遥感数据和改进后Mask R-CNN深度学习模型的复杂高原地形区冰湖智能识别方法,在Mask R-CNN模型基础上,通过在骨干网络ResNet-50的高层特征(Conv4和Conv5)、FPN的每个特征图以及Mask Head中引入注意力机制.利用Sentinel-2高分辨遥感影像、ALOS-DEM及NDWI数据组成多波段数据集,并在青藏高原东南部的林芝市进行测试,并进一步比较了改进后Mask R-CNN、U-Net、SegNet和DeepLab V3模型在冰湖识别中的性能.改进后的Mask R-CNN模型具有更高的准确率,模型的精确度、召回率和准确度值分别达到了91.25%、93.69%、92.89%.它有效地降低了山体阴影、湖水浊度和冻融湖水条件对冰湖识别的影响,并显著提高了小冰湖的识别效率.为地形复杂高原地形区冰湖识别提供了可靠解决方案,为深度学习与多源遥感数据结合的智能化冰湖提取提供了新的框架和可能性. 展开更多
关键词 冰湖 复杂高原地形区 智能识别 mask R-CNN模型 多源遥感数据
原文传递
基于改进Mask R-CNN模型的电力场景目标检测方法 被引量:22
7
作者 孔英会 王维维 +1 位作者 张珂 戚银城 《科学技术与工程》 北大核心 2020年第8期3134-3142,共9页
为了解决电力施工现场中安全帽佩戴情况以及危险区域行人入侵检测问题,提出一种基于改进Mask R-CNN模型的目标检测方法。首先依据迁移学习策略对Mask R-CNN主干网络进行参数初始化,以提取图像基本特征;然后引入特征金字塔结构进行自下... 为了解决电力施工现场中安全帽佩戴情况以及危险区域行人入侵检测问题,提出一种基于改进Mask R-CNN模型的目标检测方法。首先依据迁移学习策略对Mask R-CNN主干网络进行参数初始化,以提取图像基本特征;然后引入特征金字塔结构进行自下而上的特征图提取,完成多尺度特征融合;接着,通过多尺度变换方法对区域推荐网络进行调整,获取锚点进行回归计算完成检测实验;最终对结果进行分析评价,多目标平均准确率达到了95.22%。将改进后的Mask R-CNN模型用于监控视频分析,针对监控视频像素过低问题,加入拉普拉斯算法锐化边缘,精准率提高到90.9%,验证了拉普拉斯算法对低质量监控视频检测的有效性。 展开更多
关键词 mask R-CNN模型 电力施工现场 目标检测 特征金字塔 区域推荐网络
在线阅读 下载PDF
基于Mask R-CNN的电力关键设备运行状态检测 被引量:5
8
作者 吕超 杨德宇 +1 位作者 刘文杰 张克胜 《电子设计工程》 2024年第2期107-110,115,共5页
为判断电力关键设备两端负载电压与干路总电压之间的数值关系,提出基于Mask R-CNN的电力关键设备运行状态检测方法。在Mask R-CNN网络结构中,判断电量信号的时域范围与频域范围。然后根据负荷阻抗特征计算交流参数的取值结果,再联合已... 为判断电力关键设备两端负载电压与干路总电压之间的数值关系,提出基于Mask R-CNN的电力关键设备运行状态检测方法。在Mask R-CNN网络结构中,判断电量信号的时域范围与频域范围。然后根据负荷阻抗特征计算交流参数的取值结果,再联合已获取的电信号参量,求解连续相关函数,从而检测电力关键设备运行状态。实验过程中,设备两端负载电压、内阻消耗电压之和与干路总电压之间的差值未超过1.5 V,说明该方法能够证明电力关键设备两端负载电压、内阻消耗电压之和等于干路总电压数值的猜想成立,可以根据该验证检测电力关键设备运行状态是否正常。 展开更多
关键词 mask R-CNN模型 电力设备 运行状态 负荷阻抗 交流参数 负载电压
在线阅读 下载PDF
基于分割掩码的背光源工业图像去毛刺方法
9
作者 陈雨扬 龚津南 汪俊辉 《现代电子技术》 北大核心 2026年第3期23-30,共8页
针对工业环境中工件表面附着尘屑,导致尺寸测量精度下降的问题,提出一种基于分割掩码的背光源工业图像去毛刺方法。为了提升图像细节信息的捕捉与整体结构的还原能力,避免传统形态学方法导致的过度平滑现象,文中首先设计了全局-局部特... 针对工业环境中工件表面附着尘屑,导致尺寸测量精度下降的问题,提出一种基于分割掩码的背光源工业图像去毛刺方法。为了提升图像细节信息的捕捉与整体结构的还原能力,避免传统形态学方法导致的过度平滑现象,文中首先设计了全局-局部特征提取模块(GLFEM)作为特征融合模块(FFM)的核心;其次,为了降低模型计算复杂度,增强特征表达能力,采用选择注意力部分卷积(SAPC)和综合统计注意力(ISA)机制对关键特征信息进行捕捉;最后,引入了Mask掩码自适应增强模块与改进损失函数,进一步提高了轮廓边缘毛刺的去除效果。实验结果表明,在针对螺纹的5个测量指标中,大径、中径、小径、螺距和螺纹角的平均误差分别为0.00026 mm、0.00492 mm、0.00596 mm、0.00011 mm和0.073°,与现有深度学习方法相比,所提方法在尺寸测量准确性方面具有显著优势。此外,所提方法不仅解决了精确尺寸测量问题,而且在保持测量精度的同时,其参数量和计算量与现有模型相当,实现了实时性和准确度的平衡,适合在资源受限的工业场景中部署。 展开更多
关键词 工业图像 边缘去毛刺 图像复原 注意力机制 部分卷积 图像掩码 轻量化模型
在线阅读 下载PDF
深度网络自适应优化的Mask R-CNN模型在铸件表面缺陷检测中的应用研究 被引量:12
10
作者 马宇超 付华良 +4 位作者 吴鹏 陈信华 王鼎 陈帅 曹晨雨 《现代制造工程》 CSCD 北大核心 2022年第4期112-118,共7页
针对传统铸件表面缺陷检测方法不能进行分类检测、检测效率低以及检测精度低等问题,提出了一种深度网络自适应优化的Mask R-CNN模型,将其应用于铸件表面缺陷检测中,实现缺陷的精确识别和分类。选择裂纹、气孔和缩松3种常见缺陷作为研究... 针对传统铸件表面缺陷检测方法不能进行分类检测、检测效率低以及检测精度低等问题,提出了一种深度网络自适应优化的Mask R-CNN模型,将其应用于铸件表面缺陷检测中,实现缺陷的精确识别和分类。选择裂纹、气孔和缩松3种常见缺陷作为研究对象,使用Labelme图像标注工具对铸件表面缺陷图像进行了标注,生成数据集。同时,运用PyTorch深度学习框架搭建Mask R-CNN模型,利用深度迁移学习的网络自适应策略优化模型的泛化能力。通过主干特征提取网络对输入的图形数据进行全图特征提取;采用区域建议网络(Regional Proposal Network,RPN)生成区域建议框;利用RoI Align获取感兴趣区域,通过分类、回归网络分别进行分类、回归,同时进行掩膜生成;在铸件表面缺陷检测平台上进行验证实验,并与其他深度学习检测方法进行对比。实验结果表明,优化后的Mask R-CNN模型整体性能优于原Mask R-CNN模型、Faster R-CNN模型和YOLO v3模型,能准确检测出常见的铸件表面缺陷,平均检测精度mAP达到92%,对铸件表面缺陷检测领域有较好的研究应用价值。 展开更多
关键词 缺陷检测 深度学习 mask R-CNN模型 迁移学习 深度网络自适应
在线阅读 下载PDF
基于先验MASK注意力机制的视频问答方案 被引量:2
11
作者 许振雷 董洪伟 《计算机工程》 CAS CSCD 北大核心 2021年第2期52-59,共8页
视频问答是深度学习领域的研究热点之一,广泛应用于安防和广告等系统中。在注意力机制框架下,建立先验MASK注意力机制模型,使用Faster R-CNN模型提取视频关键帧以及视频中的对象标签,将其与问题文本特征进行3种注意力加权,利用MASK屏蔽... 视频问答是深度学习领域的研究热点之一,广泛应用于安防和广告等系统中。在注意力机制框架下,建立先验MASK注意力机制模型,使用Faster R-CNN模型提取视频关键帧以及视频中的对象标签,将其与问题文本特征进行3种注意力加权,利用MASK屏蔽与问题无关的答案,从而增强模型的可解释性。实验结果表明,该模型在视频问答任务中的准确率达到61%,与VQA+、SA+等视频问答模型相比,其具有更快的预测速度以及更好的预测效果。 展开更多
关键词 视频问答 计算机视觉 自然语言处理 注意力机制 mask模型
在线阅读 下载PDF
基于Mask R-CNN的款式图衣领识别 被引量:2
12
作者 黄振华 李涛 +1 位作者 蒋玉萍 杜磊 《服装学报》 CAS 2021年第1期36-41,共6页
为提升服装款式图领型识别精度,提出一种基于Mask R-CNN神经网络的服装款式图领型定位与识别方法。建立共1800张包含无领、立领、翻领与驳领4种领型的款式图样本库,利用迁移学习与Mask R-CNN神经网络实现领型定位与识别。结果表明,4种... 为提升服装款式图领型识别精度,提出一种基于Mask R-CNN神经网络的服装款式图领型定位与识别方法。建立共1800张包含无领、立领、翻领与驳领4种领型的款式图样本库,利用迁移学习与Mask R-CNN神经网络实现领型定位与识别。结果表明,4种领型的平均识别精确度高于98%,测试集平均精确度达到99.2%,mAP值达到90%。该识别方法可以减少样板生成中的人工失误,为数字化样板生成提供参考。 展开更多
关键词 mask R-CNN模型 款式图 服装领型 识别定位
在线阅读 下载PDF
改进Mask R-CNN的温室环境下不同成熟度番茄果实分割方法 被引量:50
13
作者 龙洁花 赵春江 +3 位作者 林森 郭文忠 文朝武 张宇 《农业工程学报》 EI CAS CSCD 北大核心 2021年第18期100-108,共9页
基于深度神经网络的果实识别和分割是采摘机器人作业成功的关键步骤,但由于网络参数多、计算量大,导致训练时间长,当模型部署到采摘机器人上则存在运行速度慢,识别精度低等问题。针对这些问题,该研究提出了一种改进Mask R-CNN的温室环... 基于深度神经网络的果实识别和分割是采摘机器人作业成功的关键步骤,但由于网络参数多、计算量大,导致训练时间长,当模型部署到采摘机器人上则存在运行速度慢,识别精度低等问题。针对这些问题,该研究提出了一种改进Mask R-CNN的温室环境下不同成熟度番茄果实分割方法,采用跨阶段局部网络(Cross Stage Partial Network,CSPNet)与Mask R-CNN网络中的残差网络(Residual Network,ResNet)进行融合,通过跨阶段拆分与级联策略,减少反向传播过程中重复的特征信息,降低网络计算量的同时提高准确率。在番茄果实测试集上进行试验,结果表明以层数为50的跨阶段局部残差网络(Cross Stage Partial ResNet50,CSP-ResNet50)为主干的改进Mask R-CNN模型对绿熟期、半熟期、成熟期番茄果实分割的平均精度均值为95.45%,F1分数为91.2%,单张图像分割时间为0.658 s。该方法相比金字塔场景解析网络(Pyramid Scene Parsing Network,PSPNet)、DeepLab v3+模型和以ResNet50为主干的Mask R-CNN模型平均精度均值分别提高了16.44、14.95和2.29个百分点,相比以ResNet50为主干的Mask R-CNN模型分割时间减少了1.98%。最后将以CSP-ResNet50为主干的改进Mask R-CNN模型部署到采摘机器人上,在大型玻璃温室中开展不同成熟度番茄果实识别试验,该模型识别正确率达到90%。该研究在温室环境下对不同成熟度番茄果实具有较好的识别性能,可为番茄采摘机器人精准作业提供依据。 展开更多
关键词 图像处理 机器视觉 模型 番茄 成熟度分割 mask R-CNN 残差网络 跨阶段局部网络
在线阅读 下载PDF
基于改进Mask R-CNN模型的粘连烟丝识别方法 被引量:1
14
作者 张伟伟 姬远鹏 +5 位作者 元春波 王君婷 齐晓任 张卫正 李萌 饶智 《轻工学报》 CAS 北大核心 2024年第5期78-85,共8页
为精准识别并高效分割粘连烟丝,提出一种基于改进掩码区域卷积神经网络模型(Mask R-CNN)的粘连烟丝识别方法。首先,采集粘连烟丝图像,通过图像增强操作将数据集扩充到训练模型所需的样本数量;其次,在Mask R-CNN模型的基础上对训练样本... 为精准识别并高效分割粘连烟丝,提出一种基于改进掩码区域卷积神经网络模型(Mask R-CNN)的粘连烟丝识别方法。首先,采集粘连烟丝图像,通过图像增强操作将数据集扩充到训练模型所需的样本数量;其次,在Mask R-CNN模型的基础上对训练样本中的粘连烟丝图像进行边缘特征提取、分形特征提取,获得更清晰、连续的图像边缘特征信息和纹理特征信息;再次,将原始特征、边缘特征、分形特征进行融合以充分利用不同层次的特征信息,丰富底层特征;最后,通过引入混合注意力机制关注特征图的通道和空间维度,从而提高粘连烟丝识别的效率和准确性。模型性能对比结果表明:基于改进Mask R-CNN模型的识别方法的平均交并比(Avg.MIoU)为85.29%,类别平均像素准确率(Avg.MPA)为84.33%,其能够快速、准确地识别并分割出单根烟丝,识别效果优于Mask R-CNN和DeepLabV3+模型识别方法,可为后续烟丝宽度检测提供技术支持。 展开更多
关键词 粘连烟丝 改进mask R-CNN模型 边缘特征提取 特征融合 混合注意力机制
在线阅读 下载PDF
基于改进Mask R-CNN的牛脸目标检测算法 被引量:3
15
作者 关忠榜 杨颜博 李敏超 《电子测量技术》 北大核心 2023年第24期133-138,共6页
针对牛脸检测时,存在的检测精度不高、牛脸较小被漏检或误检等问题,提出一种改进的Mask R-CNN+MResNet模型。首先,在ResNet101网络的基础上提出一种MResNet网络,通过对ResNet101网络的改进,提高了模型检测精度。其次,对模型的RPN网络的... 针对牛脸检测时,存在的检测精度不高、牛脸较小被漏检或误检等问题,提出一种改进的Mask R-CNN+MResNet模型。首先,在ResNet101网络的基础上提出一种MResNet网络,通过对ResNet101网络的改进,提高了模型检测精度。其次,对模型的RPN网络的锚框尺寸进行调整,提高了模型对较小目标的牛脸检测能力。实验结果表明,MResNet网络对牛脸检测精度相比较原始的网络模型,提高了12.6%;改进后的模型对于小目标检测能力平均精度较原始模型提高了2.4%。说明该模型能有效的实现小目标牛脸的检测,具有实际应用价值。 展开更多
关键词 牛脸检测 mask R-CNN模型 ResNet101网络 RPN网络
原文传递
基于改进Mask R-CNN的番茄侧枝修剪点识别方法 被引量:16
16
作者 梁喜凤 章鑫宇 王永维 《农业工程学报》 EI CAS CSCD 北大核心 2022年第23期112-121,共10页
为解决番茄枝叶修剪机器人无法准确识别番茄侧枝修剪点的问题,提出基于改进Mask R-CNN模型的番茄侧枝修剪点的识别方法。将Mask R-CNN的主干网络ResNet50替换为MobileNetv3-Large来降低模型复杂度和提升运行速度,并对部分特征图添加ECA(... 为解决番茄枝叶修剪机器人无法准确识别番茄侧枝修剪点的问题,提出基于改进Mask R-CNN模型的番茄侧枝修剪点的识别方法。将Mask R-CNN的主干网络ResNet50替换为MobileNetv3-Large来降低模型复杂度和提升运行速度,并对部分特征图添加ECA(Efficient Channel Attention)注意力机制,以提升模型精度;通过改进的Mask R-CNN模型预测番茄侧枝与主枝的分割掩膜和边框位置;针对部分单根枝条被分割成多段掩膜的问题,通过掩膜边界框宽高比区分侧枝和主枝,分析同一枝条相邻掩膜约束条件,然后将符合约束条件的掩膜进行合并连接;根据修剪点在主枝附近的特点确定修剪点所在端,确定靠近修剪端端点的中心点作为侧枝的修剪点。试验结果表明,改进的Mask R-CNN模型平均分割图片时间为0.319 s,召回率和精确率分别为91.2%和88.6%,掩膜平均合并成功率为86.2%,修剪点识别平均准确率为82.9%。该研究为番茄枝叶修剪机器人的研发提供参考。 展开更多
关键词 模型 图像识别 目标检测 mask R-CNN 侧枝 主枝 修剪点
在线阅读 下载PDF
Mask R-CNN模型在茄花花期识别中的应用研究 被引量:2
17
作者 郑凯 方春 +2 位作者 袁思邈 冯创 李国坤 《计算机工程与应用》 CSCD 北大核心 2022年第18期318-326,共9页
将Mask R-CNN实例分割模型应用于茄子花期识别研究,针对Mask R-CNN模型对大目标物存在误检和漏检的情况,提出使用混合空洞卷积融合普通卷积的方法,在ResNet50的残差块中进行参数修改,通过堆叠残差块完成对整个特征提取网络的改进,扩大... 将Mask R-CNN实例分割模型应用于茄子花期识别研究,针对Mask R-CNN模型对大目标物存在误检和漏检的情况,提出使用混合空洞卷积融合普通卷积的方法,在ResNet50的残差块中进行参数修改,通过堆叠残差块完成对整个特征提取网络的改进,扩大了特征图感受野,增强了全局信息关联性;针对出现的过拟合问题,运用迁移学习方法将预训练的ResNet50特征提取网络作为茄花识别模型的初始参数,提高了模型在测试集泛化能力的同时提升了模型训练速度。运用改进的模型在测试集上的mAP为0.962,mIOU为0.715。通过定性分析并与其他模型进行对比,证明改进的模型能有效提高大目标物分割能力,对茄子花期识别具有良好效果。该研究为茄花自动授粉与花期管理提供了技术支持,对保证授粉质量,提升经济效益具有重要意义。 展开更多
关键词 mask R-CNN模型 实例分割 目标检测 混合空洞卷积 迁移学习
在线阅读 下载PDF
基于改进Mask R-CNN模型的植物叶片分割方法 被引量:19
18
作者 袁山 汤浩 郭亚 《农业工程学报》 EI CAS CSCD 北大核心 2022年第1期212-220,共9页
通过图像处理对植物叶片进行分割是研究植物表型性状的基础,但叶片间相互遮挡、叶片边缘特征不明显以及幼叶目标过小会对叶片分割效果造成很大的障碍。针对上述问题,该研究提出了一种基于改进MaskR-CNN模型的植物叶片分割方法,通过引入... 通过图像处理对植物叶片进行分割是研究植物表型性状的基础,但叶片间相互遮挡、叶片边缘特征不明显以及幼叶目标过小会对叶片分割效果造成很大的障碍。针对上述问题,该研究提出了一种基于改进MaskR-CNN模型的植物叶片分割方法,通过引入级联检测模块对模型检测分支进行改进,以提高遮挡叶片检测质量;利用注意力机制和一个2层3×3卷积模块对模型分割分支进行优化,以提高边缘特征表达能力;在模型测试过程中采用多尺度叶片分割策略,利用多个尺度上的最优目标以分割幼叶。测试结果表明,在CVPPP叶片分割挑战数据集中的对称最佳Dice得分Symmetric Best Dice(SBD)为90.3%,相比于利用域随机化数据增强策略并采用MaskR-CNN模型进行叶片实例分割的方法提高了2.3个百分点,叶片分割效果有显著提升。该研究提出的方法可以有效解决植物叶片分割效果不佳的问题,为植物表型研究提供技术支撑。 展开更多
关键词 模型 图像处理 mask R-CNN 植物叶片 注意力机制 多尺度分割
在线阅读 下载PDF
基于Mask R-CNN模型的铁路隧道衬砌机制砂混凝土裂缝视觉检测 被引量:2
19
作者 蒋志超 贺兆鹏 《无损检测》 CAS 2024年第6期60-65,共6页
铁路隧道衬砌结构裂缝图像具有复杂的灰度分布和变化特征,局部和全局的多特征信息会干扰跟踪方向和边界跟踪参数,模型可扩展性受限,检测准确率较低。为此,提出基于Mask R-CNN模型的铁路隧道衬砌机制砂混凝土裂缝视觉检测方法。首先输入... 铁路隧道衬砌结构裂缝图像具有复杂的灰度分布和变化特征,局部和全局的多特征信息会干扰跟踪方向和边界跟踪参数,模型可扩展性受限,检测准确率较低。为此,提出基于Mask R-CNN模型的铁路隧道衬砌机制砂混凝土裂缝视觉检测方法。首先输入分段线性变换后的砂混凝土裂缝图像,抽取阈值,生成连通域标识,再以像素点为背景点,在Mask R-CNN模型中,同时检测裂缝区域的位置和标记像素级的边缘掩膜,判定裂缝边界起点与裂缝宽度;然后进行累加视觉检测方法设计,按照裂缝的几何特征以及排序结果,求解裂缝长度,获得完整的裂缝轮廓。试验结果表明,所提方法可以较为完整地检测所有关键位置,裂缝参数信息检测准确率较高;迭代次数升高后,检测结果受到的影响较小,可扩展性得到了改善,可适应任务需求,具有较好的应用价值。 展开更多
关键词 mask R-CNN模型 铁路隧道 衬砌机制 砂混凝土裂缝 视觉检测
在线阅读 下载PDF
PCB CT Image Element Segmentation Model Optimizing the Semantic Perception of Connectivity Relationship
20
作者 Chen Chen Kai Qiao +2 位作者 Jie Yang Jian Chen Bin Yan 《Computers, Materials & Continua》 SCIE EI 2024年第11期2629-2642,共14页
Computed Tomography(CT)is a commonly used technology in Printed Circuit Boards(PCB)non-destructive testing,and element segmentation of CT images is a key subsequent step.With the development of deep learning,researche... Computed Tomography(CT)is a commonly used technology in Printed Circuit Boards(PCB)non-destructive testing,and element segmentation of CT images is a key subsequent step.With the development of deep learning,researchers began to exploit the“pre-training and fine-tuning”training process for multi-element segmentation,reducing the time spent on manual annotation.However,the existing element segmentation model only focuses on the overall accuracy at the pixel level,ignoring whether the element connectivity relationship can be correctly identified.To this end,this paper proposes a PCB CT image element segmentation model optimizing the semantic perception of connectivity relationship(OSPC-seg).The overall training process adopts a“pre-training and fine-tuning”training process.A loss function that optimizes the semantic perception of circuit connectivity relationship(OSPC Loss)is designed from the aspect of alleviating the class imbalance problem and improving the correct connectivity rate.Also,the correct connectivity rate index(CCR)is proposed to evaluate the model’s connectivity relationship recognition capabilities.Experiments show that mIoU and CCR of OSPC-seg on our datasets are 90.1%and 97.0%,improved by 1.5%and 1.6%respectively compared with the baseline model.From visualization results,it can be seen that the segmentation performance of connection positions is significantly improved,which also demonstrates the effectiveness of OSPC-seg. 展开更多
关键词 Semantic segmentation PCB non-destructive testing mask image modeling connectivity relationship
在线阅读 下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部