期刊文献+
共找到92篇文章
< 1 2 5 >
每页显示 20 50 100
A medical image segmentation model based on SAM with an integrated local multi-scale feature encoder
1
作者 DI Jing ZHU Yunlong LIANG Chan 《Journal of Measurement Science and Instrumentation》 2025年第3期359-370,共12页
Despite its remarkable performance on natural images,the segment anything model(SAM)lacks domain-specific information in medical imaging.and faces the challenge of losing local multi-scale information in the encoding ... Despite its remarkable performance on natural images,the segment anything model(SAM)lacks domain-specific information in medical imaging.and faces the challenge of losing local multi-scale information in the encoding phase.This paper presents a medical image segmentation model based on SAM with a local multi-scale feature encoder(LMSFE-SAM)to address the issues above.Firstly,based on the SAM,a local multi-scale feature encoder is introduced to improve the representation of features within local receptive field,thereby supplying the Vision Transformer(ViT)branch in SAM with enriched local multi-scale contextual information.At the same time,a multiaxial Hadamard product module(MHPM)is incorporated into the local multi-scale feature encoder in a lightweight manner to reduce the quadratic complexity and noise interference.Subsequently,a cross-branch balancing adapter is designed to balance the local and global information between the local multi-scale feature encoder and the ViT encoder in SAM.Finally,to obtain smaller input image size and to mitigate overlapping in patch embeddings,the size of the input image is reduced from 1024×1024 pixels to 256×256 pixels,and a multidimensional information adaptation component is developed,which includes feature adapters,position adapters,and channel-spatial adapters.This component effectively integrates the information from small-sized medical images into SAM,enhancing its suitability for clinical deployment.The proposed model demonstrates an average enhancement ranging from 0.0387 to 0.3191 across six objective evaluation metrics on BUSI,DDTI,and TN3K datasets compared to eight other representative image segmentation models.This significantly enhances the performance of the SAM on medical images,providing clinicians with a powerful tool in clinical diagnosis. 展开更多
关键词 segment anything model(sam) medical image segmentation ENCODER decoder multiaxial Hadamard product module(MHPM) cross-branch balancing adapter
在线阅读 下载PDF
基于Stone-SAM的便携式粗集料级配智能检测
2
作者 张鸿 杨俊雅 +2 位作者 刘可心 张益鹏 程雪聪 《建筑材料学报》 北大核心 2025年第6期581-590,共10页
为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学... 为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学表征算法,开发移动端应用程序,实现粗集料级配高通量检测。对5种粗集料级配场景进行测试。结果表明:本研究方法对于粗集料颗粒的分割精度高于原始SAM模型,并且能够精确去除背景信息,粗集料颗粒关键参数提取结果准确可靠。 展开更多
关键词 分割一切模型(sam) 粗集料级配 智能检测 移动端 工程检测
在线阅读 下载PDF
轻量级微调SAM的结肠息肉分割方法SAMCP
3
作者 刘娜 封筠 +2 位作者 霍一儒 王弘扬 杨柳 《计算机应用》 北大核心 2025年第10期3390-3398,共9页
在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像... 在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像存在域差异,现有的SAM方法在结肠息肉分割任务上仍难以取得理想效果。为解决这一问题,基于SAM架构提出一种轻量级微调结肠息肉分割方法(SAMCP)。该方法引入精简适配器模块,重点关注通道维度信息,采用Dice和交并比(IoU)简化联合损失函数,并在训练时冻结原始图像编码器和提示编码器的参数,以低训练成本提升结肠息肉分割性能。在3个公开数据集上与9种先进方法的对比实验结果表明,相较于SAM方法,SAMCP在Kvasir-SEG数据集上的Dice和IoU值分别提高了56.7%和84.5%,在CVC-ClinicDB数据集上的Dice和IoU值分别提高了46.0%和86.0%,在CVC-ColonDB数据集上的Dice和IoU值分别提高了95.3%和122.2%,超过目前SAM-based类方法的最佳性能。在引入点提示的情况下,即使只使用1次点击,SAMCP仍能优于其他SAM-based方法。以上验证了SAMCP在处理复杂形状和局部细节时表现出色,可为医生提供更精确的分割指导。 展开更多
关键词 结肠息肉分割 分割一切模型 适配器 损失函数 轻量级微调
在线阅读 下载PDF
基于SAM图像处理的堆石料级配计算方法及验证
4
作者 张振伟 蔡可天 +3 位作者 高轩 贺一轩 王建 鲁洋 《水力发电》 2025年第2期80-86,共7页
堆石料级配检测是堆石坝施工过程中质量控制的重要环节,传统方法通常采用现场人工筛分法测量,存在检测样本少、效率低、干扰施工等问题。提出了一种基于图像处理的堆石料级配计算方法,采用国际最新Mata AI开源的通用图像分割大模型Segme... 堆石料级配检测是堆石坝施工过程中质量控制的重要环节,传统方法通常采用现场人工筛分法测量,存在检测样本少、效率低、干扰施工等问题。提出了一种基于图像处理的堆石料级配计算方法,采用国际最新Mata AI开源的通用图像分割大模型Segment Anything Model(SAM)对筑坝堆石料进行自动图像分割,提出堆石长宽比、面积比等堆石形态学几何参数用于提取堆石料图像中的堆石颗粒目标;同时,建立堆石形态数据库、堆石实例分割数据库,并分析参数取值和验证堆石图像级配计算方法的有效性;最后,试验验证结果表明该方法能够有效识别出图像中的堆石颗粒目标,实现级配曲线的智能识别,以及曲率、不均匀系数等级配指标的快速计算。该方法计算获得的级配与真实筛分法测的级配相关性可达0.94,平均绝对误差约5%,能够在堆石坝施工过程中有效辅助检测堆石料的颗粒级配信息,服务堆石坝的施工碾压质量控制。 展开更多
关键词 堆石料 级配 Segment Anything model(sam) 图像识别 快速检测
在线阅读 下载PDF
基于MSC-LSAM的多尺度交叉超声医学图像分割方法
5
作者 王朝欣 杨汶汶 +3 位作者 戎泽 李铮昱 王行 马磊 《数据采集与处理》 北大核心 2025年第2期469-484,共16页
脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割... 脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割难度。本文提出MSC⁃LSAM算法,一种多尺度交叉的双编码器超声图像分割网络,旨在实现颈动脉腔体和心脏腔体的快速、准确分割,辅助医生完成疾病诊断。MSC⁃LSAM在编码器部分并行了分割一切模型(Segment anything model,SAM)的视觉编码器和UNet编码器,在解码器部分采用UNet解码器。本研究首先冻结了预训练的SAM视觉编码器,并在Transformer层中引入高效的适配器(Adapter)块,被称可学习的分割一切模型(Learnable SAM,LSAM)。LSAM在拥有较低参数量的同时,保留学习能力和高度泛化性。然后,在UNet全局网络引入多尺度交叉注意力(Multi⁃scale cross⁃axial attention,MCA),实现多尺度特征的交叉融合,有效提升边缘分割能力,抑制模型过拟合。最后,通过高效通道注意力(Efficient channel attention,ECA)实现双编码器多尺度特征的高效融合,减少模型误分割。结果表明,本研究提出的MSC⁃LSAM在心脏超声公开数据集CAMUS和颈动脉超声自建数据集CAUS上均取得了良好的效果。CAMUS的两心腔(2CH)和四心腔(4CH)数据集分割的平均Dice相似系数(Dice similarity coefficient,DSC)分别达到0.927和0.934;CAUS数据集的平均DSC达到0.917。MSC⁃LSAM在颈动脉腔体和心脏腔体超声图像分割任务上获得了良好的分割准确度,高于主流分割算法,具有良好的应用前景。 展开更多
关键词 缺血性脑卒中 超声图像分割 分割一切模型 多尺度交叉注意力 高效通道注意力
在线阅读 下载PDF
SAM及其改进模型在图像分割中的应用综述
6
作者 马依拉木·木斯得克 高雨欣 +3 位作者 张思拓 冯珂 阿布都克力木·阿布力孜 哈里旦木·阿布都克里木 《计算机工程》 北大核心 2025年第8期16-38,共23页
随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计... 随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计算效率以及在不同应用场景中的适应性等方面,仍然存在一定的优化空间。为此,从多个维度对SAM的改进方向进行了深入探索,包括提升速度与计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计,以及提升数据利用效率与强化迁移学习能力等方面。通过这些改进,SAM不仅能够在更复杂的任务中保持高效性能,还能更好地适应各领域和应用场景的需求。在此基础上,总结SAM在医学、遥感、机械等领域中的实际应用,展示了其在不同场景下的适用性与挑战。此外,详细介绍了图像分割领域常用的数据集和评价指标,通过实验对比分析,进一步评估了视觉Transformer(ViT)变体对SAM性能的影响,以及EfficientSAM、EfficientViT-SAM、MobileSAM和RobustSAM等改进模型的性能表现。最后,总结了SAM及其改进模型在实际应用中面临的挑战,并展望了未来的发展方向,旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用,为新模型的提出提供启发。 展开更多
关键词 分割一切模型 视觉基础模型 改进模型 图像分割 通用模型
在线阅读 下载PDF
微调SAM的遥感图像高效语义分割模型DP-SAM
7
作者 刘思涌 赵毅力 《中国图象图形学报》 北大核心 2025年第8期2884-2896,共13页
目的SAM(segment anything model)已经成为自然图像零样本分割的一个大模型基准。由于遥感图像的复杂性和场景多变性,且SAM是一个需要提示信息的分割模型,直接将这个“基础宏观模型”应用于遥感图像会导致过分割以及需要大量手动输入提... 目的SAM(segment anything model)已经成为自然图像零样本分割的一个大模型基准。由于遥感图像的复杂性和场景多变性,且SAM是一个需要提示信息的分割模型,直接将这个“基础宏观模型”应用于遥感图像会导致过分割以及需要大量手动输入提示的问题。针对上述问题,提出一种通过微调将SAM用于遥感图像语义分割的高效方法。方法首先,保留原生SAM的图像编码器模块但对其训练参数进行微调,并且引入一条新的卷积神经网络(convolutional neural network,CNN)编码器路径。其次,在解码器中采用一种经过微调的无提示方法,消除了将SAM应用于图像分割需要输入提示的问题。通过CNN和Transformer两条路径分别输出两个独立的预测掩码,并根据这两个掩码获得分割的结果。这种具有两条路径且经过精细微调的模型名为DP-SAM(dual path segment anything model)。结果使用两个经过标注的遥感图像数据集Potsdam和Vaihingen对DP-SAM进行评估,并通过消融性实验对如何根据两条解码器路径的输出生成预测掩码的方法进行讨论。实验结果表明,DP-SAM能对遥感图像进行高效语义分割,平均交并比mIoU和F1分数在Potsdam数据集上达到86.2%和92.7%,在Vaihingen数据集上达到85.9%和92.4%。结论所提方法具有良好的性能,实现了将大模型应用于遥感领域语义分割场景,该方法性能优于所对比的其他基于深度学习和微调SAM的方法。本工作的源代码可在https://github.com/Jacky-Android/DP-SAM获取。 展开更多
关键词 分割一切模型(sam) 零样本 遥感图像语义分割 图像编码器 无提示 掩膜解码器
原文传递
结合反事实提示与级联解码SAM的超声图像分割
8
作者 霍一儒 封筠 +2 位作者 刘娜 史屹琛 殷梦莹 《中国图象图形学报》 北大核心 2025年第5期1303-1317,共15页
目的分割一切模型(segment anything model,SAM)在自然图像分割领域已取得显著成就,但应用于医学成像尤其是涉及对比度低、边界模糊和形状复杂的超声图像时,分割过程往往需要人工干预,并且会出现分割性能下降情况。针对上述问题,提出一... 目的分割一切模型(segment anything model,SAM)在自然图像分割领域已取得显著成就,但应用于医学成像尤其是涉及对比度低、边界模糊和形状复杂的超声图像时,分割过程往往需要人工干预,并且会出现分割性能下降情况。针对上述问题,提出一种结合反事实提示与级联解码SAM的改进方法(SAM combined wihongth counterfactual prompt and cascaded decoder,SAMCD)。方法SAMCD在SAM的基础上增加旁路卷积神经网络(convolutional renual network,CNN)图像编码器、跨分支交互适配器、提示生成器和级联解码器。通过使用旁路CNN图像编码器以及跨分支交互适配器,补充ViT(vision Transformer)编码器缺乏的局部信息,以提高模型对细节的捕捉能力;引入反事实干预机制,通过生成反事实提示,迫使模型专注于事实提示生成,提高模型分割精度;采用级联解码器获得丰富的边缘信息,即先利用SAM的原始解码器创建先验掩码,再使用加入边界注意力的Transformer解码器和像素解码器;在训练模型时采用两阶段的训练策略,即交互分割模型训练阶段和自动分割模型训练阶段。结果在TN3K(thyroid nodule 3K)和BUSI(breast ultrasound image)数据集上进行实验,SAMCD的DSC(Dice similarity coefficient)值分别达到83.66%和84.29%,较SAMCT提升0.73%和0.90%,且较对比的SAM及其变体模型更为轻量化;相较于9种先进方法,SAMCD在DSC、mIoU(mean intersection over union)、HD(Hausdorff distance)、敏感性和特异性指标上均达到最优。消融实验和可视化分析表明提出的SAMCD方法具有明显的提升效果。结论本文提出的超声医学图像分割SAMCD方法在充分利用SAM强大的特征表达能力的基础上,通过对编码器、提示生成器、解码器和训练策略的改进,能够精准地捕获超声图像中的复杂局部细节和小目标,提高超声医学图像自动分割效果。 展开更多
关键词 超声图像分割 分割一切模型(sam) 级联解码 反事实提示生成 跨分支交互适配器
原文传递
基于SAM伪标签优化的半监督显著目标检测
9
作者 朱浩男 石艳娇 +1 位作者 张晴 崔柳 《计算机工程与设计》 北大核心 2025年第11期3258-3265,共8页
为了解决弱监督学习性能不足以及半监督学习在显著目标检测领域的系统性研究尚不充分的问题,提出了一种基于知识蒸馏的半监督显著目标检测算法。该算法在蒸馏过程中引入了分割万物模型,显著提升了教师模型的预测精度。训练阶段采用双分... 为了解决弱监督学习性能不足以及半监督学习在显著目标检测领域的系统性研究尚不充分的问题,提出了一种基于知识蒸馏的半监督显著目标检测算法。该算法在蒸馏过程中引入了分割万物模型,显著提升了教师模型的预测精度。训练阶段采用双分支边缘重建网络,并通过空间自适应归一化机制有效重建边缘特征,进一步优化显著目标的边界信息。在5个公共数据集上的大量实验结果表明,所提出的半监督学习方法不仅能够减小模型对监督信号的依赖,还展现出了优越的性能。 展开更多
关键词 显著目标检测 半监督学习 知识蒸馏 分割万物模型 双分支网络 边缘重建 空间自适应归一化
在线阅读 下载PDF
SAM特征引导的主动学习在缺陷检测中的应用
10
作者 马小川 付佳 +4 位作者 王李廷煜 曾志 王伟 彭倍 王国泰 《电子机械工程》 2025年第3期80-86,共7页
工业缺陷检测(Industrial Defect Detection,IDD)对确保产品质量和生产效率至关重要,但传统方法受限于人工标注的高成本和复杂缺陷模式的识别难题。主动学习通过挑选最有价值的样本进行标注,极大地降低了标注预算,但它仍面临冷启动的问... 工业缺陷检测(Industrial Defect Detection,IDD)对确保产品质量和生产效率至关重要,但传统方法受限于人工标注的高成本和复杂缺陷模式的识别难题。主动学习通过挑选最有价值的样本进行标注,极大地降低了标注预算,但它仍面临冷启动的问题。文中提出了一种基于“分割一切”模型(Segment Anything Model,SAM)生成的不确定性引导特征加权(SAM-based Uncertainty-guided Feature Weighting,SUGFW)的冷启动主动学习框架,实现低标注成本下的缺陷检测。该框架利用SAM的零样本分割能力,通过区域级不确定性评估和全局特征加权策略,挑选出非常具有代表性和多样性的样本子集进行标注,并采用结合聚类与不确定性信息的样本选择策略,以确保所选样本在特征空间和不确定性区间的均匀分布。在NEU-Seg热轧钢带表面缺陷检测数据集上的实验表明,该框架在3%、10%和20%的标注比例下,平均交并比(Intersection over Union,IoU)均优于现有先进方法至少4个百分点,仅需20%标注预算即可使IoU达到0.8423,接近全标注的0.8599。该框架显著降低了标注成本,为工业缺陷检测提供了高效、鲁棒的解决方案。 展开更多
关键词 工业缺陷检测 主动学习 冷启动 “分割一切”模型 样本挑选
在线阅读 下载PDF
基于NSGA-Ⅲ-SAM算法的冲压发动机喷管性能预测
11
作者 闵科 蔡泽君 +1 位作者 张加乐 朱呈祥 《航空学报》 北大核心 2025年第14期46-60,共15页
喷管的排气特性直接影响冲压发动机的整体工作性能,如何实现喷管性能的有效预测,预防其发生急剧变化对于发动机的稳定工作十分关键。在不同飞行条件下对三维非对称喷管进行了数值模拟,搭建了不同马赫数和落压比下的喷管性能预测数据集... 喷管的排气特性直接影响冲压发动机的整体工作性能,如何实现喷管性能的有效预测,预防其发生急剧变化对于发动机的稳定工作十分关键。在不同飞行条件下对三维非对称喷管进行了数值模拟,搭建了不同马赫数和落压比下的喷管性能预测数据集。考虑到传统多目标优化算法易陷入局部最优的不足,提出了一种模拟退火式变异优化的非支配排序遗传算法(Non-dominated Sorting Genetic Algorithm-Ⅲ-Simulated Annealing Mutation,NSGA-Ⅲ-SAM),用于提取喷管壁面的最优压力特征。通过以最优压力特征数据作为输入,轴向推力系数、俯仰力矩系数和升力系数作为输出,建立了基于一维卷积神经网络(One Dimension-Convolutional Neural Network,1D-CNN)的喷管性能参数预测模型,并利用马赫数4.5~6.0过膨胀状态数据对模型进行验证。结果表明,NSGA-Ⅲ-SAM算法所提取的最优压力位置能够使模型具备高精度、快速预测的性能,各性能参数平均绝对误差整体在0.5%范围内,最大绝对误差不超过0.8%,平均预测时间仅需0.6 ms左右。所构建的预测模型及方法能够为喷管性能监测及排气工况调节奠定可靠的技术基础。 展开更多
关键词 性能预测 三维非对称喷管 NSGA-Ⅲ-sam算法 壁面最优压力特征 1D-CNN模型
原文传递
结合SAM大模型和数学形态学的历史地图水系信息提取方法 被引量:3
12
作者 赵飞 李兆正 +6 位作者 甘泉 高祖瑜 王湛初 杜清运 王振声 沈洋 潘威 《测绘学报》 EI CSCD 北大核心 2024年第4期761-772,共12页
历史地图记载着丰富的历史地理信息,能够帮助了解历史规律,为当代发展提供借鉴。不同于现代地图、遥感影像等数据,历史地图保存时间久,存在留存数量少、图像精度低等问题,地图符号也与现代有所差异,因此信息难以被高效提取。针对该问题... 历史地图记载着丰富的历史地理信息,能够帮助了解历史规律,为当代发展提供借鉴。不同于现代地图、遥感影像等数据,历史地图保存时间久,存在留存数量少、图像精度低等问题,地图符号也与现代有所差异,因此信息难以被高效提取。针对该问题,本文以历史地图《宁夏省境黄河沿岸沟渠水道地形图》为试验数据,提出一种智能化历史地图水系信息提取方法。首先,结合符号句法,运用聚类与数学形态学方法构建数据集;然后,改进通用大模型(SAM)结构并进行迁移学习优化权重;最后,借助改进SAM自动提取历史地图水系信息。将试验结果与其他模型作对比,显示本文方法提取结果边界清晰,轮廓完整,准确率、精度等指标均为最高。同时,将提取结果与该区域水系现状作对比,发现历史上的河流沟渠如今大多改道、偏移或消失,湖泊面积大大减小。本文方法基于SAM通用大模型进行改进,验证了大模型在地图领域的可用性,为地图信息提取提供了思路。 展开更多
关键词 历史地图 水系提取 模糊C均值聚类 数学形态学 sam通用大模型
在线阅读 下载PDF
分割一切模型SAM的潜力与展望:综述 被引量:13
13
作者 王淼 黄智忠 +3 位作者 何晖光 卢湖川 单洪明 张军平 《中国图象图形学报》 CSCD 北大核心 2024年第6期1479-1509,共31页
随着基于对比文本—图像对的预训练(contrastive language-image pre-training,CLIP)方法或者模型、聊天生成预训练转换器(chat generative pre-trained Transformer,ChatGPT)、生成预训练转换器-4(generative pre-trained Transformer-... 随着基于对比文本—图像对的预训练(contrastive language-image pre-training,CLIP)方法或者模型、聊天生成预训练转换器(chat generative pre-trained Transformer,ChatGPT)、生成预训练转换器-4(generative pre-trained Transformer-4,GPT-4)等基础大模型的出现,通用人工智能(artificial general intelligence, AGI)的研究得到快速发展。AGI旨在为人工智能系统赋予更强大的执行能力,使其能够自主学习、不断进化,解决各种问题和处理不同的任务,从而在多个领域得到广泛应用。这些基础模型在大规模数据集上进行训练后,能够成功应对多样的下游任务。在这一背景下,Meta公司提出的分割一切模型(segment anything model,SAM)于2023年取得重要突破,在图像分割领域获得了优异的性能,以至于被称为图像分割终结者。其原因之一是,通过SAM数据引擎方法用三阶段采集的、包含1 100万图像和超过10亿掩码的分割一切—十亿(segment anything 1 billion,SA-1B)图像分割数据集,同时保证了掩码的品质和多样性,继续导致在分割领域的突破。在SAM开源后不久,科研人员提出了一系列改进的方法和应用。为了能全面深入了解分割一切模型的发展脉络、优势与不足,本文对SAM的研究进展进行了梳理和综述。首先,从基础模型、数据引擎和数据集等多个方面简要介绍了分割一切模型的背景和核心框架。在此基础上,本文详细梳理了目前分割一切模型的改进方法,包括提高推理速度和增进预测精度两个关键方向。然后,深入探讨分割一切模型在图像处理任务、视频相关任务以及其他领域中的广泛应用。这一部分详细介绍了模型在各种任务和数据类型上的卓越性能,突出其在多个领域的泛用性和发展潜力。最后,对分割一切模型未来的发展方向和潜在应用前景进行了深入分析和讨论。 展开更多
关键词 通用人工智能(AGI) 计算机视觉 图像分割 视觉基础模型 分割一切模型(sam) 大型语言模型(LLM)
原文传递
视觉大模型SAM在医学图像分割中的应用综述 被引量:9
14
作者 孙兴 蔡肖红 +2 位作者 李明 张帅 马金刚 《计算机工程与应用》 CSCD 北大核心 2024年第17期1-16,共16页
随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有... 随着大模型技术的不断发展,以分割一切模型(segment anything model,SAM)为代表的视觉大模型在图像分割领域取得重要突破。SAM通过提示驱动完成一系列下游分割任务,旨在统一解决所有的图像分割问题。因此,将SAM应用于医学图像分割具有重要意义,其泛化性能够适应多种医学图像,为医生提供更全面的解剖结构和病变信息。介绍了图像分割常用的数据集;对SAM的网络结构和泛化性进行细致阐述;重点对SAM应用在全切片成像、磁共振成像、计算机断层扫描、超声和多模态图像的五大类医学图像进行梳理分析,总结优缺点和相应的改进方法;结合当前医学图像分割领域中存在的实际问题,讨论并展望了SAM未来的发展方向。 展开更多
关键词 视觉大模型 分割一切模型(sam) 医学图像 图像分割
在线阅读 下载PDF
基于SAM&ImageJ图像处理的堆石混凝土坝层面露石率研究 被引量:3
15
作者 安宇 徐小蓉 +2 位作者 尹志刚 金峰 张喜喜 《水资源与水工程学报》 CSCD 北大核心 2024年第1期154-161,共8页
堆石混凝土坝层面的外露块石为上下层提供了重要的啮合作用,其投影面积比例是科学评价层间抗剪性能的重要指标。采用国际最新Meta AI模型segment anything model(SAM)对层面外露堆石进行自动图像分割,并基于ImageJ软件对SAM识别后的图... 堆石混凝土坝层面的外露块石为上下层提供了重要的啮合作用,其投影面积比例是科学评价层间抗剪性能的重要指标。采用国际最新Meta AI模型segment anything model(SAM)对层面外露堆石进行自动图像分割,并基于ImageJ软件对SAM识别后的图片进行再加工与图像计算,利用平滑、差分算法、中值滤波等方法精准标定外露堆石,二值化后计算得到层面露石率。结果表明:SAM图像预分割可识别约90%的外露堆石,经过ImageJ二次图像处理后可有效提高小粒径堆石的识别精度,对比手动标注结果误差在±3%以内。以贵州省两座水库的工程应用为例,对浇筑仓面进行分区预处理,结果发现靠近上游、中部、下游不同区域的露石率差别较大,计算得到的层面露石率以10%~30%居多,其中堆石入仓运输通道区域的露石率较低。研究内容与结论可为堆石混凝土结构层间界面抗剪力学性能和大坝蓄水安全稳定的研究提供参考与借鉴。 展开更多
关键词 堆石混凝土坝 segment anything model(sam) 图像处理技术 露石率 层间抗剪性能
在线阅读 下载PDF
基于SDP和改进SAM⁃MobileNetv2的滚动轴承故障诊断方法研究 被引量:3
16
作者 张天缘 孙虎儿 +1 位作者 朱继扬 赵扬 《机械强度》 CAS CSCD 北大核心 2024年第4期787-794,共8页
针对传统的滚动轴承故障诊断方法难以准确高效的实现故障分类,提出了一种融合对称点模式(Symmetrized Dot Pattern,SDP)和改进SAM⁃MobileNetv2的滚动轴承故障分类方法。首先,将轴承振动信号通过SDP算法转化为含有丰富特征信息的二维图... 针对传统的滚动轴承故障诊断方法难以准确高效的实现故障分类,提出了一种融合对称点模式(Symmetrized Dot Pattern,SDP)和改进SAM⁃MobileNetv2的滚动轴承故障分类方法。首先,将轴承振动信号通过SDP算法转化为含有丰富特征信息的二维图像。然后,将二维图像输入到改进SAM⁃MobileNetv2网络模型中,对故障特征信息进行提取和分类。在改进SAM⁃MobileNetv2网络中,使用自适应激活函数ACON(Activate or not)对SAM⁃MobileNetv2中的ReLU6激活函数进行替换,提高模型分类性能。最后,将本模型与多种网络模型做对比。试验结果表明,本模型可以准确高效地实现对滚动轴承故障的分类,使用凯斯西储大学轴承故障数据的准确率为99.5%,使用渥太华大学轴承故障数据的准确率为97.2%。 展开更多
关键词 滚动轴承 对称点模式 sam⁃MobileNetv2模型 故障诊断
在线阅读 下载PDF
结合SAM视觉分割模型与随机森林机器学习的无人机影像盐沼植被“精灵圈”提取
17
作者 周若彤 谭凯 +2 位作者 杨建儒 韩江涛 张卫国 《海洋学报》 CAS CSCD 北大核心 2024年第5期116-126,共11页
“精灵圈”是海岸带盐沼植被生态系统中的一种“空间自组织”结构,对盐沼湿地的生产力、稳定性和恢复力有重要影响。无人机影像是实现“精灵圈”空间位置高精度识别及解译其时空演化趋势与规律的重要数据源,但“精灵圈”像素与背景像素... “精灵圈”是海岸带盐沼植被生态系统中的一种“空间自组织”结构,对盐沼湿地的生产力、稳定性和恢复力有重要影响。无人机影像是实现“精灵圈”空间位置高精度识别及解译其时空演化趋势与规律的重要数据源,但“精灵圈”像素与背景像素在色彩信息和外形特征上差异较小,如何从二维影像中智能精准地识别“精灵圈”像素并对识别的单个像素形成个体“精灵圈”是目前的技术难点。本文提出了一种结合分割万物模型(Segment Anything Model,SAM)视觉分割模型与随机森林机器学习的无人机影像“精灵圈”分割及分类方法,实现了单个“精灵圈”的识别和提取。首先,通过构建索伦森-骰子系数(S?rensen-Dice coefficient,Dice)和交并比(Intersection over Union,IOU)评价指标,从SAM中筛选预训练模型并对其参数进行优化,实现全自动影像分割,得到无属性信息的分割掩码/分割类;然后,利用红、绿、蓝(RGB)三通道信息及空间二维坐标将分割掩码与原图像进行信息匹配,构造分割掩码的特征指标,并根据袋外数据(Out of Bag,OOB)误差减小及特征分布规律对特征进行分析和筛选;最后,利用筛选的特征对随机森林模型进行训练,实现“精灵圈”植被、普通植被和光滩的自动识别与分类。实验结果表明:本文方法“精灵圈”平均正确提取率96.1%,平均错误提取率为9.5%,为精准刻画“精灵圈”时空格局及海岸带无人机遥感图像处理提供了方法和技术支撑。 展开更多
关键词 盐沼植被 精灵圈 segment anything model(sam) 无人机影像 机器学习
在线阅读 下载PDF
基于SAM分割的交互式局部图像风格迁移方法研究 被引量:1
18
作者 尚金灿 张丽红 《测试技术学报》 2024年第3期298-307,共10页
针对目前局部图像风格迁移目标区域选择困难、迁移灵活性不足、容易出现内容泄露、前景与背景边缘过渡不自然等问题,提出一种基于任意分割模型(Segment Anything Model,SAM)的交互式局部图像风格迁移方法。首先利用SAM分割网络在用户输... 针对目前局部图像风格迁移目标区域选择困难、迁移灵活性不足、容易出现内容泄露、前景与背景边缘过渡不自然等问题,提出一种基于任意分割模型(Segment Anything Model,SAM)的交互式局部图像风格迁移方法。首先利用SAM分割网络在用户输入提示的指导下对输入的内容图像进行交互式目标迁移区域提取,对得到的有效对象掩码进行二值化处理,以二值化掩码提取全局风格化图像的目标区域作为前景、内容图像作为背景图像进行泊松融合,实现局部图像风格迁移。为了避免迁移过程中的内容泄露,全局风格迁移网络采用生成对抗网络架构,通过多级自适应注意力归一化模块进行风格特征转换,利用联合损失函数对网络进行综合训练。实验结果表明,设计的交互式局部图像风格迁移网络能够根据用户提示生成灵活可控的局部迁移结果,可以对图像中的任意物体进行风格迁移,迁移结果很好地保留了内容源图像中的内容结构,避免了内容泄露,且前景与背景边缘过渡更加自然。 展开更多
关键词 局部图像风格迁移 任意分割模型 全局风格迁移 泊松融合 自适应注意力归一化
在线阅读 下载PDF
基于SAM模型的西装领设计尺寸测量方法
19
作者 彭周艳 马玲 +2 位作者 苏慧敏 潘怡婷 邹奉元 《现代纺织技术》 北大核心 2024年第12期83-89,共7页
针对服装内部轮廓线对比度低、提取特征点和完整轮廓困难,导致图像内部尺寸难以测量的问题,提出一种基于SAM模型进行部件分割提取内部尺寸的方法。首先通过SAM模型分割西装领部件,然后将西装领部件近似多边形并利用LSD算法修正多边形,... 针对服装内部轮廓线对比度低、提取特征点和完整轮廓困难,导致图像内部尺寸难以测量的问题,提出一种基于SAM模型进行部件分割提取内部尺寸的方法。首先通过SAM模型分割西装领部件,然后将西装领部件近似多边形并利用LSD算法修正多边形,最后建立西装领结构模型并结合像素比例提取设计尺寸。结果表明:该方法可以从成衣图像中提取西装领款式结构图并输出相关数据,实验测量结果与测量软件相比尺寸的绝对误差在0.02~0.74 cm之间,角度的绝对误差在0.02°~0.27°之间;与实物测量相比,尺寸的绝对误差在0.05~1 cm之间,角度的绝对误差在0.06°~0.68°之间。该方法提取的西装领细部尺寸可为制版师提供数据参考。 展开更多
关键词 西装领 服装部件分割 sam模型 LSD算法 款式图提取 尺寸测量
在线阅读 下载PDF
煤矿井下顶板突水征兆视频智能识别方法研究
20
作者 连会青 康佳 +4 位作者 尹尚先 徐斌 闫国成 夏向学 徐保同 《煤矿安全》 北大核心 2025年第4期166-173,共8页
煤矿井下突水事故是煤矿灾害组成部分之一,而顶板突水征兆识别是预防突水事故发生的重要环节。然而,煤矿井下环境复杂多变,且目前突水征兆主要靠人工判断发现,由于井下恶劣环境及人为主观因素的影响,导致很难及时发现异常,致使顶板突水... 煤矿井下突水事故是煤矿灾害组成部分之一,而顶板突水征兆识别是预防突水事故发生的重要环节。然而,煤矿井下环境复杂多变,且目前突水征兆主要靠人工判断发现,由于井下恶劣环境及人为主观因素的影响,导致很难及时发现异常,致使顶板突水征兆的有效识别存在困难。为了高效监测与准确识别突水征兆,基于图像识别处理技术,提出了1种基于SAMXMem的自监督煤矿顶板突水征兆识别方法,其利用像素点变化率构建突水征兆预警体系,对煤矿井下突水易发区域采集到图像进行自监督标记,并通过SAM模型分割突水征兆区域,结合XMem长视频分割框架实现对该区域的实时动态跟踪。试验结果表明:相较于传统OTSU算法,基于SAM-XMem的自监督识别算法在交并比(IoU)、精确率(P)、召回率(R)及F1分数上均表现出一定差异性,该算法各项评估指标均达90%以上,较传统算法识别率提升20%;通过零样本分割技术,可以克服煤矿井下数据集短缺问题,相较于传统方法,特征提取能力更强,在背景噪声多、灰度值差异小等复杂条件下效果更优,适用于煤矿井下环境,具有更高的识别精度和更强的泛化能力。 展开更多
关键词 矿井水害 顶板突水 突水征兆 sam模型 图像分割技术
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部