期刊文献+
共找到1,914篇文章
< 1 2 96 >
每页显示 20 50 100
基于SAM2多任务学习的山区地块模糊边界提取 被引量:1
1
作者 黄启厅 凌玉荣 +6 位作者 谢国雪 杨绍锷 杨颖频 李海亮 梁存穗 何新洁 谢意 《南方农业学报》 北大核心 2025年第1期18-28,F0002,共12页
【目的】构建多任务模糊边界提取深度学习模型,解决模糊边界难提取及伪边界难消除的问题,为地块破碎地区的地块边界提取提供参考依据。【方法】以广西河池市宜州区为研究区,通过解译典型山区破碎遥感影像,建立模糊边界提取数据集,引入S... 【目的】构建多任务模糊边界提取深度学习模型,解决模糊边界难提取及伪边界难消除的问题,为地块破碎地区的地块边界提取提供参考依据。【方法】以广西河池市宜州区为研究区,通过解译典型山区破碎遥感影像,建立模糊边界提取数据集,引入SAM2视觉大模型及采用适配器Adapter微调优化其编码器,设计地块属性提取辅助任务,构建多任务模糊边界提取深度学习模型SAM2Xi,并通过对比试验证实该模型在山区地块破碎环境下的模糊边界提取效果。【结果】SAM2Xi模型在全局最佳阈值(ODS)和单图最佳阈值(OIS)上表现最佳,分别为0.663和0.672,显示出最高的边缘检测精度和适应性,但50%精度召回率(R50)略低于DexiNed模型。SAM2Xi模型结合语义信息与边缘特征,增强了模糊边界识别能力,在复杂场景下表现尤为出色;SAM2Xi模型在低对比度和复杂背景下仍然保持高精度,模糊边界区域的细节保留、连贯性和噪声抑制均优于其他模型;此外,SAM2Xi模型在伪边界清除任务中表现最佳,其先进特征提取和优化机制几乎完全消除了伪边界干扰,在各类场景下保持高精度边缘检测,具有更高的鲁棒性和准确性。SAM2Xi模型能成功提取研究区的地块信息(地块图斑数1587597个,总面积145696.646 ha),且提取的地块分布与实际情况高度吻合,具体表现为:(1)在大片耕地范围内可准确划分各地块;(2)可提取建筑物中的零星耕地或园地;(3)可提取林地中能被单独分割的地块(人工林),但自然林基本不会被误识。【结论】基于SAM2多任务学习构建的SAM2Xi模型实现了模糊边界识别与伪边界清除的双重突破,在复杂地形适应性、边界连贯性保持及噪声抑制方面具有明显优势,为我国西南山区复杂地形下地块边界提取及山区农业资源精准管理提供了技术支撑。 展开更多
关键词 地块边界提取 sam2 多任务学习 遥感影像 sam2Xi模型
在线阅读 下载PDF
光影智绘:基于SAM的视频阴影鲁棒抽取
2
作者 陈东 李昌隆 +2 位作者 杜振龙 宋爽 李晓丽 《图学学报》 北大核心 2025年第4期739-745,共7页
针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引... 针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引入XMem模型,结合感觉记忆、短时记忆和长时记忆联合前后帧信息,给出优化和稳定视频阴影检测结果。实验结果表明:在ViSha数据集的阴影实验结果与传统方法相比,该方法的均值绝对误差降低了约31.8%,交并比提升了约19.7%;定性和定量结果表明本方法不仅提升了视频阴影处理的准确率,并表现出较好的鲁棒性。 展开更多
关键词 阴影检测 语义分割 视频对象分割 sam XMem
在线阅读 下载PDF
SABM:一种蝴蝶生态图像分割的增强SAM模型
3
作者 谢娟英 兰翔 许升全 《陕西师范大学学报(自然科学版)》 北大核心 2025年第6期1-14,共14页
通过分割生态图像中蝴蝶获得蝴蝶掩码是基于生态图像的蝴蝶物种自动化识别的基础,因此研究蝴蝶生态图像分割有重要意义。然而,现有蝴蝶生态图像存在数据集样本量小、蝴蝶拟态、翅膀遮挡等问题,使现有深度网络难以训练出具有良好泛化能... 通过分割生态图像中蝴蝶获得蝴蝶掩码是基于生态图像的蝴蝶物种自动化识别的基础,因此研究蝴蝶生态图像分割有重要意义。然而,现有蝴蝶生态图像存在数据集样本量小、蝴蝶拟态、翅膀遮挡等问题,使现有深度网络难以训练出具有良好泛化能力的分割模型。为此,通过改进SAM(segment anything model)模型,提出一种鲁棒的蝴蝶生态图像分割新模型SABM(segment any butterfly model)。SABM模型通过引入双路卷积模块、蝴蝶词元(butterfly token)及一个3层MLP(multi-layer perceptron)使模型具有更好的特征学习能力。707张蝴蝶生态图像数据集的2折交叉验证实验表明,SABM模型对蝴蝶生态图像的分割能力超越了SAM及其现有的改进SOTA模型。7645张全新蝴蝶生态图像数据集的分割实验测试发现,SABM模型具有非常好的泛化性能,对7645张全新蝴蝶生态图像的蝴蝶实现了非常好的分割。该分割结果为未来的蝴蝶生态图像分割研究提供了10倍于现有数据的大数据集,为野外环境下的蝴蝶物种自动识别提供了更好的可用数据,也为测试聚类算法性能提供了富有挑战性的数据集。另外,还在医学图像数据测试了SABM模型的鲁棒性。 展开更多
关键词 蝴蝶分割 双路卷积 sam SABM 图像分割
在线阅读 下载PDF
基于大幅面SAM的遥感影像建筑物提取研究 被引量:1
4
作者 赫晓慧 吴凯旋 +2 位作者 李盼乐 乔梦佳 程淅杰 《时空信息学报》 2025年第2期148-157,共10页
主流语义分割方法多针对小尺寸影像,而遥感影像通常覆盖地表范围广,现有研究在处理遥感影像时普遍面临分块拼接误差导致的空间特征关联性丢失与计算效率低等挑战。因此,基于SAM(segmentanything model),本文提出一种大幅面SAM(large sca... 主流语义分割方法多针对小尺寸影像,而遥感影像通常覆盖地表范围广,现有研究在处理遥感影像时普遍面临分块拼接误差导致的空间特征关联性丢失与计算效率低等挑战。因此,基于SAM(segmentanything model),本文提出一种大幅面SAM(large scale SAM,LS-SAM)遥感影像建筑物提取方法。首先,构建异构特征编码器来融合卷积神经网络局部提取能力与SAM全局提取优势,通过全局和局部信息的融合有效解决SAM局部特征表达不足问题;其次,设计空间多尺度Adapt Former模块,以增强SAM的多尺度特征提取能力,使得能够学习不同尺度的特征来提高语义分割的准确性;为了减少遥感影像处理过程中出现的内存占用过多和检索分块拼接所带来的误差,设置动态训练策略;最后,基于公开数据集进行验证,并与已有方法进行比较评价。结果表明,本文方法在数据集IAILD的表现优秀,在两种随机裁剪尺寸情况下,平均交并比呈现最优和次优;其中,在1024个像素×1024个像素尺寸时,m Io U达到86.5%,相较于BuildFormer的82.38%、SAM的76.98%,分别提升了3.12%、9.52%。 展开更多
关键词 深度学习 建筑物提取 sam 位置编码生成器 CNN
在线阅读 下载PDF
基于Stone-SAM的便携式粗集料级配智能检测
5
作者 张鸿 杨俊雅 +2 位作者 刘可心 张益鹏 程雪聪 《建筑材料学报》 北大核心 2025年第6期581-590,共10页
为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学... 为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学表征算法,开发移动端应用程序,实现粗集料级配高通量检测。对5种粗集料级配场景进行测试。结果表明:本研究方法对于粗集料颗粒的分割精度高于原始SAM模型,并且能够精确去除背景信息,粗集料颗粒关键参数提取结果准确可靠。 展开更多
关键词 分割一切模型(sam) 粗集料级配 智能检测 移动端 工程检测
在线阅读 下载PDF
基于SAM模型进行牙槽窝CBCT测量的初步研究
6
作者 樊林峰 宋忠臣 +1 位作者 张楚南 艾松涛 《上海口腔医学》 2025年第4期433-439,共7页
目的:评估基于深度学习技术开发的锥形束CT(CBCT)图像上自动测量牙槽窝的工具,比较其与人工测量的准确性,验证其有效性和可行性。方法:纳入29例成年患者(男11例,女18例),平均年龄(31.31±13.77)岁。入组时均行CBCT检查,提取(5-5)牙... 目的:评估基于深度学习技术开发的锥形束CT(CBCT)图像上自动测量牙槽窝的工具,比较其与人工测量的准确性,验证其有效性和可行性。方法:纳入29例成年患者(男11例,女18例),平均年龄(31.31±13.77)岁。入组时均行CBCT检查,提取(5-5)牙位共427个横断面进行牙槽窝颊舌向骨量测量。开发一种新的基于SAM模型(Segment Anything Model)的交互式分割和测量工具,将其用于CBCT的牙槽窝尺寸评估。通过建立测试集和验证集,分别进行牙槽窝横断面颊舌侧骨量的人工测量和自动测量,并进行数据比较。结果:CBCT自动测量方法与人工测量之间具有显著的相关性和一致性,测试集回归分析的决定系数(R~2)为0.942,验证集测量误差主要集中在-0.43~0.47 mm之间,Pearson相关系数为0.9746(P<0.001)。结论:本研究通过深度学习,开发了一种基于SAM的CBCT的自动测量工具,准确性高,显著提高了牙槽窝测量的效率。 展开更多
关键词 sam 锥形束CT 横断面 牙槽窝 自动测量
原文传递
混合SAM改善钙钛矿太阳能电池空穴传输能力
7
作者 张琳 关雪峰 +2 位作者 方兴 林梦豪 林杰 《电子测量技术》 北大核心 2025年第16期132-141,共10页
针对反式钙钛矿太阳能电池中MeO-2PACz自组装单分子层因HOMO能级失配导致界面空穴传输势垒等问题,本研究提出一种混合SAM界面工程策略,通过将MeO-2PACz与偶极矩更大的Me-4PACz以特定比例复合,优化氧化镍空穴传输层的能级排列与缺陷钝化... 针对反式钙钛矿太阳能电池中MeO-2PACz自组装单分子层因HOMO能级失配导致界面空穴传输势垒等问题,本研究提出一种混合SAM界面工程策略,通过将MeO-2PACz与偶极矩更大的Me-4PACz以特定比例复合,优化氧化镍空穴传输层的能级排列与缺陷钝化能力。实验表明,当Me-4PACz体积占比为10%时,M-SAM/NiO_(x)复合层可显著提升界面电荷提取效率,并诱导钙钛矿薄膜形成致密晶体结构。基于此,所制备的p-i-n结构PSCs实现了1.079 V的开路电压、24.23 mA/cm^(2)的短路电流密度及0.79的填充因子,光电转换效率从18.7%提升至20.76%。 展开更多
关键词 MeO-2PACz 混合sam 钙钛矿太阳能电池
原文传递
基于SAM和pix2pix的商品数据集生成网络
8
作者 于惠钧 邹志豪 康帅 《电子技术应用》 2025年第4期23-28,共6页
针对商品包装快速变换带来的商品数据集采集和标注过程繁琐的问题,设计了一种基于SAM和pix2pix的商品数据集生成网络。该网络以单个商品多角度图像作为输入,生成与实际结算场景相近似的数据集。在RPC大型商品数据集上进行数据集生成,在Y... 针对商品包装快速变换带来的商品数据集采集和标注过程繁琐的问题,设计了一种基于SAM和pix2pix的商品数据集生成网络。该网络以单个商品多角度图像作为输入,生成与实际结算场景相近似的数据集。在RPC大型商品数据集上进行数据集生成,在YOLOv7、Fast R-CNN、AlexNet三种目标检测网络上验证生成数据集对目标检测效果的提升。实验结果表明,生成数据集融合到原数据集后用于训练模型能够有效提升商品识别准确率,并且与真实数据集相比具有较好的替代性。相较于原数据集,融合生成数据集三个网络上识别精度分别提升7.3%、4.9%、7.8%。通过该方法,显著提高了模型训练的效率与实用性,减轻传统商品数据集采集与标注所需的人力物力投入。 展开更多
关键词 商品识别 sam pix2pix 数据集生成
在线阅读 下载PDF
一种基于SAM改进的滑坡识别方法
9
作者 李娜 张文 +3 位作者 尹琪 牛晓栋 张笑瑛 潘新鑫 《物联网技术》 2025年第15期146-149,153,共5页
滑坡灾害是破坏力极大的自然灾害之一,高效、准确的滑坡识别方法对灾后应急救援与地质灾害的危险性评估具有非常重要的现实意义。针对滑坡遥感影像中常见的植被再覆盖与地表侵蚀导致的特征微弱与边界模糊问题,提出一种以SAM为基础且在... 滑坡灾害是破坏力极大的自然灾害之一,高效、准确的滑坡识别方法对灾后应急救援与地质灾害的危险性评估具有非常重要的现实意义。针对滑坡遥感影像中常见的植被再覆盖与地表侵蚀导致的特征微弱与边界模糊问题,提出一种以SAM为基础且在掩码解码器中融合CBAM的SAM-CANet滑坡识别方法。首先,利用图像编码器提取多层次特征;然后,掩码解码器通过融合CBAM注意力机制,自适应放大滑坡区域的微弱语义信号与高频细节。在毕节滑坡数据集上进行对比分析,结果表明:与主流算法(U-Net、DeepLab v3+、Mask2Former)相比,SAM-CANet模型的Dice系数达到0.8672、IoU值达到0.7737,在多组植被覆盖和边界模糊的影像测试中表现出更高的识别性能,为SAM模型在遥感领域的应用提供了新的思路和方法。 展开更多
关键词 滑坡识别 深度学习 CBAM注意力机制 sam 计算机视觉 语义分割
在线阅读 下载PDF
基于预训练SAM的提示式三维牙齿分割方法
10
作者 刘复昌 蔡煜晨 +1 位作者 缪永伟 范然 《浙江大学学报(理学版)》 北大核心 2025年第1期59-69,共11页
目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术... 目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术的方法。首先,在2022年国际医学图像计算和计算机辅助干预会议(MICCAI 2022)的三维牙齿公开数据集上微调模型。然后,将三维牙齿模型投影至多个二维视图,利用SAM网络进行图像分割。再将每个像素的标签映射回原始的三维三角形面片,完成三维牙齿分割。在该数据集中,测试了900个较理想的三维上下牙数据,取得了与主流技术相当的结果。对于缺牙、牙齿错位以及上下颚不完整的复杂情况,本文方法表现出显著优于现有技术的效果,展示了更强的泛化能力和稳定性。 展开更多
关键词 口腔正畸 三维牙齿分割 sam 图像分割
在线阅读 下载PDF
基于改进的SAM树冠轮廓分割
11
作者 方王俊 王山东 +1 位作者 郑帅锋 李佳云 《西北林学院学报》 北大核心 2025年第6期148-156,共9页
树冠信息的准确获取是树种分类的基本前提。针对分割一切模型(SAM)在可见光影像树冠轮廓提取时对树冠边界细节的分割不准确,存在漏分、错分等问题,设计了一种融合激光雷达三维点云数据的SAM影像树冠轮廓分割模型,以实现树冠轮廓的精细... 树冠信息的准确获取是树种分类的基本前提。针对分割一切模型(SAM)在可见光影像树冠轮廓提取时对树冠边界细节的分割不准确,存在漏分、错分等问题,设计了一种融合激光雷达三维点云数据的SAM影像树冠轮廓分割模型,以实现树冠轮廓的精细化提取。首先利用SAM分别提取可见光影像树冠轮廓和激光雷达三维点云树冠轮廓,并将合并后的树冠轮廓作为粗分割的结果。然后经过多向剖面分析、局部坐标系重定向、改进的K-means聚类等方法对树冠轮廓粗分割结果精细化。结果表明,改进后的SAM在郁闭度为80%的林区分割精度达到了86.35%,相对改进前的单影像SAM和单点云SAM分别提高了35.09%、51.75%,相对分水岭算法、SVM算法、多尺度分割算法分别提高了32.44%、16.12%、11.14%,能够很好地适应树冠轮廓在高郁闭度林区的分割任务。 展开更多
关键词 树冠轮廓分割 sam 可见光影像 激光雷达三维点云 数据融合
在线阅读 下载PDF
基于SAM图像处理的堆石料级配计算方法及验证
12
作者 张振伟 蔡可天 +3 位作者 高轩 贺一轩 王建 鲁洋 《水力发电》 2025年第2期80-86,共7页
堆石料级配检测是堆石坝施工过程中质量控制的重要环节,传统方法通常采用现场人工筛分法测量,存在检测样本少、效率低、干扰施工等问题。提出了一种基于图像处理的堆石料级配计算方法,采用国际最新Mata AI开源的通用图像分割大模型Segme... 堆石料级配检测是堆石坝施工过程中质量控制的重要环节,传统方法通常采用现场人工筛分法测量,存在检测样本少、效率低、干扰施工等问题。提出了一种基于图像处理的堆石料级配计算方法,采用国际最新Mata AI开源的通用图像分割大模型Segment Anything Model(SAM)对筑坝堆石料进行自动图像分割,提出堆石长宽比、面积比等堆石形态学几何参数用于提取堆石料图像中的堆石颗粒目标;同时,建立堆石形态数据库、堆石实例分割数据库,并分析参数取值和验证堆石图像级配计算方法的有效性;最后,试验验证结果表明该方法能够有效识别出图像中的堆石颗粒目标,实现级配曲线的智能识别,以及曲率、不均匀系数等级配指标的快速计算。该方法计算获得的级配与真实筛分法测的级配相关性可达0.94,平均绝对误差约5%,能够在堆石坝施工过程中有效辅助检测堆石料的颗粒级配信息,服务堆石坝的施工碾压质量控制。 展开更多
关键词 堆石料 级配 Segment Anything Model(sam) 图像识别 快速检测
在线阅读 下载PDF
具备高效CRISPR协同激活活性的HIEC6-dCas9-SAM稳转细胞株构建 被引量:1
13
作者 任柱平 杨泰然 +4 位作者 雷元三 金留飞 崔古贞 田益明 陈峥宏 《生物技术通报》 北大核心 2025年第5期52-61,共10页
【目的】以人正常肠道上皮细胞(HIEC6)为研究模型,建立具有高水平转录激活活性的HIEC6-dCas9-SAM单克隆细胞株,为利用CRISPR激活(CRISPRactivation,CRISPRa)系统筛选人类肠道疾病发生发展相关关键基因和探究分子致病机制提供细胞工具。... 【目的】以人正常肠道上皮细胞(HIEC6)为研究模型,建立具有高水平转录激活活性的HIEC6-dCas9-SAM单克隆细胞株,为利用CRISPR激活(CRISPRactivation,CRISPRa)系统筛选人类肠道疾病发生发展相关关键基因和探究分子致病机制提供细胞工具。【方法】首先利用PiggyBac转座子系统构建HIEC6-dCas9-SAM多克隆细胞;然后通过有限稀释法筛选单克隆细胞株,并使用免疫印迹、间接免疫荧光法鉴定单克隆细胞株中dCas9-SAM蛋白(dCas9、VP64、MS2、HSF1、p65)的表达情况;最后利用CRISPRa荧光报告系统和构建包装特定靶基因sgRNA慢病毒,检测所构建稳转株在转录和蛋白水平的CRISPR激活效率。【结果】成功获得两株HIEC6-dCas9-SAM单克隆细胞,两株细胞均能高水平稳定表达dCas9-SAM蛋白。CRISPRa荧光报告系统检测显示,两株HIEC6-dCas9-SAM稳转细胞的激活效率分别高达96.7%、99.0%。靶基因激活功能验证显示,在转录水平,两株HIEC6-dCas9-SAM稳转细胞中靶基因APN的转录激活水平分别高达2725倍和4521倍,SLC35A1基因的转录激活水平分别为27.5倍和18.1倍;在蛋白水平,APN蛋白的激活效率分别高于12.9倍和11.2倍,SLC35A1蛋白的激活效率分别为1.32倍和0.97倍。两株单克隆稳转细胞均表现出较高的转录激活活性。【结论】成功构建两株具有高水平CRISPR转录激活活性的HIEC6-dCas9-SAM单克隆稳转细胞,为后续基于CRISPRa系统筛选人类肠道疾病发生发展相关关键基因和探究分子致病机制提供了重要细胞工具。 展开更多
关键词 dCas9-sam HIEC6细胞 CRISPR激活 稳转细胞株
在线阅读 下载PDF
基于SAM的裂缝检测模型优化及其在大坝安全监测中的应用
14
作者 张雪琴 徐明希 +2 位作者 胡霓 陈璐莹 曾亚超 《中国科技信息》 2025年第20期87-89,共3页
1背景1.1研究背景近年来,随着深度学习的迅速发展,以卷积神经网络(CNN)为代表的语义分割模型逐渐被应用于裂缝检测领域,并取得了良好的效果,但仍普遍存在对大量标注数据依赖的问题,且在训练数据不足或不同场景泛化时表现不足的情况。为... 1背景1.1研究背景近年来,随着深度学习的迅速发展,以卷积神经网络(CNN)为代表的语义分割模型逐渐被应用于裂缝检测领域,并取得了良好的效果,但仍普遍存在对大量标注数据依赖的问题,且在训练数据不足或不同场景泛化时表现不足的情况。为克服这一局限,Meta公司近期提出了“分割万物模型”(Segment Anything Model,SAM),该模型通过在大规模图像数据上预训练,具有极强的泛化能力,能够快速适配各种细分应用场景。因此,如何有效地结合SAM这一大规模预训练模型,在数据量有限的裂缝检测任务中实现高精度和高泛化能力,成为当前研究的热点和趋势。 展开更多
关键词 裂缝检测 深度学习 sam 卷积神经网络 大坝安全监测
在线阅读 下载PDF
基于YOLO11与SAM分割模型协同的木材端面分割方法
15
作者 曾子荣 张小波 《中国科技信息》 2025年第21期45-47,共3页
0背景木材加工是林业产业链的核心环节,其质量检测直接影响产品附加值与资源利用率。传统人工检测方法存在效率低、主观性强等问题,而基于深度学习的计算机视觉技术为木材端面分割提供了新思路。现有研究多采用单一目标检测模型(如YOLO... 0背景木材加工是林业产业链的核心环节,其质量检测直接影响产品附加值与资源利用率。传统人工检测方法存在效率低、主观性强等问题,而基于深度学习的计算机视觉技术为木材端面分割提供了新思路。现有研究多采用单一目标检测模型(如YOLO系列)或实例分割模型(如Mask R-CNN),这些模型虽能实现木材粗分割,但在复杂纹理、遮挡场景下仍面临小区域漏检、边界模糊等挑战。 展开更多
关键词 sam分割模型 深度学习 YOLO11 计算机视觉 木材端面分割
在线阅读 下载PDF
基于SAM-AlexNet的跨视角步态周期分类算法研究
16
作者 罗子昂 吴钦木 《智能计算机与应用》 2025年第10期181-187,共7页
步态识别技术随着生物特征识别技术的发展受到越来越多的关注,步态周期检测技术是步态识别系统中的一个重要环节。针对步态周期分类易出错、准确率低等问题,本文提出了一种基于SAM-AlexNet的跨视角步态周期分类模型。首先,使用双三次插... 步态识别技术随着生物特征识别技术的发展受到越来越多的关注,步态周期检测技术是步态识别系统中的一个重要环节。针对步态周期分类易出错、准确率低等问题,本文提出了一种基于SAM-AlexNet的跨视角步态周期分类模型。首先,使用双三次插值和非局部均值滤波对步态轮廓图像进行预处理;然后,使用Sobel算子提取人体边缘特征,并将其与原始图像进行融合,模型能够更好地捕捉到步态轮廓的关键信息。其次,引入了空间注意力模块(Spatial Attention Mechanism,SAM),使模型能够更加聚焦于对分类任务更为关键的区域,进一步提升了模型的性能。实验结果表明,该优化模型在CASIA-B数据集的不同视角下行人步态周期三分类任务上取得了较好的性能,准确率达到93%。与AlexNet基础模型相比提高近5%。因此,本文所提出的模型能够有效地提高步态周期的分类能力。 展开更多
关键词 步态周期分类 AlexNet 空间注意力模块(sam) 步态识别
在线阅读 下载PDF
基于SAM的球团图像粒度识别算法
17
作者 马伟宁 杨磊 +2 位作者 李杰 张遵乾 张玉柱 《烧结球团》 北大核心 2025年第2期54-62,86,共10页
球团粒度是衡量球团质量的重要标准之一,粒度的识别是提高球团合格率和调控造球参数的重要依据。本文针对造球过程中存在球团粒度不能准确反馈和依赖人工经验的问题,提出了一种基于SAM的机器视觉粒度识别算法。该方法采用OTSU自动生成... 球团粒度是衡量球团质量的重要标准之一,粒度的识别是提高球团合格率和调控造球参数的重要依据。本文针对造球过程中存在球团粒度不能准确反馈和依赖人工经验的问题,提出了一种基于SAM的机器视觉粒度识别算法。该方法采用OTSU自动生成提示点,根据提示点寻优移动策略做二次优化;将提示点输入到SAM预测每个球团的分割掩膜,对预测掩膜过滤和修复后提取单个球团的轮廓;根据损失函数判别分割得到球团的完整度,自适应选取最小二乘法或最小外接圆拟合球团轮廓得到球团的粒度。试验结果表明:在熟球稀疏分布和粘连分布中的识别率达到100%,在重叠分布中的识别率可达96%以上;在造球过程中生球识别率可达80%。同现有算法模型相比,该模型在球团粒度识别上稳定性、精确性更强,应用场景更广泛。因此,基于SAM的球团图像粒度识别算法能够准确识别球团的粒度信息,模型具有良好的泛化性能,为提高球团工艺的智能化水平提供了一种行之有效的手段。 展开更多
关键词 球团 图象 粒度识别 sam 分割 智能
原文传递
微调SAM的遥感图像高效语义分割模型DP-SAM
18
作者 刘思涌 赵毅力 《中国图象图形学报》 北大核心 2025年第8期2884-2896,共13页
目的SAM(segment anything model)已经成为自然图像零样本分割的一个大模型基准。由于遥感图像的复杂性和场景多变性,且SAM是一个需要提示信息的分割模型,直接将这个“基础宏观模型”应用于遥感图像会导致过分割以及需要大量手动输入提... 目的SAM(segment anything model)已经成为自然图像零样本分割的一个大模型基准。由于遥感图像的复杂性和场景多变性,且SAM是一个需要提示信息的分割模型,直接将这个“基础宏观模型”应用于遥感图像会导致过分割以及需要大量手动输入提示的问题。针对上述问题,提出一种通过微调将SAM用于遥感图像语义分割的高效方法。方法首先,保留原生SAM的图像编码器模块但对其训练参数进行微调,并且引入一条新的卷积神经网络(convolutional neural network,CNN)编码器路径。其次,在解码器中采用一种经过微调的无提示方法,消除了将SAM应用于图像分割需要输入提示的问题。通过CNN和Transformer两条路径分别输出两个独立的预测掩码,并根据这两个掩码获得分割的结果。这种具有两条路径且经过精细微调的模型名为DP-SAM(dual path segment anything model)。结果使用两个经过标注的遥感图像数据集Potsdam和Vaihingen对DP-SAM进行评估,并通过消融性实验对如何根据两条解码器路径的输出生成预测掩码的方法进行讨论。实验结果表明,DP-SAM能对遥感图像进行高效语义分割,平均交并比mIoU和F1分数在Potsdam数据集上达到86.2%和92.7%,在Vaihingen数据集上达到85.9%和92.4%。结论所提方法具有良好的性能,实现了将大模型应用于遥感领域语义分割场景,该方法性能优于所对比的其他基于深度学习和微调SAM的方法。本工作的源代码可在https://github.com/Jacky-Android/DP-SAM获取。 展开更多
关键词 分割一切模型(sam) 零样本 遥感图像语义分割 图像编码器 无提示 掩膜解码器
原文传递
结合反事实提示与级联解码SAM的超声图像分割
19
作者 霍一儒 封筠 +2 位作者 刘娜 史屹琛 殷梦莹 《中国图象图形学报》 北大核心 2025年第5期1303-1317,共15页
目的分割一切模型(segment anything model,SAM)在自然图像分割领域已取得显著成就,但应用于医学成像尤其是涉及对比度低、边界模糊和形状复杂的超声图像时,分割过程往往需要人工干预,并且会出现分割性能下降情况。针对上述问题,提出一... 目的分割一切模型(segment anything model,SAM)在自然图像分割领域已取得显著成就,但应用于医学成像尤其是涉及对比度低、边界模糊和形状复杂的超声图像时,分割过程往往需要人工干预,并且会出现分割性能下降情况。针对上述问题,提出一种结合反事实提示与级联解码SAM的改进方法(SAM combined wihongth counterfactual prompt and cascaded decoder,SAMCD)。方法SAMCD在SAM的基础上增加旁路卷积神经网络(convolutional renual network,CNN)图像编码器、跨分支交互适配器、提示生成器和级联解码器。通过使用旁路CNN图像编码器以及跨分支交互适配器,补充ViT(vision Transformer)编码器缺乏的局部信息,以提高模型对细节的捕捉能力;引入反事实干预机制,通过生成反事实提示,迫使模型专注于事实提示生成,提高模型分割精度;采用级联解码器获得丰富的边缘信息,即先利用SAM的原始解码器创建先验掩码,再使用加入边界注意力的Transformer解码器和像素解码器;在训练模型时采用两阶段的训练策略,即交互分割模型训练阶段和自动分割模型训练阶段。结果在TN3K(thyroid nodule 3K)和BUSI(breast ultrasound image)数据集上进行实验,SAMCD的DSC(Dice similarity coefficient)值分别达到83.66%和84.29%,较SAMCT提升0.73%和0.90%,且较对比的SAM及其变体模型更为轻量化;相较于9种先进方法,SAMCD在DSC、mIoU(mean intersection over union)、HD(Hausdorff distance)、敏感性和特异性指标上均达到最优。消融实验和可视化分析表明提出的SAMCD方法具有明显的提升效果。结论本文提出的超声医学图像分割SAMCD方法在充分利用SAM强大的特征表达能力的基础上,通过对编码器、提示生成器、解码器和训练策略的改进,能够精准地捕获超声图像中的复杂局部细节和小目标,提高超声医学图像自动分割效果。 展开更多
关键词 超声图像分割 分割一切模型(sam) 级联解码 反事实提示生成 跨分支交互适配器
原文传递
一种改进的SAM-ShuffleNet明青花龙纹断代模型
20
作者 赵谦 屈佳伟 《现代电子技术》 北大核心 2025年第9期116-123,共8页
青花瓷作为瓷器中的明珠,其独特的纹饰承载着深厚的文化底蕴。在众多青花瓷纹饰中,明代龙纹颇具代表性,对明代前、中、后三期的青花瓷龙纹进行断代识别有着极高的历史文化研究价值。文中针对明代龙纹断代问题提出一种改进的深度学习模型... 青花瓷作为瓷器中的明珠,其独特的纹饰承载着深厚的文化底蕴。在众多青花瓷纹饰中,明代龙纹颇具代表性,对明代前、中、后三期的青花瓷龙纹进行断代识别有着极高的历史文化研究价值。文中针对明代龙纹断代问题提出一种改进的深度学习模型,该模型引入空间注意力机制(SAM)改进原网络ShuffleNetV2,能够捕获图像中的长距离依赖关系,用于增强模型的表达能力,并利用迁移学习策略、交叉熵损失函数和RMSProp自适应学习率优化器在青花瓷龙纹数据集上进行实验验证,用于准确年代鉴定。实验表明,在迭代100次、批次大小为16、学习率为0.001以及权重衰减为10-5的条件下,明代前、中、后期断代总体准确率为95.67%,召回率为95%,F1-Score为95%。与VGG16、ResNet18等8个模型对比,所提模型在识别准确率上显著提高,运算速度约是ResNet18的4.9倍,是VGG16的5.9倍,这证明该模型不仅实现了明代青花瓷龙纹的精确断代,还具备快速识别、体积紧凑的特点,为文化遗产保护和鉴定提供了新的技术方法。 展开更多
关键词 龙纹断代 深度学习 ShuffleNet 空间注意力机制 RMSProp 迁移学习策略
在线阅读 下载PDF
上一页 1 2 96 下一页 到第
使用帮助 返回顶部