期刊文献+
共找到909,308篇文章
< 1 2 250 >
每页显示 20 50 100
A medical image segmentation model based on SAM with an integrated local multi-scale feature encoder
1
作者 DI Jing ZHU Yunlong LIANG Chan 《Journal of Measurement Science and Instrumentation》 2025年第3期359-370,共12页
Despite its remarkable performance on natural images,the segment anything model(SAM)lacks domain-specific information in medical imaging.and faces the challenge of losing local multi-scale information in the encoding ... Despite its remarkable performance on natural images,the segment anything model(SAM)lacks domain-specific information in medical imaging.and faces the challenge of losing local multi-scale information in the encoding phase.This paper presents a medical image segmentation model based on SAM with a local multi-scale feature encoder(LMSFE-SAM)to address the issues above.Firstly,based on the SAM,a local multi-scale feature encoder is introduced to improve the representation of features within local receptive field,thereby supplying the Vision Transformer(ViT)branch in SAM with enriched local multi-scale contextual information.At the same time,a multiaxial Hadamard product module(MHPM)is incorporated into the local multi-scale feature encoder in a lightweight manner to reduce the quadratic complexity and noise interference.Subsequently,a cross-branch balancing adapter is designed to balance the local and global information between the local multi-scale feature encoder and the ViT encoder in SAM.Finally,to obtain smaller input image size and to mitigate overlapping in patch embeddings,the size of the input image is reduced from 1024×1024 pixels to 256×256 pixels,and a multidimensional information adaptation component is developed,which includes feature adapters,position adapters,and channel-spatial adapters.This component effectively integrates the information from small-sized medical images into SAM,enhancing its suitability for clinical deployment.The proposed model demonstrates an average enhancement ranging from 0.0387 to 0.3191 across six objective evaluation metrics on BUSI,DDTI,and TN3K datasets compared to eight other representative image segmentation models.This significantly enhances the performance of the SAM on medical images,providing clinicians with a powerful tool in clinical diagnosis. 展开更多
关键词 segment anything model(sam) medical image segmentation ENCODER decoder multiaxial Hadamard product module(MHPM) cross-branch balancing adapter
在线阅读 下载PDF
Virtual sample diffusion generation method guided by large language model-generated knowledge for enhancing information completeness and zero-shot fault diagnosis in building thermal systems
2
作者 Zhe SUN Qiwei YAO +7 位作者 Ling SHI Huaqiang JIN Yingjie XU Peng YANG Han XIAO Dongyu CHEN Panpan ZHAO Xi SHEN 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 2025年第10期895-916,共22页
In the era of big data,data-driven technologies are increasingly leveraged by industry to facilitate autonomous learning and intelligent decision-making.However,the challenge of“small samples in big data”emerges whe... In the era of big data,data-driven technologies are increasingly leveraged by industry to facilitate autonomous learning and intelligent decision-making.However,the challenge of“small samples in big data”emerges when datasets lack the comprehensive information necessary for addressing complex scenarios,which hampers adaptability.Thus,enhancing data completeness is essential.Knowledge-guided virtual sample generation transforms domain knowledge into extensive virtual datasets,thereby reducing dependence on limited real samples and enabling zero-sample fault diagnosis.This study used building air conditioning systems as a case study.We innovatively used the large language model(LLM)to acquire domain knowledge for sample generation,significantly lowering knowledge acquisition costs and establishing a generalized framework for knowledge acquisition in engineering applications.This acquired knowledge guided the design of diffusion boundaries in mega-trend diffusion(MTD),while the Monte Carlo method was used to sample within the diffusion function to create information-rich virtual samples.Additionally,a noise-adding technique was introduced to enhance the information entropy of these samples,thereby improving the robustness of neural networks trained with them.Experimental results showed that training the diagnostic model exclusively with virtual samples achieved an accuracy of 72.80%,significantly surpassing traditional small-sample supervised learning in terms of generalization.This underscores the quality and completeness of the generated virtual samples. 展开更多
关键词 Information completeness Large language models(LLMs) Virtual sample generation Knowledge-guided Building air conditioning systems
原文传递
Diff-IDS:A Network Intrusion Detection Model Based on Diffusion Model for Imbalanced Data Samples
3
作者 Yue Yang Xiangyan Tang +3 位作者 Zhaowu Liu Jieren Cheng Haozhe Fang Cunyi Zhang 《Computers, Materials & Continua》 2025年第3期4389-4408,共20页
With the rapid development of Internet of Things technology,the sharp increase in network devices and their inherent security vulnerabilities present a stark contrast,bringing unprecedented challenges to the field of ... With the rapid development of Internet of Things technology,the sharp increase in network devices and their inherent security vulnerabilities present a stark contrast,bringing unprecedented challenges to the field of network security,especially in identifying malicious attacks.However,due to the uneven distribution of network traffic data,particularly the imbalance between attack traffic and normal traffic,as well as the imbalance between minority class attacks and majority class attacks,traditional machine learning detection algorithms have significant limitations when dealing with sparse network traffic data.To effectively tackle this challenge,we have designed a lightweight intrusion detection model based on diffusion mechanisms,named Diff-IDS,with the core objective of enhancing the model’s efficiency in parsing complex network traffic features,thereby significantly improving its detection speed and training efficiency.The model begins by finely filtering network traffic features and converting them into grayscale images,while also employing image-flipping techniques for data augmentation.Subsequently,these preprocessed images are fed into a diffusion model based on the Unet architecture for training.Once the model is trained,we fix the weights of the Unet network and propose a feature enhancement algorithm based on feature masking to further boost the model’s expressiveness.Finally,we devise an end-to-end lightweight detection strategy to streamline the model,enabling efficient lightweight detection of imbalanced samples.Our method has been subjected to multiple experimental tests on renowned network intrusion detection benchmarks,including CICIDS 2017,KDD 99,and NSL-KDD.The experimental results indicate that Diff-IDS leads in terms of detection accuracy,training efficiency,and lightweight metrics compared to the current state-of-the-art models,demonstrating exceptional detection capabilities and robustness. 展开更多
关键词 Network traffic feature enhancement diffusion model multi-classification Algorithm 2(continued)13:end for 14:Return y
在线阅读 下载PDF
基于Stone-SAM的便携式粗集料级配智能检测
4
作者 张鸿 杨俊雅 +2 位作者 刘可心 张益鹏 程雪聪 《建筑材料学报》 北大核心 2025年第6期581-590,共10页
为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学... 为实现精确的粗集料级配检测,提出了一种便携式粗集料级配智能检测方法。采用知识蒸馏的策略对视觉大模型——分割一切模型(SAM)进行网络结构轻量化,嵌入神经网络分类器PP-HGNetV2为模型提供语义判断的能力,设计粗集料颗粒特征参数数学表征算法,开发移动端应用程序,实现粗集料级配高通量检测。对5种粗集料级配场景进行测试。结果表明:本研究方法对于粗集料颗粒的分割精度高于原始SAM模型,并且能够精确去除背景信息,粗集料颗粒关键参数提取结果准确可靠。 展开更多
关键词 分割一切模型(sam) 粗集料级配 智能检测 移动端 工程检测
在线阅读 下载PDF
光影智绘:基于SAM的视频阴影鲁棒抽取
5
作者 陈东 李昌隆 +2 位作者 杜振龙 宋爽 李晓丽 《图学学报》 北大核心 2025年第4期739-745,共7页
针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引... 针对传统方法对于光照变化和物体遮挡引起复杂的、动态变化阴影处理易致阴影检测的准确率和鲁棒性较低问题,提出了一种基于分割万物模型(SAM)的视频阴影检测方法,对SAM解码器进行微调,使其更适合阴影检测;利用SAM提取关键帧阴影区域,引入XMem模型,结合感觉记忆、短时记忆和长时记忆联合前后帧信息,给出优化和稳定视频阴影检测结果。实验结果表明:在ViSha数据集的阴影实验结果与传统方法相比,该方法的均值绝对误差降低了约31.8%,交并比提升了约19.7%;定性和定量结果表明本方法不仅提升了视频阴影处理的准确率,并表现出较好的鲁棒性。 展开更多
关键词 阴影检测 语义分割 视频对象分割 sam XMem
在线阅读 下载PDF
SABM:一种蝴蝶生态图像分割的增强SAM模型
6
作者 谢娟英 兰翔 许升全 《陕西师范大学学报(自然科学版)》 北大核心 2025年第6期1-14,共14页
通过分割生态图像中蝴蝶获得蝴蝶掩码是基于生态图像的蝴蝶物种自动化识别的基础,因此研究蝴蝶生态图像分割有重要意义。然而,现有蝴蝶生态图像存在数据集样本量小、蝴蝶拟态、翅膀遮挡等问题,使现有深度网络难以训练出具有良好泛化能... 通过分割生态图像中蝴蝶获得蝴蝶掩码是基于生态图像的蝴蝶物种自动化识别的基础,因此研究蝴蝶生态图像分割有重要意义。然而,现有蝴蝶生态图像存在数据集样本量小、蝴蝶拟态、翅膀遮挡等问题,使现有深度网络难以训练出具有良好泛化能力的分割模型。为此,通过改进SAM(segment anything model)模型,提出一种鲁棒的蝴蝶生态图像分割新模型SABM(segment any butterfly model)。SABM模型通过引入双路卷积模块、蝴蝶词元(butterfly token)及一个3层MLP(multi-layer perceptron)使模型具有更好的特征学习能力。707张蝴蝶生态图像数据集的2折交叉验证实验表明,SABM模型对蝴蝶生态图像的分割能力超越了SAM及其现有的改进SOTA模型。7645张全新蝴蝶生态图像数据集的分割实验测试发现,SABM模型具有非常好的泛化性能,对7645张全新蝴蝶生态图像的蝴蝶实现了非常好的分割。该分割结果为未来的蝴蝶生态图像分割研究提供了10倍于现有数据的大数据集,为野外环境下的蝴蝶物种自动识别提供了更好的可用数据,也为测试聚类算法性能提供了富有挑战性的数据集。另外,还在医学图像数据测试了SABM模型的鲁棒性。 展开更多
关键词 蝴蝶分割 双路卷积 sam SABM 图像分割
在线阅读 下载PDF
基于大幅面SAM的遥感影像建筑物提取研究 被引量:1
7
作者 赫晓慧 吴凯旋 +2 位作者 李盼乐 乔梦佳 程淅杰 《时空信息学报》 2025年第2期148-157,共10页
主流语义分割方法多针对小尺寸影像,而遥感影像通常覆盖地表范围广,现有研究在处理遥感影像时普遍面临分块拼接误差导致的空间特征关联性丢失与计算效率低等挑战。因此,基于SAM(segmentanything model),本文提出一种大幅面SAM(large sca... 主流语义分割方法多针对小尺寸影像,而遥感影像通常覆盖地表范围广,现有研究在处理遥感影像时普遍面临分块拼接误差导致的空间特征关联性丢失与计算效率低等挑战。因此,基于SAM(segmentanything model),本文提出一种大幅面SAM(large scale SAM,LS-SAM)遥感影像建筑物提取方法。首先,构建异构特征编码器来融合卷积神经网络局部提取能力与SAM全局提取优势,通过全局和局部信息的融合有效解决SAM局部特征表达不足问题;其次,设计空间多尺度Adapt Former模块,以增强SAM的多尺度特征提取能力,使得能够学习不同尺度的特征来提高语义分割的准确性;为了减少遥感影像处理过程中出现的内存占用过多和检索分块拼接所带来的误差,设置动态训练策略;最后,基于公开数据集进行验证,并与已有方法进行比较评价。结果表明,本文方法在数据集IAILD的表现优秀,在两种随机裁剪尺寸情况下,平均交并比呈现最优和次优;其中,在1024个像素×1024个像素尺寸时,m Io U达到86.5%,相较于BuildFormer的82.38%、SAM的76.98%,分别提升了3.12%、9.52%。 展开更多
关键词 深度学习 建筑物提取 sam 位置编码生成器 CNN
在线阅读 下载PDF
基于SAM模型进行牙槽窝CBCT测量的初步研究
8
作者 樊林峰 宋忠臣 +1 位作者 张楚南 艾松涛 《上海口腔医学》 2025年第4期433-439,共7页
目的:评估基于深度学习技术开发的锥形束CT(CBCT)图像上自动测量牙槽窝的工具,比较其与人工测量的准确性,验证其有效性和可行性。方法:纳入29例成年患者(男11例,女18例),平均年龄(31.31±13.77)岁。入组时均行CBCT检查,提取(5-5)牙... 目的:评估基于深度学习技术开发的锥形束CT(CBCT)图像上自动测量牙槽窝的工具,比较其与人工测量的准确性,验证其有效性和可行性。方法:纳入29例成年患者(男11例,女18例),平均年龄(31.31±13.77)岁。入组时均行CBCT检查,提取(5-5)牙位共427个横断面进行牙槽窝颊舌向骨量测量。开发一种新的基于SAM模型(Segment Anything Model)的交互式分割和测量工具,将其用于CBCT的牙槽窝尺寸评估。通过建立测试集和验证集,分别进行牙槽窝横断面颊舌侧骨量的人工测量和自动测量,并进行数据比较。结果:CBCT自动测量方法与人工测量之间具有显著的相关性和一致性,测试集回归分析的决定系数(R~2)为0.942,验证集测量误差主要集中在-0.43~0.47 mm之间,Pearson相关系数为0.9746(P<0.001)。结论:本研究通过深度学习,开发了一种基于SAM的CBCT的自动测量工具,准确性高,显著提高了牙槽窝测量的效率。 展开更多
关键词 sam 锥形束CT 横断面 牙槽窝 自动测量
原文传递
混合SAM改善钙钛矿太阳能电池空穴传输能力
9
作者 张琳 关雪峰 +2 位作者 方兴 林梦豪 林杰 《电子测量技术》 北大核心 2025年第16期132-141,共10页
针对反式钙钛矿太阳能电池中MeO-2PACz自组装单分子层因HOMO能级失配导致界面空穴传输势垒等问题,本研究提出一种混合SAM界面工程策略,通过将MeO-2PACz与偶极矩更大的Me-4PACz以特定比例复合,优化氧化镍空穴传输层的能级排列与缺陷钝化... 针对反式钙钛矿太阳能电池中MeO-2PACz自组装单分子层因HOMO能级失配导致界面空穴传输势垒等问题,本研究提出一种混合SAM界面工程策略,通过将MeO-2PACz与偶极矩更大的Me-4PACz以特定比例复合,优化氧化镍空穴传输层的能级排列与缺陷钝化能力。实验表明,当Me-4PACz体积占比为10%时,M-SAM/NiO_(x)复合层可显著提升界面电荷提取效率,并诱导钙钛矿薄膜形成致密晶体结构。基于此,所制备的p-i-n结构PSCs实现了1.079 V的开路电压、24.23 mA/cm^(2)的短路电流密度及0.79的填充因子,光电转换效率从18.7%提升至20.76%。 展开更多
关键词 MeO-2PACz 混合sam 钙钛矿太阳能电池
原文传递
基于SAM和pix2pix的商品数据集生成网络
10
作者 于惠钧 邹志豪 康帅 《电子技术应用》 2025年第4期23-28,共6页
针对商品包装快速变换带来的商品数据集采集和标注过程繁琐的问题,设计了一种基于SAM和pix2pix的商品数据集生成网络。该网络以单个商品多角度图像作为输入,生成与实际结算场景相近似的数据集。在RPC大型商品数据集上进行数据集生成,在Y... 针对商品包装快速变换带来的商品数据集采集和标注过程繁琐的问题,设计了一种基于SAM和pix2pix的商品数据集生成网络。该网络以单个商品多角度图像作为输入,生成与实际结算场景相近似的数据集。在RPC大型商品数据集上进行数据集生成,在YOLOv7、Fast R-CNN、AlexNet三种目标检测网络上验证生成数据集对目标检测效果的提升。实验结果表明,生成数据集融合到原数据集后用于训练模型能够有效提升商品识别准确率,并且与真实数据集相比具有较好的替代性。相较于原数据集,融合生成数据集三个网络上识别精度分别提升7.3%、4.9%、7.8%。通过该方法,显著提高了模型训练的效率与实用性,减轻传统商品数据集采集与标注所需的人力物力投入。 展开更多
关键词 商品识别 sam pix2pix 数据集生成
在线阅读 下载PDF
基于Hybrid Model的浙江省太阳总辐射估算及其时空分布特征
11
作者 顾婷婷 潘娅英 张加易 《气象科学》 2025年第2期176-181,共6页
利用浙江省两个辐射站的观测资料,对地表太阳辐射模型Hybrid Model在浙江省的适用性进行评估分析。在此基础上,利用Hybrid Model重建浙江省71个站点1971—2020年的地表太阳辐射日数据集,并分析其时空变化特征。结果表明:Hybrid Model模... 利用浙江省两个辐射站的观测资料,对地表太阳辐射模型Hybrid Model在浙江省的适用性进行评估分析。在此基础上,利用Hybrid Model重建浙江省71个站点1971—2020年的地表太阳辐射日数据集,并分析其时空变化特征。结果表明:Hybrid Model模拟效果良好,和A-P模型计算结果进行对比,杭州站的平均误差、均方根误差、平均绝对百分比误差分别为2.01 MJ·m^(-2)、2.69 MJ·m^(-2)和18.02%,而洪家站的平均误差、均方根误差、平均绝对百分比误差分别为1.41 MJ·m^(-2)、1.85 MJ·m^(-2)和11.56%,误差均低于A-P模型,且Hybrid Model在各月模拟的误差波动较小。浙江省近50 a平均地表总辐射在3733~5060 MJ·m^(-2),高值区主要位于浙北平原及滨海岛屿地区。1971—2020年浙江省太阳总辐射呈明显减少的趋势,气候倾向率为-72 MJ·m^(-2)·(10 a)^(-1),并在1980s初和2000年中期发生了突变减少。 展开更多
关键词 Hybrid model 太阳总辐射 误差分析 时空分布
在线阅读 下载PDF
一种改进的SAM-ShuffleNet明青花龙纹断代模型
12
作者 赵谦 屈佳伟 《现代电子技术》 北大核心 2025年第9期116-123,共8页
青花瓷作为瓷器中的明珠,其独特的纹饰承载着深厚的文化底蕴。在众多青花瓷纹饰中,明代龙纹颇具代表性,对明代前、中、后三期的青花瓷龙纹进行断代识别有着极高的历史文化研究价值。文中针对明代龙纹断代问题提出一种改进的深度学习模型... 青花瓷作为瓷器中的明珠,其独特的纹饰承载着深厚的文化底蕴。在众多青花瓷纹饰中,明代龙纹颇具代表性,对明代前、中、后三期的青花瓷龙纹进行断代识别有着极高的历史文化研究价值。文中针对明代龙纹断代问题提出一种改进的深度学习模型,该模型引入空间注意力机制(SAM)改进原网络ShuffleNetV2,能够捕获图像中的长距离依赖关系,用于增强模型的表达能力,并利用迁移学习策略、交叉熵损失函数和RMSProp自适应学习率优化器在青花瓷龙纹数据集上进行实验验证,用于准确年代鉴定。实验表明,在迭代100次、批次大小为16、学习率为0.001以及权重衰减为10-5的条件下,明代前、中、后期断代总体准确率为95.67%,召回率为95%,F1-Score为95%。与VGG16、ResNet18等8个模型对比,所提模型在识别准确率上显著提高,运算速度约是ResNet18的4.9倍,是VGG16的5.9倍,这证明该模型不仅实现了明代青花瓷龙纹的精确断代,还具备快速识别、体积紧凑的特点,为文化遗产保护和鉴定提供了新的技术方法。 展开更多
关键词 龙纹断代 深度学习 ShuffleNet 空间注意力机制 RMSProp 迁移学习策略
在线阅读 下载PDF
基于SAM2多任务学习的山区地块模糊边界提取 被引量:1
13
作者 黄启厅 凌玉荣 +6 位作者 谢国雪 杨绍锷 杨颖频 李海亮 梁存穗 何新洁 谢意 《南方农业学报》 北大核心 2025年第1期18-28,F0002,共12页
【目的】构建多任务模糊边界提取深度学习模型,解决模糊边界难提取及伪边界难消除的问题,为地块破碎地区的地块边界提取提供参考依据。【方法】以广西河池市宜州区为研究区,通过解译典型山区破碎遥感影像,建立模糊边界提取数据集,引入S... 【目的】构建多任务模糊边界提取深度学习模型,解决模糊边界难提取及伪边界难消除的问题,为地块破碎地区的地块边界提取提供参考依据。【方法】以广西河池市宜州区为研究区,通过解译典型山区破碎遥感影像,建立模糊边界提取数据集,引入SAM2视觉大模型及采用适配器Adapter微调优化其编码器,设计地块属性提取辅助任务,构建多任务模糊边界提取深度学习模型SAM2Xi,并通过对比试验证实该模型在山区地块破碎环境下的模糊边界提取效果。【结果】SAM2Xi模型在全局最佳阈值(ODS)和单图最佳阈值(OIS)上表现最佳,分别为0.663和0.672,显示出最高的边缘检测精度和适应性,但50%精度召回率(R50)略低于DexiNed模型。SAM2Xi模型结合语义信息与边缘特征,增强了模糊边界识别能力,在复杂场景下表现尤为出色;SAM2Xi模型在低对比度和复杂背景下仍然保持高精度,模糊边界区域的细节保留、连贯性和噪声抑制均优于其他模型;此外,SAM2Xi模型在伪边界清除任务中表现最佳,其先进特征提取和优化机制几乎完全消除了伪边界干扰,在各类场景下保持高精度边缘检测,具有更高的鲁棒性和准确性。SAM2Xi模型能成功提取研究区的地块信息(地块图斑数1587597个,总面积145696.646 ha),且提取的地块分布与实际情况高度吻合,具体表现为:(1)在大片耕地范围内可准确划分各地块;(2)可提取建筑物中的零星耕地或园地;(3)可提取林地中能被单独分割的地块(人工林),但自然林基本不会被误识。【结论】基于SAM2多任务学习构建的SAM2Xi模型实现了模糊边界识别与伪边界清除的双重突破,在复杂地形适应性、边界连贯性保持及噪声抑制方面具有明显优势,为我国西南山区复杂地形下地块边界提取及山区农业资源精准管理提供了技术支撑。 展开更多
关键词 地块边界提取 sam2 多任务学习 遥感影像 sam2Xi模型
在线阅读 下载PDF
一种基于SAM改进的滑坡识别方法
14
作者 李娜 张文 +3 位作者 尹琪 牛晓栋 张笑瑛 潘新鑫 《物联网技术》 2025年第15期146-149,153,共5页
滑坡灾害是破坏力极大的自然灾害之一,高效、准确的滑坡识别方法对灾后应急救援与地质灾害的危险性评估具有非常重要的现实意义。针对滑坡遥感影像中常见的植被再覆盖与地表侵蚀导致的特征微弱与边界模糊问题,提出一种以SAM为基础且在... 滑坡灾害是破坏力极大的自然灾害之一,高效、准确的滑坡识别方法对灾后应急救援与地质灾害的危险性评估具有非常重要的现实意义。针对滑坡遥感影像中常见的植被再覆盖与地表侵蚀导致的特征微弱与边界模糊问题,提出一种以SAM为基础且在掩码解码器中融合CBAM的SAM-CANet滑坡识别方法。首先,利用图像编码器提取多层次特征;然后,掩码解码器通过融合CBAM注意力机制,自适应放大滑坡区域的微弱语义信号与高频细节。在毕节滑坡数据集上进行对比分析,结果表明:与主流算法(U-Net、DeepLab v3+、Mask2Former)相比,SAM-CANet模型的Dice系数达到0.8672、IoU值达到0.7737,在多组植被覆盖和边界模糊的影像测试中表现出更高的识别性能,为SAM模型在遥感领域的应用提供了新的思路和方法。 展开更多
关键词 滑坡识别 深度学习 CBAM注意力机制 sam 计算机视觉 语义分割
在线阅读 下载PDF
轻量级微调SAM的结肠息肉分割方法SAMCP
15
作者 刘娜 封筠 +2 位作者 霍一儒 王弘扬 杨柳 《计算机应用》 北大核心 2025年第10期3390-3398,共9页
在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像... 在胃肠道内窥镜图像处理中,精准分割结肠息肉具有重要的临床意义。传统分割方法常因细节捕捉不足和对大规模数据的依赖,在应对复杂形态的息肉时表现不佳。尽管分割一切模型(SAM)在自然图像分割中取得显著进展,但由于自然图像与医学图像存在域差异,现有的SAM方法在结肠息肉分割任务上仍难以取得理想效果。为解决这一问题,基于SAM架构提出一种轻量级微调结肠息肉分割方法(SAMCP)。该方法引入精简适配器模块,重点关注通道维度信息,采用Dice和交并比(IoU)简化联合损失函数,并在训练时冻结原始图像编码器和提示编码器的参数,以低训练成本提升结肠息肉分割性能。在3个公开数据集上与9种先进方法的对比实验结果表明,相较于SAM方法,SAMCP在Kvasir-SEG数据集上的Dice和IoU值分别提高了56.7%和84.5%,在CVC-ClinicDB数据集上的Dice和IoU值分别提高了46.0%和86.0%,在CVC-ColonDB数据集上的Dice和IoU值分别提高了95.3%和122.2%,超过目前SAM-based类方法的最佳性能。在引入点提示的情况下,即使只使用1次点击,SAMCP仍能优于其他SAM-based方法。以上验证了SAMCP在处理复杂形状和局部细节时表现出色,可为医生提供更精确的分割指导。 展开更多
关键词 结肠息肉分割 分割一切模型 适配器 损失函数 轻量级微调
在线阅读 下载PDF
基于SAM图像处理的堆石料级配计算方法及验证
16
作者 张振伟 蔡可天 +3 位作者 高轩 贺一轩 王建 鲁洋 《水力发电》 2025年第2期80-86,共7页
堆石料级配检测是堆石坝施工过程中质量控制的重要环节,传统方法通常采用现场人工筛分法测量,存在检测样本少、效率低、干扰施工等问题。提出了一种基于图像处理的堆石料级配计算方法,采用国际最新Mata AI开源的通用图像分割大模型Segme... 堆石料级配检测是堆石坝施工过程中质量控制的重要环节,传统方法通常采用现场人工筛分法测量,存在检测样本少、效率低、干扰施工等问题。提出了一种基于图像处理的堆石料级配计算方法,采用国际最新Mata AI开源的通用图像分割大模型Segment Anything Model(SAM)对筑坝堆石料进行自动图像分割,提出堆石长宽比、面积比等堆石形态学几何参数用于提取堆石料图像中的堆石颗粒目标;同时,建立堆石形态数据库、堆石实例分割数据库,并分析参数取值和验证堆石图像级配计算方法的有效性;最后,试验验证结果表明该方法能够有效识别出图像中的堆石颗粒目标,实现级配曲线的智能识别,以及曲率、不均匀系数等级配指标的快速计算。该方法计算获得的级配与真实筛分法测的级配相关性可达0.94,平均绝对误差约5%,能够在堆石坝施工过程中有效辅助检测堆石料的颗粒级配信息,服务堆石坝的施工碾压质量控制。 展开更多
关键词 堆石料 级配 Segment Anything model(sam) 图像识别 快速检测
在线阅读 下载PDF
基于MSC-LSAM的多尺度交叉超声医学图像分割方法
17
作者 王朝欣 杨汶汶 +3 位作者 戎泽 李铮昱 王行 马磊 《数据采集与处理》 北大核心 2025年第2期469-484,共16页
脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割... 脑卒中是全球范围内致死致残率最高的疾病之一,颈动脉狭窄和心脏病变是缺血性脑卒中的重要致病因素。超声(Ultrasound,US)是检查由颈动脉狭窄和心脏病变引起的缺血性脑卒中的常用影像学手段,但超声图像噪声多、边界模糊,具有较高的分割难度。本文提出MSC⁃LSAM算法,一种多尺度交叉的双编码器超声图像分割网络,旨在实现颈动脉腔体和心脏腔体的快速、准确分割,辅助医生完成疾病诊断。MSC⁃LSAM在编码器部分并行了分割一切模型(Segment anything model,SAM)的视觉编码器和UNet编码器,在解码器部分采用UNet解码器。本研究首先冻结了预训练的SAM视觉编码器,并在Transformer层中引入高效的适配器(Adapter)块,被称可学习的分割一切模型(Learnable SAM,LSAM)。LSAM在拥有较低参数量的同时,保留学习能力和高度泛化性。然后,在UNet全局网络引入多尺度交叉注意力(Multi⁃scale cross⁃axial attention,MCA),实现多尺度特征的交叉融合,有效提升边缘分割能力,抑制模型过拟合。最后,通过高效通道注意力(Efficient channel attention,ECA)实现双编码器多尺度特征的高效融合,减少模型误分割。结果表明,本研究提出的MSC⁃LSAM在心脏超声公开数据集CAMUS和颈动脉超声自建数据集CAUS上均取得了良好的效果。CAMUS的两心腔(2CH)和四心腔(4CH)数据集分割的平均Dice相似系数(Dice similarity coefficient,DSC)分别达到0.927和0.934;CAUS数据集的平均DSC达到0.917。MSC⁃LSAM在颈动脉腔体和心脏腔体超声图像分割任务上获得了良好的分割准确度,高于主流分割算法,具有良好的应用前景。 展开更多
关键词 缺血性脑卒中 超声图像分割 分割一切模型 多尺度交叉注意力 高效通道注意力
在线阅读 下载PDF
Predictive modeling for postoperative delirium in elderly patients with abdominal malignancies using synthetic minority oversampling technique 被引量:4
18
作者 Wen-Jing Hu Gang Bai +6 位作者 Yan Wang Dong-Mei Hong Jin-Hua Jiang Jia-Xun Li Yin Hua Xin-Yu Wang Ying Chen 《World Journal of Gastrointestinal Oncology》 SCIE 2024年第4期1227-1235,共9页
BACKGROUND Postoperative delirium,particularly prevalent in elderly patients after abdominal cancer surgery,presents significant challenges in clinical management.AIM To develop a synthetic minority oversampling techn... BACKGROUND Postoperative delirium,particularly prevalent in elderly patients after abdominal cancer surgery,presents significant challenges in clinical management.AIM To develop a synthetic minority oversampling technique(SMOTE)-based model for predicting postoperative delirium in elderly abdominal cancer patients.METHODS In this retrospective cohort study,we analyzed data from 611 elderly patients who underwent abdominal malignant tumor surgery at our hospital between September 2020 and October 2022.The incidence of postoperative delirium was recorded for 7 d post-surgery.Patients were divided into delirium and non-delirium groups based on the occurrence of postoperative delirium or not.A multivariate logistic regression model was used to identify risk factors and develop a predictive model for postoperative delirium.The SMOTE technique was applied to enhance the model by oversampling the delirium cases.The model’s predictive accuracy was then validated.RESULTS In our study involving 611 elderly patients with abdominal malignant tumors,multivariate logistic regression analysis identified significant risk factors for postoperative delirium.These included the Charlson comorbidity index,American Society of Anesthesiologists classification,history of cerebrovascular disease,surgical duration,perioperative blood transfusion,and postoperative pain score.The incidence rate of postoperative delirium in our study was 22.91%.The original predictive model(P1)exhibited an area under the receiver operating characteristic curve of 0.862.In comparison,the SMOTE-based logistic early warning model(P2),which utilized the SMOTE oversampling algorithm,showed a slightly lower but comparable area under the curve of 0.856,suggesting no significant difference in performance between the two predictive approaches.CONCLUSION This study confirms that the SMOTE-enhanced predictive model for postoperative delirium in elderly abdominal tumor patients shows performance equivalent to that of traditional methods,effectively addressing data imbalance. 展开更多
关键词 Elderly patients Abdominal cancer Postoperative delirium Synthetic minority oversampling technique Predictive modeling Surgical outcomes
暂未订购
基于24Model的动火作业事故致因文本挖掘 被引量:1
19
作者 牛茂辉 李威君 +1 位作者 刘音 王璐 《中国安全科学学报》 北大核心 2025年第3期151-158,共8页
为探究工业动火作业事故的根源,提出一种基于“2-4”模型(24Model)的文本挖掘方法。首先,收集整理220篇动火作业事故报告,并作为数据集,构建基于来自变换器的双向编码器表征量(BERT)的24Model分类器,使用预训练模型训练和评估事故报告... 为探究工业动火作业事故的根源,提出一种基于“2-4”模型(24Model)的文本挖掘方法。首先,收集整理220篇动火作业事故报告,并作为数据集,构建基于来自变换器的双向编码器表征量(BERT)的24Model分类器,使用预训练模型训练和评估事故报告数据集,构建分类模型;然后,通过基于BERT的关键字提取算法(KeyBERT)和词频-逆文档频率(TF-IDF)算法的组合权重,结合24Model框架,建立动火作业事故文本关键词指标体系;最后,通过文本挖掘关键词之间的网络共现关系,分析得到事故致因之间的相互关联。结果显示,基于BERT的24Model分类器模型能够系统准确地判定动火作业事故致因类别,通过组合权重筛选得到4个层级关键词指标体系,其中安全管理体系的权重最大,结合共现网络分析得到动火作业事故的7项关键致因。 展开更多
关键词 “2-4”模型(24model) 动火作业 事故致因 文本挖掘 指标体系
原文传递
基于预训练SAM的提示式三维牙齿分割方法
20
作者 刘复昌 蔡煜晨 +1 位作者 缪永伟 范然 《浙江大学学报(理学版)》 北大核心 2025年第1期59-69,共11页
目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术... 目前,大多研究采用有监督学习方法在牙齿的三维数据上训练网络,完成分割任务,但在处理缺牙、严重错位或颌部不完整的牙齿时效果不佳,泛化能力较弱。为此,提出了一种基于预训练分割一切模型(segment anything model,SAM)和提示分割技术的方法。首先,在2022年国际医学图像计算和计算机辅助干预会议(MICCAI 2022)的三维牙齿公开数据集上微调模型。然后,将三维牙齿模型投影至多个二维视图,利用SAM网络进行图像分割。再将每个像素的标签映射回原始的三维三角形面片,完成三维牙齿分割。在该数据集中,测试了900个较理想的三维上下牙数据,取得了与主流技术相当的结果。对于缺牙、牙齿错位以及上下颚不完整的复杂情况,本文方法表现出显著优于现有技术的效果,展示了更强的泛化能力和稳定性。 展开更多
关键词 口腔正畸 三维牙齿分割 sam 图像分割
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部