期刊文献+
共找到485篇文章
< 1 2 25 >
每页显示 20 50 100
优化ViT用于黑色素瘤分类:特征筛选与InfoNCE损失的结合
1
作者 黄金杰 马媛雪 《光学精密工程》 北大核心 2025年第16期2649-2660,共12页
针对Vision Transformer(ViT)在黑色素瘤图像分类中存在的特征冗余和泛化能力不足问题,提出一种融合动态特征筛选与对比学习的改进模型,以提升分类精度与临床诊断效率。首先,设计动态特征筛选模块,通过可学习的权重矩阵自适应强化关键... 针对Vision Transformer(ViT)在黑色素瘤图像分类中存在的特征冗余和泛化能力不足问题,提出一种融合动态特征筛选与对比学习的改进模型,以提升分类精度与临床诊断效率。首先,设计动态特征筛选模块,通过可学习的权重矩阵自适应强化关键特征并抑制冗余信息;其次,引入InfoNCE对比损失函数,联合交叉熵损失构建多目标优化框架,增强类间特征区分度;最后,在多头自注意力机制中嵌入关键特征引导机制,实现局部细节与全局语义的协同建模。在ISIC2018和ISIC2019数据集上的实验结果表明:改进模型分类准确率分别达到83.27%和80.17%,较基线ViT模型提升1.83%和0.49%;消融实验验证动态筛选模块减少18.7%冗余计算量,对比学习使类内特征相似度提升23.6%。所提方法显著提高了ViT模型对黑色素瘤的识别能力,分类精度与鲁棒性优于主流模型,为皮肤癌早期诊断提供了高精度、低冗余的自动化解决方案,具有一定的临床实用价值。 展开更多
关键词 图像分类 特征筛选 InfoNCE损失函数 vit模型
在线阅读 下载PDF
视觉Transformer(ViT)发展综述 被引量:8
2
作者 李玉洁 马子航 +2 位作者 王艺甫 王星河 谭本英 《计算机科学》 北大核心 2025年第1期194-209,共16页
视觉Transformer(Vision Transformer,ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域。近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对... 视觉Transformer(Vision Transformer,ViT)是基于编码器-解码器结构的Transformer改进模型,已经被成功应用于计算机视觉领域。近几年基于ViT的研究层出不穷且效果显著,基于该模型的工作已经成为计算机视觉任务的重要研究方向,因此针对近年来ViT的发展进行概述。首先,简要回顾了ViT的基本原理及迁移过程,并分析了ViT模型的结构特点和优势;然后,根据各ViT变体模型的改进特点,归纳和梳理了基于ViT的主要骨干网络变体改进方向及其代表性改进模型,包括局部性改进、结构改进、自监督、轻量化及效率改进等改进方向,并对其进行分析比较;最后,讨论了当前ViT及其改进模型仍存在的不足,对ViT未来的研究方向进行了展望。可以作为研究人员进行基于ViT骨干网络的研究时选择深度学习相关方法的一个权衡和参考。 展开更多
关键词 计算机视觉 模式识别 Vision Transformer(vit) 深度学习 自注意力
在线阅读 下载PDF
基于ViT-B深度学习模型的口腔良恶性病变图像分类研究 被引量:1
3
作者 崔宇琛 谢元栋 +3 位作者 吴聿淼 牛凌霄 常路广达 朱宪春 《口腔医学研究》 北大核心 2025年第1期16-20,共5页
目的:基于深度学习算法,对ViT-B模型检测口腔良性和恶性病变图像的性能进行分析,旨在为临床医生早期发现和准确诊断口腔癌提供有效工具。方法:使用包含口腔良性和恶性病变图像的公共数据集,对数据进行预处理和数据增强,按7∶2∶1的比例... 目的:基于深度学习算法,对ViT-B模型检测口腔良性和恶性病变图像的性能进行分析,旨在为临床医生早期发现和准确诊断口腔癌提供有效工具。方法:使用包含口腔良性和恶性病变图像的公共数据集,对数据进行预处理和数据增强,按7∶2∶1的比例将数据随机划分为训练集、验证集和测试集。选取ViT-B、VGG16、ResNet101、DenseNet121和EfficientNetV25种深度学习模型,对模型进行训练和性能比较。通过外部数据对ViT-B模型的泛化能力进行评估,并基于注意力权重的可视化方法对ViT-B模型进行分析。结果:ViT-B在5种模型中分类性能最佳,受试者工作特征曲线下面积为0.9715,准确率为91.00%。该模型可以有效区分口腔良性和恶性病变图像,具有较强的泛化能力和临床实用性。结论:ViT-B模型在口腔良性和恶性病变图像识别中表现良好,可以为口腔癌的早期发现和准确诊断提供支持。 展开更多
关键词 口腔癌 口腔病变 深度学习 vit-B
在线阅读 下载PDF
基于VITS的高性能歌声转换模型 被引量:1
4
作者 周柯汝 金伟 《现代信息科技》 2025年第12期129-133,140,共6页
歌声转换是将源歌唱者的声音转换为目标歌唱者的声音,但保留原有的内容和旋律。随着科技的发展,各种网络结构和模型相继提出,歌声转换的算法也变得多样化,但难免都会出现转换音频质量差、失真率高、音域缺失等问题。文章提出以高保真流... 歌声转换是将源歌唱者的声音转换为目标歌唱者的声音,但保留原有的内容和旋律。随着科技的发展,各种网络结构和模型相继提出,歌声转换的算法也变得多样化,但难免都会出现转换音频质量差、失真率高、音域缺失等问题。文章提出以高保真流为基础的多解耦特征约束的UVC(Ultra Singing Voice Conversion)模型,该模型以VIT模型为基础,通过结合ContentVec编码器和NSF-HIFI-GAN声码器,改进模型的输入和输出,极大地提高了转换音频的质量和流畅性,并具有较强的鲁棒性。 展开更多
关键词 歌声转换 vitS ContentVec编码器 NSF-HIFI-GAN声码器
在线阅读 下载PDF
融合Mobile Vit和倒置门控编解码的视网膜血管分割算法 被引量:1
5
作者 梁礼明 阳渊 +2 位作者 朱晨锟 何安军 吴健 《北京航空航天大学学报》 北大核心 2025年第3期712-723,共12页
针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域... 针对视网膜血管分割时存在背景噪声干扰、边界纹理模糊和微细血管提取难等问题,提出一种融合Mobile Vit和倒置门控编解码的视网膜血管分割算法(FMVG-Net)。改进Mobile Vit模块,在编码部分实现双联合特征提取;利用多谱注意力模块,从频域维度减少图像特征信息缺失,精确分割血管前景像素;提出特征自适应融合模块,建立血管纹理上下文依赖关系,提高血管分割灵敏度;优化编解码结构,设计倒置门控编解码模块,进一步捕获空间信息与深层语义信息,提高视网膜血管图像分割精度。在公共数据集DRIVE、STARE和CHASE_DB1上对所提算法进行实验,特异性分别为0.9863、0.9897和0.9873,准确度分别为0.9709、0.9754和0.9760,敏感度分别为0.8109、0.8010和0.8079。仿真实验证明,所提网络对视网膜血管分割具有较好的分割效果,为眼科疾病的诊断提供了新窗口。 展开更多
关键词 视网膜血管 Mobile vit模块 离散余弦变换 倒置门控编解码模块 特征自适应融合
原文传递
基于VIT网络的复合材料栓接结构挤压极限快速预测方法研究
6
作者 任宇 刘禹铭 +2 位作者 林清源 赵勇 程辉 《上海航天(中英文)》 2025年第2期121-134,共14页
针对复合材料栓接结构(CBJ)多源装配要素耦合作用下挤压极限预测难题及传统数值模拟效率低下等问题,提出一种基于Vision Transformer(VIT)框架的挤压极限快速预测方法。通过融合装配过程中几何形变参数与物理性能参数,构建多源装配参数... 针对复合材料栓接结构(CBJ)多源装配要素耦合作用下挤压极限预测难题及传统数值模拟效率低下等问题,提出一种基于Vision Transformer(VIT)框架的挤压极限快速预测方法。通过融合装配过程中几何形变参数与物理性能参数,构建多源装配参数空间与挤压极限的非线性映射模型。首先,针对复材栓接结构装配过程的几何参量和性能参量进行分析与建模;其次,创新开发基于VIT架构的CBJ-VIT深度学习网络,采用多头自注意力机制实现多模态装配数据特征融合;最后,以航天薄壁结构复合材料栓接装配体为研究对象进行了实例验证。实验表明:CBJ-VIT模型预测结果与有限元分析结果高度一致,单次预测耗时从传统数值模拟的12.0 h降至8.1 s。在定性和定量评价中,该模型相较传统非图像数据处理方法预测精度提升85.02%,较非VIT架构模型精度提高76.24%。 展开更多
关键词 复合材料 栓接结构 多源因素耦合 形性融合 Vision Transformer(vit)
在线阅读 下载PDF
基于Wave-ViT的改进多通道深度残差网络的电能质量扰动分类
7
作者 刘大鹏 罗嘉宾 +3 位作者 刘勇 穆勇 董彪 张淑清 《计量学报》 北大核心 2025年第5期629-637,共9页
提出一种基于小波变换视觉自注意力(Wave-ViT)模型的改进多通道深度残差网络的电能质量扰动分类方法。首先将一维时间序列电能质量扰动(PQDs)信号作为通道一的输入;再将一维PQDs信号通过格拉姆角场(GAF)映射成为二维图像作为通道二的输... 提出一种基于小波变换视觉自注意力(Wave-ViT)模型的改进多通道深度残差网络的电能质量扰动分类方法。首先将一维时间序列电能质量扰动(PQDs)信号作为通道一的输入;再将一维PQDs信号通过格拉姆角场(GAF)映射成为二维图像作为通道二的输入;利用Wave-ViT模块深层挖掘二维GAF图像信息,并作为通道三的输入。接着分别对3个通道进行深层次的特征提取,构造适用于PQDs分类的多通道网络框架。通过消融实验,证实多通道对网络收敛速度和分类精度有互补作用。进一步的噪声实验和对比试验表明该方法特征提取能力强,所需迭代次数少,且抗噪性能好,对16种扰动在随机噪声和无噪声环境下的识别率分别能达到99.81%和99.19%,为电能质量扰动识别提供了一种新的思路。 展开更多
关键词 电磁计量 电能质量扰动 Wave-vit 深度残差网络 消融实验 噪声实验 扰动识别
在线阅读 下载PDF
基于ViT-KANs的双头通信网络协议数据类别概念漂移检测分类算法
8
作者 王润泽 张效义 +2 位作者 李青 任俊康 陈奕凡 《信息工程大学学报》 2025年第5期520-527,共8页
针对网络协议数据中的类别概念漂移问题,提出一种ViT-KANs的双头通信网络数据协议类别概念漂移检测分类算法。该算法通过集成Vision Transformer(ViT)的全局感知能力与Kol⁃mogorov-Arnold Networks(KANs)的灵活函数逼近能力,构建高效的... 针对网络协议数据中的类别概念漂移问题,提出一种ViT-KANs的双头通信网络数据协议类别概念漂移检测分类算法。该算法通过集成Vision Transformer(ViT)的全局感知能力与Kol⁃mogorov-Arnold Networks(KANs)的灵活函数逼近能力,构建高效的特征提取网络;并采用双头并行输出结构,分别处理旧类数据的分类与类别概念漂移的检测。此外,进一步利用验证集数据自适应计算置信度阈值,有效缓解训练阶段概念漂移样本缺失的问题。在Moore数据集、加拿大网络安全研究所2017年入侵检测评估数据集(CICIDS2017)和加拿大网络安全研究所对知识发现与数据挖掘竞赛数据集的改进版(NSL-KDD)3个数据集上的实验表明,所提方法较基线模型及分布外检测方法显著降低了检测错误率,同时保持优越的分类精度。 展开更多
关键词 类别概念漂移 vit-KANs模型 双头网络 置信度阈值 网络协议数据
在线阅读 下载PDF
具有VIT-VWA结构域的蛋白对衣藻纤毛长度和细胞大小的调控
9
作者 任雅慧 徐嘉 潘俊敏 《中国细胞生物学学报》 2025年第8期1785-1794,共10页
VIT-VWA结构域蛋白在多种生物过程中发挥关键作用,但其在纤毛长度及细胞大小调控中的功能仍不明确。该研究以莱茵衣藻(Chlamydomonas reinhardtii)为模型,通过同源序列比对和系统发育分析,鉴定出两个具有VIT-VWA结构域的蛋白FBB6L1和FBB... VIT-VWA结构域蛋白在多种生物过程中发挥关键作用,但其在纤毛长度及细胞大小调控中的功能仍不明确。该研究以莱茵衣藻(Chlamydomonas reinhardtii)为模型,通过同源序列比对和系统发育分析,鉴定出两个具有VIT-VWA结构域的蛋白FBB6L1和FBB6。功能缺失分析显示,FBB6L1和FBB6的敲除均导致纤毛长度显著延长,细胞体积明显增大,表明二者在纤毛–细胞大小协同稳态中发挥关键调控作用。进一步研究揭示,FBB6L1通过VWA结构域的MIDAS基序抑制纤毛生长,该蛋白缺失可提升纤毛组装速率,此表型源于对纤毛前体物质库的利用效率的提升。此外,FBB6L1缺失显著提升细胞生长速率,这进一步支持其在细胞大小调控中的重要作用。该研究揭示了FBB6L1和FBB6在纤毛长度及细胞大小调控中的协同机制,阐明了VIT-VWA结构域蛋白在细胞稳态调控中的新功能。 展开更多
关键词 纤毛长度 细胞大小 vit-VWA结构域 MIDAS基序 纤毛发生
原文传递
基于改进ViT的网络流量分类方法
10
作者 李道全 高洁 +1 位作者 聂若琳 胡一帆 《计算机工程与设计》 北大核心 2025年第2期431-437,共7页
目前网络流量分类方法中存在模型结构复杂、特征提取不足等问题,提出一种基于稀疏注意力的改进ViT(SA-ViT)网络流量分类模型。去除数据集中无关字段并转化为灰度图,划分为块序列输入编码器提取特征;引入Longformer稀疏注意力对Self-atte... 目前网络流量分类方法中存在模型结构复杂、特征提取不足等问题,提出一种基于稀疏注意力的改进ViT(SA-ViT)网络流量分类模型。去除数据集中无关字段并转化为灰度图,划分为块序列输入编码器提取特征;引入Longformer稀疏注意力对Self-attention进行优化,使其具有更高的局部与全局特征表达能力;通过对比图像相似度实现流量分类。通过网络公开数据集进行检测,其结果表明,所提算法在分类准确率、精确率以及F1分数等方面有较大提升,验证了该模型的科学性与可行性。 展开更多
关键词 流量分类 Vision Transformer(vit) 稀疏注意力 Longformer 编解码器 样本不均衡 灰度图
在线阅读 下载PDF
ViT-Count:面向冠层遮挡的Vision Transformer树木计数定位方法
11
作者 张乔一 张瑞 霍光煜 《北京林业大学学报》 北大核心 2025年第10期128-138,共11页
【目的】针对复杂场景中树木检测的挑战,如遮挡、背景干扰及密集分布等,本研究提出一种基于Vision Transformer(ViT)的树木检测方法(ViT-Count),提升模型对复杂场景中树木的检测精度与鲁棒性。【方法】采用ViT作为基础模型,其在捕捉图... 【目的】针对复杂场景中树木检测的挑战,如遮挡、背景干扰及密集分布等,本研究提出一种基于Vision Transformer(ViT)的树木检测方法(ViT-Count),提升模型对复杂场景中树木的检测精度与鲁棒性。【方法】采用ViT作为基础模型,其在捕捉图像中全局上下文信息方面具有天然优势,尤其适用于形态多变的复杂环境。设计针对树木的视觉提示调优VPT机制,其通过在特征中注入可学习提示(prompts),优化模型在林地高密度树冠、光照变化及不同树种结构下的特征提取能力,提高对不同林分类型的适应性。设计卷积模块的注意力机制模块,利用其在局部感知基础上的长距离依赖建模能力,有效强化模型对树木遮挡、重叠及形态相似目标的辨别能力,提高整体检测的鲁棒性与准确性。设计一个树木检测解码器,通过多层卷积、归一化、GELU激活与上采样操作逐步还原空间分辨率,以生成的目标密度图实现树木计数与定位。【结果】该方法在提升森林、城市场景下的树木检测鲁棒性的同时,增强了模型在多尺度树木目标上的泛化能力。在Larch Casebearer数据集和Urban Tree数据集上进行的实验显示,与其他主流模型相比,该方法的MAE和RMSE最多分别降低了2.53、3.99,表明其泛化能力更强,具有最优的树木检测性能。可视化实验结果表明,在密集森林场景和复杂城市场景中,所提模型均具有较高的树木检测准确率。消融实验的结果证明了模型主要模块的有效性。【结论】基于Vision Transformer的面向复杂场景的树木计数与定位方法能够充分发挥ViT的全局建模能力及视觉提示调优机制任务适应性,结合卷积模块的注意力机制,有效提升复杂场景树木计数与定位的精度与鲁棒性。 展开更多
关键词 目标识别 树木计数 树木定位 复杂场景 Vision Transformer(vit) 视觉提示调优(VPT) 注意力机制
在线阅读 下载PDF
基于ViT-Dense-GRU的往复压缩机轴承间隙故障诊断方法
12
作者 王金东 袁瑜 +1 位作者 赵海洋 文浩东 《化工机械》 2025年第3期455-461,467,共8页
针对单一密集连接网络(DenseNet)面对往复压缩机复杂工况时,出现因识别率低、时序特征提取不充分、鲁棒性差,进而导致轴承间隙故障特征提取不充分的问题,将DenseNet、视觉Transformer(ViT)和门控循环单元(GRU)相融合,构建一种新的故障... 针对单一密集连接网络(DenseNet)面对往复压缩机复杂工况时,出现因识别率低、时序特征提取不充分、鲁棒性差,进而导致轴承间隙故障特征提取不充分的问题,将DenseNet、视觉Transformer(ViT)和门控循环单元(GRU)相融合,构建一种新的故障诊断模型,提出一种基于ViT-Dense-GRU的轴承间隙故障诊断方法。利用2D12型天然气往复压缩机轴承间隙故障数据集对所提模型与4种对比模型进行对比分析,结果表明:所提模型的准确率高达99.381%,损失降低至0.032,鲁棒性测试效果最好,实现了对往复压缩机轴承间隙故障的准确识别。 展开更多
关键词 往复压缩机 轴承 密集连接网络 视觉Transformer 门控循环单元 故障诊断
在线阅读 下载PDF
基于增强频域结合微调ViT的滚动轴承故障诊断模型
13
作者 张朝阳 王琳 张会兵 《移动信息》 2025年第3期258-261,共4页
针对轴承诊断模型存在训练时间长、诊断准确性波动较大的问题,文中提出了一种基于增强频域特征结合微调ViT的模型。首先,基于频域转换和矩阵展开获得矩阵特征。其次,使用增强操作增强特征的表达范围。最后,基于ViT模型进行训练和微调,... 针对轴承诊断模型存在训练时间长、诊断准确性波动较大的问题,文中提出了一种基于增强频域特征结合微调ViT的模型。首先,基于频域转换和矩阵展开获得矩阵特征。其次,使用增强操作增强特征的表达范围。最后,基于ViT模型进行训练和微调,得到诊断模型。实验结果证明,该方法可以有效缩短训练时间,提高模型对各类任务的准确性,且具备更高的稳定性。 展开更多
关键词 特征增强 MMD vit 故障诊断
在线阅读 下载PDF
融合CNN与ViT优化复杂场景下路面裂缝图像检测精度的研究
14
作者 李宏霞 闫迪 +2 位作者 陈宣竹 吴思甜 张梦瑶 《宝鸡文理学院学报(自然科学版)》 2025年第3期73-83,共11页
目的设计一种提升复杂场景路面裂缝图像中细小、细长及复杂拓扑结构裂缝检测准确率和完整性的模型。方法通过改进SwinTransformer块,使其能更好整合局部与全局信息,设计ICA模块以动态聚焦裂缝特征通道,SFF模块实现多层次特征互补,BD模... 目的设计一种提升复杂场景路面裂缝图像中细小、细长及复杂拓扑结构裂缝检测准确率和完整性的模型。方法通过改进SwinTransformer块,使其能更好整合局部与全局信息,设计ICA模块以动态聚焦裂缝特征通道,SFF模块实现多层次特征互补,BD模块精准定位裂缝边界,进而构建融合CNN局部特征提取与ViT全局信息处理能力的Crack-RISB混合深度学习路面裂缝检测模型。结果对5种公开数据集构成混合数据集的检测结果表明,Crack-RISB较5种先进方法中排名第一的模型Dice系数提升1.04%,IoU提升3.02%,MPA提升1.24%,可视化结果显示其对大面积复杂拓扑结构裂缝分割及细小、细长裂缝精细化识别方面优势突出。结论Crack-RISB模型为提升复杂环境路面裂缝检测精度提供了有价值参考。 展开更多
关键词 路面裂缝图像检测 CNN vit 长距离依赖 交互式通道注意
在线阅读 下载PDF
基于自预训练的改进ViT心音分类方法
15
作者 刘海权 《自动化应用》 2025年第10期63-68,共6页
针对Transformer模型用于心音分类任务中会出现的过拟合现象导致的训练失败问题,提出基于自预训练的改进ViT心音分类模型。首先,提取心音数据的log梅尔频谱图作为模型输入,通过增强输入的特征表示以避免过拟合现象;其次,通过带有重叠的... 针对Transformer模型用于心音分类任务中会出现的过拟合现象导致的训练失败问题,提出基于自预训练的改进ViT心音分类模型。首先,提取心音数据的log梅尔频谱图作为模型输入,通过增强输入的特征表示以避免过拟合现象;其次,通过带有重叠的滑动分块保留相邻patch之间的相关性,相关性能提供位置信息以代替位置编码;最后,提出一种自预训练方法对模型进行预训练,自预训练能减少噪声的引入并能有效提高模型性能。在PCCD和PHSD两个数据集上进行实验,结果表明,提出的改进模型能在心音数据中进行有效训练,没有出现过拟合现象。此外,提出的改进模型分别在PCCD和PHSD数据集上达到了96.2%和99.1%的准确率。 展开更多
关键词 心音分类 Transformer模型 vit 自预训练
在线阅读 下载PDF
基于VIT机构分析SULZER 5RTA62U主机负荷受限与增压器喘振故障研究
16
作者 邱流剑 《今日自动化》 2025年第6期74-76,共3页
文章探究了某散货船SULZER 5RTA62U主机维修后出现的负荷受限与涡轮增压器喘振故障问题,揭示了高压油泵喷油定时调整不当的故障机理,阐述了主机燃油系统VIT机构的工作原理及定时调整工艺,以期为同类船舶动力装置故障诊断与修复提供技术... 文章探究了某散货船SULZER 5RTA62U主机维修后出现的负荷受限与涡轮增压器喘振故障问题,揭示了高压油泵喷油定时调整不当的故障机理,阐述了主机燃油系统VIT机构的工作原理及定时调整工艺,以期为同类船舶动力装置故障诊断与修复提供技术参考。 展开更多
关键词 高压油泵 喷油定时 vit机构 主机负荷受限 燃烧优化
在线阅读 下载PDF
基于Vit模型的坩埚透明层厚度测量研究
17
作者 张方 《舰船电子工程》 2025年第4期189-194,共6页
为解决现有坩埚透明层厚度检测存在的人工测量效率低、精度不足、无法全面反映整体坩埚质量等问题,论文提出一种基于机器视觉和深度学习Vit模型的SiO2坩埚层厚测量方法。采用基于单片机控制的手持测厚设备,实现匀速拍摄坩埚表面至内部视... 为解决现有坩埚透明层厚度检测存在的人工测量效率低、精度不足、无法全面反映整体坩埚质量等问题,论文提出一种基于机器视觉和深度学习Vit模型的SiO2坩埚层厚测量方法。采用基于单片机控制的手持测厚设备,实现匀速拍摄坩埚表面至内部视频;通过人工标定,确定透明层初始帧和结束帧的标准;运用融合帧差信息的霍夫梯度法定位坩埚表层气泡,结合Vit模型对图像帧进行分类获取层界边缘帧;最终利用提出的厚度计算公式获得透明层厚度信息。在对同一批次坩埚样品进行多位置点透明层厚度测量中,方法误差保持在0.3 mm以内,充分展现出其卓越的准确性和稳定性。同时搭配设计的手持设备实现了坩埚透明层厚度的便捷测量,为研究提供了可行而高效的方案。 展开更多
关键词 机器视觉 石英坩埚 vit模型 层厚测量
在线阅读 下载PDF
基于ViT模型的FPCB缺陷检测系统研究
18
作者 黎志勇 叶兆元 +3 位作者 郑凯扬 郑陆宇 张亮智 易心蕊 《新技术新工艺》 2025年第4期62-67,共6页
柔性印刷电路板(FPCB)作为现代电子设备中的核心组成部分,其生产质量直接影响电子产品的性能与可靠性。为了应对传统检测方法在效率和精度上的不足,提出了一种基于Vision Transformer(ViT)模型的FPCB缺陷检测方法。ViT模型通过其强大的... 柔性印刷电路板(FPCB)作为现代电子设备中的核心组成部分,其生产质量直接影响电子产品的性能与可靠性。为了应对传统检测方法在效率和精度上的不足,提出了一种基于Vision Transformer(ViT)模型的FPCB缺陷检测方法。ViT模型通过其强大的全局特征提取能力,在处理复杂的FPCB缺陷检测任务时表现优异,显著优于传统卷积神经网络(CNN)模型。实验结果表明,使用ViT模型的检测系统在精度、鲁棒性和效率方面都有明显提升,尤其是在处理复杂且多样的缺陷时展现了卓越的性能。 展开更多
关键词 Vision Transformer(vit) 柔性印刷电路板(FPCB) 缺陷检测 机器视觉
在线阅读 下载PDF
基于多尺度ViT的航天器微损伤智能检测
19
作者 马勇利 韩阅 《航天器环境工程》 2025年第5期537-548,共12页
针对航天器表面缺陷检测技术在尺度建模、特征对齐及环境适应性方面的不足,文章提出一种新的航天器表面微损伤检测方法:基于双分支多尺度Vision Transformer(ViT)架构提取全局环境特征与局部高分辨率细节特征,结合显著性引导融合模块(SG... 针对航天器表面缺陷检测技术在尺度建模、特征对齐及环境适应性方面的不足,文章提出一种新的航天器表面微损伤检测方法:基于双分支多尺度Vision Transformer(ViT)架构提取全局环境特征与局部高分辨率细节特征,结合显著性引导融合模块(SGFM)动态聚集关键区域,以增强微小损伤的检测精度。利用Spacecraft-DS数据集进行聚焦金属壳体表面杂质与划痕的检测,并采用端到端训练框架评估,结果表明:相较于YOLO-V8与DETR等模型,该方法的APall、Recall和F1等指标值最高提升2.2%,推理速度达25 FPS,尤其在小尺寸损伤识别与复杂背景抑制方面表现突出,解决了传统CNN感受野局限与ViT尺度适应不足的问题。研究成果可为空间站巡检、卫星劣化分析等任务提供高效技术支持。 展开更多
关键词 航天器表面微损伤 智能检测 双分支多尺度vit 语义门控特征融合 小目标检测 航天器健康管理
在线阅读 下载PDF
基于ViT的农作物检测方法与应用研究
20
作者 何懿璇 叶兆元 +4 位作者 郑凯扬 易心蕊 黎志勇 李彦錂 刘洋 《南方农机》 2025年第15期55-58,共4页
在真实环境中,玉米病害识别面临背景复杂的难题,并且卷积神经网络(CNN)在对玉米病害图像进行识别时,往往只依靠局部特征信息,识别效果并不理想。基于此,文章提出了一种以ViT为基础的农作物检测方案。团队收集了4种常见玉米病害的图像样... 在真实环境中,玉米病害识别面临背景复杂的难题,并且卷积神经网络(CNN)在对玉米病害图像进行识别时,往往只依靠局部特征信息,识别效果并不理想。基于此,文章提出了一种以ViT为基础的农作物检测方案。团队收集了4种常见玉米病害的图像样本,以ViT模型为主体去除环境干扰,对图像进行镜像翻转、高斯模糊等图像增强操作,提升模型对于复杂环境中的玉米叶片、根茎等部位病害的识别能力。研究结果表明,在玉米病害识别中,相比基于CNN的相关模型以及其他同类模型,ViT模型的准确率有显著提升。 展开更多
关键词 vit模型 玉米病害 卷积神经网络 识别性能
在线阅读 下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部