期刊文献+
共找到992篇文章
< 1 2 50 >
每页显示 20 50 100
基于类不平衡学习的离心泵故障诊断研究
1
作者 陈志辉 曹思民 +3 位作者 李耀武 赵雪岑 马剑 黄俊杰 《测控技术》 2025年第7期26-34,共9页
旋转机械在运行过程中所采集的故障数据与正常数据存在着“类不平衡”问题,导致以数据为驱动的故障诊断模型准确度下降。针对该问题,以离心泵为对象,通过“两步走”的方式实现离心泵的精准故障诊断。首先,基于带有惩罚梯度的Wasserstei... 旋转机械在运行过程中所采集的故障数据与正常数据存在着“类不平衡”问题,导致以数据为驱动的故障诊断模型准确度下降。针对该问题,以离心泵为对象,通过“两步走”的方式实现离心泵的精准故障诊断。首先,基于带有惩罚梯度的Wasserstein距离生成对抗网络(Wasserstein Generative Adversarial Network with Gradient Penalty,WGAN-GP)模型,实现离心泵故障样本的高质量扩充。其次,利用深度学习卷积神经网络(Convolutional Neural Network,CNN)方法,设计了离心泵的故障诊断模型,并构造了3组不同平衡比例离心泵样本集和平衡样本集,完成了对离心泵的精准故障诊断。实验结果表明,经WGAN-GP模型扩充的样本集对于离心泵故障诊断具有正效益,能够有效提高离心泵的故障诊断准确度。 展开更多
关键词 离心泵 类不平衡数据 故障诊断 生成对抗网络
在线阅读 下载PDF
基于加权与动态选择的不平衡数据流分类算法
2
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
有限标签下的非平衡数据流分类方法
3
作者 李艳红 李志华 +2 位作者 郑建兴 白鹤翔 郭鑫 《大数据》 2025年第2期107-126,共20页
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见... 数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类非平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的非平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。 展开更多
关键词 数据流分类 多类非平衡 极限学习机 概念漂移 标签成本昂贵
在线阅读 下载PDF
基于大数据的职业教育评价助力纺织材料识别与应用课程建设研究
4
作者 吴佳林 秦春英 +2 位作者 刘梦林 陶培培 杨璧玲 《山东纺织经济》 2025年第9期46-49,共4页
本文以纺织材料识别与应用课程为例,探讨基于大数据的职业教育评价如何助力课程优化与人才培养。通过整合多源数据,构建动态评价模型,实现对学生知识掌握、技能应用及创新能力的精准评估。基于大数据的评价方法,有效推动课程设计优化。... 本文以纺织材料识别与应用课程为例,探讨基于大数据的职业教育评价如何助力课程优化与人才培养。通过整合多源数据,构建动态评价模型,实现对学生知识掌握、技能应用及创新能力的精准评估。基于大数据的评价方法,有效推动课程设计优化。通过构建纺织材料识别与应用课程的教学评价指标体系,提升教学质量,实现学习路径的可视化与个性化,从而为纺织行业培养具备数字化素养的高技能人才提供科学依据。 展开更多
关键词 新质生产力 大数据技术 评价体系 智慧课堂
在线阅读 下载PDF
基于类注意力的原型网络改进方法 被引量:3
5
作者 曹增辉 陈浩 曹雅慧 《自动化与信息工程》 2025年第1期59-65,共7页
小样本学习是图像分类任务中的一个重要挑战,能够有效解决因数据量较少而产生的模型准确率降低的问题。针对小样本学习难以准确获取类内共有特征的问题,提出一种基于类注意力的原型网络改进方法。利用掩膜图像进行数据预处理和图像增强... 小样本学习是图像分类任务中的一个重要挑战,能够有效解决因数据量较少而产生的模型准确率降低的问题。针对小样本学习难以准确获取类内共有特征的问题,提出一种基于类注意力的原型网络改进方法。利用掩膜图像进行数据预处理和图像增强,以提高原始数据质量;引入注意力机制,选择性地关注特征图中的重要信息,以增强特征提取能力;设计类注意力模块,提取具有注意力信息的类别原型。实验结果表明,在miniImageNet数据集上,该方法的分类准确率在基线基础上提高了2%,验证了其有效性。 展开更多
关键词 原型网络 小样本学习 数据增强 类注意力 图像分类
在线阅读 下载PDF
概念演化数据流主动学习方法
6
作者 李艳红 杜江涛 +2 位作者 王素格 白鹤翔 李德玉 《计算机技术与发展》 2025年第8期36-44,共9页
数据流分类方法研究在开放环境下的模型动态更新,以期从实时到达且不断变化的数据流中检测并适应概念演化,目前多数数据流分类方法通常假设数据流中样本的类别数是固定的,并且样本的标签可以不受限制地获取,这在真实场景下是不现实的。... 数据流分类方法研究在开放环境下的模型动态更新,以期从实时到达且不断变化的数据流中检测并适应概念演化,目前多数数据流分类方法通常假设数据流中样本的类别数是固定的,并且样本的标签可以不受限制地获取,这在真实场景下是不现实的。为此,该文提出了一种概念演化数据流主动学习方法(Active Learning Method for Concept Evolution Data Stream,ALM-CEDS)。定义基于样本标准差的基分类器重要性度量,提出基于加权预测概率的样本预测方法,提升分类器的分类性能;提出基于混合标签查询策略的分类器更新方法,使用难区分和代表当前数据分布的样本更新分类器;提出基于微簇q-近邻轮廓系数的新类检测方法,在数据流中快速识别新类。在4个真实数据流与5个合成数据流上的对比实验表明,该概念演化数据流主动学习方法在分类性能上优于已有的6种数据流学习方法。 展开更多
关键词 数据流分类 概念演化 主动学习 新类检测 聚类
在线阅读 下载PDF
类级代码异味的半监督学习检测方法
7
作者 瞿志豪 陈军华 高建华 《计算机工程与设计》 北大核心 2025年第10期2741-2747,共7页
基于机器学习的代码异味检测面临数据集较小、缺乏系统性以及手动注释耗时等挑战,限制了模型性能的提升。为此分析了一种代码异味的半监督学习检测方法,旨在通过结合未标注数据和有限标注数据来提高监督学习分类器的性能。实验结果表明... 基于机器学习的代码异味检测面临数据集较小、缺乏系统性以及手动注释耗时等挑战,限制了模型性能的提升。为此分析了一种代码异味的半监督学习检测方法,旨在通过结合未标注数据和有限标注数据来提高监督学习分类器的性能。实验结果表明,半监督学习分类器(semi supervised learning classifier)的性能明显优于监督学习分类器,在Data Class和Feature Envy两种代码异味检测中,F-measure分别提高了3%的和10%。 展开更多
关键词 代码异味 机器学习 监督学习 半监督学习 半监督学习分类器 Feature Envy Data Class
在线阅读 下载PDF
基于局部合力改进的Borderline-SMOTE过采样方法
8
作者 吕峰 宋媚 +2 位作者 赵礼 祝义 李赫男 《南京师大学报(自然科学版)》 北大核心 2025年第5期93-103,共11页
数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样... 数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样策略,导致机器学习模型预测时出现过拟合.因此,本文提出一种基于局部合力改进的Borderline-SMOTE过采样方法(IBSLG).首先,根据少数类样本最近邻分布构建边界区域;其次,基于局部合力计算边界区域内样本的集中度,根据集中度将样本划分为低概率/高概率边界样本;然后,基于两类边界样本分布,计算缩放因子构建新边界区域;最后,基于类不平衡比,对新边界区域自适应生成新样本.通过IBSLG与6种采样方法在4种分类器、8个不平衡数据集上进行对比实验,结果表明,IBSLG在大部分数据集上取得了最优的F1、G-mean、AUC和Friedman排名,并在大部分分类器上取得了最高的平均次优率,说明所提方法的有效性. 展开更多
关键词 不平衡数据 过拟合 类重叠 过采样 Borderline-SMOTE 局部合力
在线阅读 下载PDF
DRO框架下不平衡分类损失函数重加权优化 被引量:1
9
作者 李佳静 林耿 《计算机应用研究》 北大核心 2025年第8期2428-2436,共9页
在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不... 在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不确定性会进一步增加分类的难度。为解决这一问题,提出了一种名为加权标签分布稳健(weighted label distributionally robust Kullback-Leibler,WLDR-KL)的损失函数。该损失利用先验信息和标签权重显式地调整模型对少数类别的关注度,通过优化最不利的集合下的预测分布来应对数据标签不确定性下的不平衡分类任务。此外,利用Monte Carlo模拟提出了一种不平衡数据集的仿真方法,以更全面地评估各损失函数在不同类别和不同数量差异水平下的表现。在多组模拟数据集、UCI和Kaggle数据集上的实验结果表明,所提出的方法在处理不平衡数据时表现良好,并且在top-k准确率、F_(1)值、精度、召回率上均实现了一定程度的提升,为解决不平衡分类问题提供了一种有效的方法。 展开更多
关键词 不平衡分类 数据标签不确定性 加权标签分布稳健损失
在线阅读 下载PDF
用于植物病虫害图像识别的数据增强方法
10
作者 肖宇 吴杰 马驰 《计算机技术与发展》 2025年第3期210-214,共5页
在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的Saliency... 在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的SaliencyBatchMix数据增强方法利用类激活映射(CAM)计算语义百分比图(SPM)后,按Batch的维度选择具有代表性的图像区域,并将图像区域作为指示性补丁与目标图像混合,以引导模型学习更恰当的特征表示。该方法可减少训练中裁剪区域的无意义像素,并且减少了标签噪声。在GhostNet架构下的实验中,SaliencyBatchMix分别在IP102和Embrapa数据集上实现了72.05%和96.86%的准确率。对比于使用CutMix方法分别提升了0.62百分点和1百分点。通过对结果的对比和消融实验分析,验证了SaliencyBatchMix在提高模型泛化能力和准确率的有效性。 展开更多
关键词 数据增强 类激活映射 深度学习 植物病虫害识别 GhostNet
在线阅读 下载PDF
数字孪生中混合知识蒸馏辅助的异构联邦类增量学习
11
作者 张铭泉 贾圆圆 张荣华 《智能系统学报》 北大核心 2025年第4期905-915,共11页
在数字孪生背景下,联邦学习面临数据非独立同分布和类别动态变化的挑战,即空间和时间范围内的数据异构问题。为解决这一问题,本文构建了一个数字孪生背景下的联邦类增量学习整体框架,并提出了一种混合知识蒸馏辅助的联邦类增量学习方法... 在数字孪生背景下,联邦学习面临数据非独立同分布和类别动态变化的挑战,即空间和时间范围内的数据异构问题。为解决这一问题,本文构建了一个数字孪生背景下的联邦类增量学习整体框架,并提出了一种混合知识蒸馏辅助的联邦类增量学习方法。具体来说,与传统联邦学习本地更新方式不同,本文方法通过自适应语义蒸馏损失和自适应注意力蒸馏损失集成的混合知识蒸馏方法提取旧全局模型中输出层的软标签语义知识和中间层的高维特征知识,使客户端模型在拟合新数据的同时有效减少对旧数据的遗忘,提升联邦类增量模型的性能。在相同的数据异构情况下,与对比模型相比,本文方法在CIFAR100数据集上精度提升1.85%~2.56%,在医学CT图像数据集OrganAMNIST、OrganCMNIST、OrganSMNIST上也取得了最优或次优的性能。 展开更多
关键词 数字孪生 联邦类增量学习 混合知识蒸馏 数据异构 图像分类 灾难性遗忘 CT图像 联邦学习
在线阅读 下载PDF
对话状态追踪模型的数据增强方法研究
12
作者 刘舒曼 冯洋 《中文信息学报》 北大核心 2025年第4期96-104,共9页
对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问... 对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问题,该文使用局部噪声强化槽位值的多样性,加强模型学习槽位无关对话结构的能力;针对训练语料稀少问题,该文根据语料中由槽位结构构成的任务逻辑序列,通过采样生成逻辑合法的槽位值序列,增强语料逻辑多样性,增加语料数量。该文方法在数据集上经对比和分析实验,能显著缓解对话状态追踪模型中存在的类别难度不均衡和语料稀少问题。 展开更多
关键词 对话状态追踪 数据增强 类别难度不均衡
在线阅读 下载PDF
基于迁移类内变化增强数据的小样本学习方法
13
作者 李小雨 罗娜 《计算机工程》 北大核心 2025年第9期242-251,共10页
小样本学习致力于通过极少数量的训练样本,甚至一个样本来实现对新类数据的分类。面对这种挑战,数据增强成为小样本学习中一种直接而有效的解决方法,但是确保增强数据的多样性和可辨别性是数据增强的关键。为此,提出一种基于迁移基类类... 小样本学习致力于通过极少数量的训练样本,甚至一个样本来实现对新类数据的分类。面对这种挑战,数据增强成为小样本学习中一种直接而有效的解决方法,但是确保增强数据的多样性和可辨别性是数据增强的关键。为此,提出一种基于迁移基类类内变化的两阶段数据增强方法,分为特征学习和小样本学习阶段。在特征学习阶段,模型通过自监督任务学习基类数据的个体特征表达,有监督任务则学习类辨别特征,模型通过这两种特征获得基类数据的类内变化并建模基类的类内变化分布。在小样本学习阶段,模型从基类的类内变化分布中采样与任务相关的类内变化信息并添加到小样本特征中,以实现增强小样本数据的目的。实验结果表明,在5-way 1-shot情况下,所提方法在miniImageNet、tieredImageNet和CUB数据集上的分类性能相较于基线模型提升了4~7百分点,在5-way 5-shot情况下提升了3~7百分点,相较于其他数据增强方法,也展现了具有竞争力的性能,这表明生成的增强数据在保持可辨别性的同时增强小样本数据的多样性,并验证了该方法的可行性和有效性。 展开更多
关键词 小样本学习 数据增强 类内变化 类辨别特征 个体特征
在线阅读 下载PDF
一种基于深度分区聚合的神经网络后门样本过滤方法
14
作者 郭嘉铭 杜文韬 杨超 《计算机科学》 北大核心 2025年第11期425-433,共9页
深度神经网络易受后门攻击,攻击者可以通过数据投毒的方式植入后门并劫持模型的行为。其中,类特定攻击映射关系复杂、与正常任务关联紧密,因而能绕过大多数防御方法,具有更高的威胁性。文中研究了类特定攻击在植入后门的过程中攻击成功... 深度神经网络易受后门攻击,攻击者可以通过数据投毒的方式植入后门并劫持模型的行为。其中,类特定攻击映射关系复杂、与正常任务关联紧密,因而能绕过大多数防御方法,具有更高的威胁性。文中研究了类特定攻击在植入后门的过程中攻击成功率与模型分类性能的关系,总结出3条性质,并以此为基础设计了一种针对类特定攻击的样本过滤方法。该方法使用深度分区聚合(Deep Partition Aggregation,DPA)的集成学习方法与投票法对数据集进行反复迭代过滤。根据类特定攻击的3条性质,从数学层面证明了该过滤方法的有效性,并在标准分类数据集上进行了大量实验,在迭代4轮后均能过滤95%以上的后门样本。同时,与最新的样本过滤方法的对比实验结果,体现了所提过滤方法在针对类特定攻击时的优越性。文中实验基于Github的开源项目backdoorbox开展。 展开更多
关键词 深度学习 数据投毒 后门攻击 类特定攻击 集成学习 样本过滤
在线阅读 下载PDF
基于特征转换和少数类聚类的微生物数据扩增算法
15
作者 温柳英 郑天浩 《郑州大学学报(工学版)》 北大核心 2025年第6期23-31,共9页
微生物数据的高维、高零值率特性及少数类样本稀缺导致的类别不平衡,显著降低了分类器的少数类识别能力,而现有扩增算法对高不平衡比(IR)敏感且难以有效合成样本。针对此问题,提出了一种基于特征转换和少数类聚类的微生物数据扩增算法(F... 微生物数据的高维、高零值率特性及少数类样本稀缺导致的类别不平衡,显著降低了分类器的少数类识别能力,而现有扩增算法对高不平衡比(IR)敏感且难以有效合成样本。针对此问题,提出了一种基于特征转换和少数类聚类的微生物数据扩增算法(FTMC)。首先,该算法在特征转换阶段采用主成分分析算法对高维数据进行降维,以缓解数据强稀疏性问题;其次,在少数类聚类阶段,使用K-means算法捕捉少数类的局部特征,获得多个聚类;再次,在聚类筛选阶段,基于每个聚类的密度和难度,结合IR和权重比来计算其权重值,并以此筛选出核心聚类子集,用于后续样本生成;最后,在样本扩增过滤阶段,利用线性插值算法,对筛选后的每个核心聚类进行样本扩增,并使用局部异常因子算法过滤异常点,确保扩增样本的质量。在12个微生物数据集上进行实验,并在3个分类器下对比8个同类型采样算法的性能,结果表明:FTMC生成的样本更具多样性,在Recall指标上平均提高了26.42%,证明该算法能正确识别更多的阳性样本。 展开更多
关键词 微生物数据 高维 稀疏 类别不平衡 聚类 数据扩增
在线阅读 下载PDF
基于多模态时序对比生成网络的数据增强算法
16
作者 商柔 董宏丽 +3 位作者 王闯 周国强 管闯 闫天红 《控制理论与应用》 北大核心 2025年第4期805-815,共11页
针对工业故障诊断中的小样本和类不平衡问题,本文提出一种基于马尔可夫链的多模态时序对比生成模型(TCGN).首先,为了提升合成数据时间结构的真实性,设计了一种时序趋势一致化损失(TTC),以提升真实数据与合成数据之间时间演化规律的相似... 针对工业故障诊断中的小样本和类不平衡问题,本文提出一种基于马尔可夫链的多模态时序对比生成模型(TCGN).首先,为了提升合成数据时间结构的真实性,设计了一种时序趋势一致化损失(TTC),以提升真实数据与合成数据之间时间演化规律的相似度.随后,为了在增强数据集中形成有效且正确的决策边界,提出了一种类意识对比损失(CAC),以对齐真实数据与合成数据的类条件分布.此外,为了更好地维持不同学习任务之间的动态平衡,引入了一种基于马尔可夫链的多模态切换策略,以实现TCGN算法在生成、刻画、探索、收敛4个模态之间的自适应切换优化.最后,将所提出的TCGN算法应用于管道故障诊断.实验结果表明TCGN算法在视觉评估和量化指标方面均优于一些先进的生成算法,显著提高了故障诊断准确率. 展开更多
关键词 管道故障诊断 类别不平衡 时间序列 数据增强 马尔可夫链 多任务学习
在线阅读 下载PDF
基于深度学习的太阳黑子群磁类型分类
17
作者 尹耀 李依洋 +6 位作者 黄狮勇 徐思博 袁志刚 吴红红 姜奎 熊启洋 林仁桐 《空间科学学报》 北大核心 2025年第2期253-265,共13页
太阳活动作为太阳大气层中能量释放和物质运动的显著表现形式,是空间天气的主要扰动源,以太阳黑子为代表的剧烈太阳活动可能导致近地空间环境的剧烈变化,进而对人类的生产生活产生深远影响.准确、高效地预报空间天气有助于减少其对人类... 太阳活动作为太阳大气层中能量释放和物质运动的显著表现形式,是空间天气的主要扰动源,以太阳黑子为代表的剧烈太阳活动可能导致近地空间环境的剧烈变化,进而对人类的生产生活产生深远影响.准确、高效地预报空间天气有助于减少其对人类生产生活的影响.本文利用2010-2017年太阳动力学天文台(Solar Dynamics Observatory,SDO)搭载的HMI仪器观测的连续谱图和磁图数据,建立了基于压缩激励模块和深度残差网络的太阳黑子威尔逊山磁类型分类模型.为了有效避免因时间序列连续性导致的模型过拟合问题,采用时序分割法划分数据集,并结合太阳黑子图像的特点应用了数据增强策略,以提高模型的泛化能力.结果表明,提出的模型能够较准确地完成太阳黑子磁分类任务,尤其是在复杂类型黑子的识别方面,相较于传统方法其识别能力得到了显著的提升.此外,使用类激活映射方法对测试集样本进行了可视化研究,分析了模型提取到的特征图像和分类依据,从而提高模型的可解释性. 展开更多
关键词 太阳黑子 深度残差网络 压缩激励模块 数据增强 类激活映射
在线阅读 下载PDF
基于凝聚式层次聚类的微调筛选过采样方法
18
作者 谷铮 陈学斌 +1 位作者 张宏扬 李雨欣 《计算机应用》 北大核心 2025年第7期2138-2144,共7页
针对不平衡数据集分类效果差的问题,提出一种基于凝聚式层次聚类(AHC)的微调筛选过采样方法,该方法可适用于不平衡数据的多分类情况。首先,在不平衡数据集的聚类过程中应用AHC算法,分别聚类多数类与少数类,从而在考虑类别间关系的同时... 针对不平衡数据集分类效果差的问题,提出一种基于凝聚式层次聚类(AHC)的微调筛选过采样方法,该方法可适用于不平衡数据的多分类情况。首先,在不平衡数据集的聚类过程中应用AHC算法,分别聚类多数类与少数类,从而在考虑类别间关系的同时有效避免类重叠问题;其次,为了平衡数据集并保留原始数据的特征,设计一种微调过采样算法;再次,为了提升生成样本的分类准确率,提出一种基于倾向评分匹配的标签倾向评估与筛选方法;最后,通过实验对所提出的方法进行验证,并将该方法与MDO(Mahalanobis Distance-based Over-sampling technique)、AND-SMOTE(Automatic Neighborhood size Determination method for Synthetic Minority Over-sampling TEchnique)和K-means SMOTE这3种方法进行比较。实验结果表明,在Abalone、Contraceptive和Yeast等6个不同的数据集上,所提方法展现出了良好的性能,验证了它的有效性。 展开更多
关键词 不平衡数据 多分类 过采样 凝聚式层次聚类 标签倾向评估
在线阅读 下载PDF
基于数据-算法双驱动融合的火成岩岩性识别方法
19
作者 韩锐羿 宋晓妮 +1 位作者 王欣茹 郭宇航 《测井技术》 2025年第2期218-225,共8页
现有火成岩岩性识别技术面临常规测井响应与岩性敏感度差异显著、离散矿物实验数据难以构建连续地层模型以及岩心-测井标定样本类别不平衡等技术瓶颈。为解决这些问题,该研究提出数据-算法双驱动融合的火成岩岩性识别方法。首先通过矿... 现有火成岩岩性识别技术面临常规测井响应与岩性敏感度差异显著、离散矿物实验数据难以构建连续地层模型以及岩心-测井标定样本类别不平衡等技术瓶颈。为解决这些问题,该研究提出数据-算法双驱动融合的火成岩岩性识别方法。首先通过矿物化学组分与测井数据融合,建立具有岩石物理意义的特征表征体系;进而设计基于Mahalanobis距离的层次化重采样机制,有效缓解小样本类别识别偏倚问题;最终建立具有概率解释性的贝叶斯深度森林模型,实现火成岩复杂岩性的高精度识别。基于辽河盆地东部凹陷20口井的8356组数据,开展嵌套式验证;该方法在同井测试中准确率为100%,异井测试准确率达89%,加权F1值0.88,准确率较其他火成岩岩性识别方法显著提升。研究结果表明,通过地质先验知识与深度学习融合,可有效提升火成岩岩性识别的工程适用性与解释可靠性,为复杂储层精细评价提供新的技术手段。 展开更多
关键词 测井解释 岩性识别 深度森林算法 测井数据融合 火成岩 样本不平衡处理
在线阅读 下载PDF
基于多模态数据融合的边缘设备轻量级垃圾分类方法和系统研究
20
作者 肖克江 陈亮 +2 位作者 高阔 杨文齐 庞世燕 《工程科学学报》 北大核心 2025年第9期1905-1916,共12页
随着人工智能技术的发展,基于神经网络的垃圾分类方法成为解决垃圾处理问题的重要手段,并得到了广泛应用.但对于边缘设备而言,神经网络的可更新性与准确率提升仍需进一步研究.本文提出了一种面向边缘设备的垃圾分类方法和系统.首先,为... 随着人工智能技术的发展,基于神经网络的垃圾分类方法成为解决垃圾处理问题的重要手段,并得到了广泛应用.但对于边缘设备而言,神经网络的可更新性与准确率提升仍需进一步研究.本文提出了一种面向边缘设备的垃圾分类方法和系统.首先,为解决神经网络在增量学习时面临的遗忘问题,本文采用多步知识蒸馏对AlexNet网络进行类别增量学习,形成了适用于垃圾分类的教师–助教–学生模型,使得AlexNet网络在学习新类别时保持对旧类别的判断能力.其次,为克服图像特征不明显导致分类准确率降低的问题,本文引入了金属传感器数据和重量传感器数据,通过Q-learning算法将图像分类结果与多传感器数据进行加权融合,提高了分类的准确率和鲁棒性.最后,本文在树莓派4B平台上设计与实现了垃圾分类系统,并在公开数据集TrashNet和自建数据集上进行了对比实验.实验结果表明,所实现的垃圾分类系统在自建数据集的垃圾分类任务中平均分类准确率达到89.7%,单次分类平均所需时间为130 ms,实现了快速准确的垃圾分类,相较基于MobileNetV3的嵌入式算法提升了6.5%的准确率. 展开更多
关键词 垃圾分类 边缘设备 神经网络 知识蒸馏 类别增量学习 数据融合
在线阅读 下载PDF
上一页 1 2 50 下一页 到第
使用帮助 返回顶部