期刊文献+
共找到998篇文章
< 1 2 50 >
每页显示 20 50 100
台站级地面气象观测数据分析系统设计
1
作者 李晓兰 石京川 +3 位作者 杨雅婷 任兴国 刘俊 文刚 《气象水文海洋仪器》 2026年第1期128-132,共5页
开展台站级地面气象观测数据分析系统设计,嵌入关联规则挖掘算法实现地面气象观测要素数据相关性分析,统计相关地面气象观测要素阈值变化情况,通过数据可视化的方式提供交互式界面,展示相关地面气象观测要素数据查询和数据处理结果。利... 开展台站级地面气象观测数据分析系统设计,嵌入关联规则挖掘算法实现地面气象观测要素数据相关性分析,统计相关地面气象观测要素阈值变化情况,通过数据可视化的方式提供交互式界面,展示相关地面气象观测要素数据查询和数据处理结果。利用C#编程技术,通过定义类的方法,实现地面气象观测数据读取、解析以及Apriori算法等功能。根据台站级地面气象观测数据分析需求,开展数据处理与统计,使用.NET Framework提供的控件编写Windows应用程序,实现数据查询和阈值统计。台站级地面气象观测数据分析系统能够使气象业务人员快速掌握地面气象观测要素的变化趋势和观测要素之间的相关性,提高了台站级气象观测业务人员地面气象观测数据资料应用能力,为提升地面气象观测数据质量提供了参考依据。 展开更多
关键词 地面气象观测数据 定义类 关联规则挖掘 可视化 阈值统计
在线阅读 下载PDF
基于数据驱动的中职班级管理模型构建研究
2
作者 刘瑶 《科教导刊》 2026年第2期91-93,共3页
本研究以2023级会计事务班为对象,采用行动研究法追踪其班级建设全过程。文章通过系统分析新生入学数据,诊断出班级凝聚力不足、学习目标模糊及心理适应性弱等核心问题,并据此构建并实施了“数据赋能·情感浸润·目标引领”三... 本研究以2023级会计事务班为对象,采用行动研究法追踪其班级建设全过程。文章通过系统分析新生入学数据,诊断出班级凝聚力不足、学习目标模糊及心理适应性弱等核心问题,并据此构建并实施了“数据赋能·情感浸润·目标引领”三维管理模型:依托数据精准研判与干预,通过情感浸润营造信任氛围,借助阶梯目标促进共同成长。实践证明,该模型有效推动了班级向团结稳定、积极向上的优良状态转变,为同类班级管理提供了可迁移的实践范式。 展开更多
关键词 中职教育 班级管理 数据驱动 心理适应性 家校共育
在线阅读 下载PDF
基于类不平衡学习的离心泵故障诊断研究
3
作者 陈志辉 曹思民 +3 位作者 李耀武 赵雪岑 马剑 黄俊杰 《测控技术》 2025年第7期26-34,共9页
旋转机械在运行过程中所采集的故障数据与正常数据存在着“类不平衡”问题,导致以数据为驱动的故障诊断模型准确度下降。针对该问题,以离心泵为对象,通过“两步走”的方式实现离心泵的精准故障诊断。首先,基于带有惩罚梯度的Wasserstei... 旋转机械在运行过程中所采集的故障数据与正常数据存在着“类不平衡”问题,导致以数据为驱动的故障诊断模型准确度下降。针对该问题,以离心泵为对象,通过“两步走”的方式实现离心泵的精准故障诊断。首先,基于带有惩罚梯度的Wasserstein距离生成对抗网络(Wasserstein Generative Adversarial Network with Gradient Penalty,WGAN-GP)模型,实现离心泵故障样本的高质量扩充。其次,利用深度学习卷积神经网络(Convolutional Neural Network,CNN)方法,设计了离心泵的故障诊断模型,并构造了3组不同平衡比例离心泵样本集和平衡样本集,完成了对离心泵的精准故障诊断。实验结果表明,经WGAN-GP模型扩充的样本集对于离心泵故障诊断具有正效益,能够有效提高离心泵的故障诊断准确度。 展开更多
关键词 离心泵 类不平衡数据 故障诊断 生成对抗网络
在线阅读 下载PDF
基于三维框架的我国“双一流”高校数据治理政策典型特征分析
4
作者 李春林 李莉 《华北理工大学学报(社会科学版)》 2025年第6期83-90,共8页
数据已经成为高校发展的关键战略资源,数据治理成为推动高等教育高质量发展的重要工具。以我国“双一流”高校数据治理政策为研究对象,构建“数据治理战略—数据治理任务—数据治理保障”三维分析框架,应用文本分析方法,深入探究我国一... 数据已经成为高校发展的关键战略资源,数据治理成为推动高等教育高质量发展的重要工具。以我国“双一流”高校数据治理政策为研究对象,构建“数据治理战略—数据治理任务—数据治理保障”三维分析框架,应用文本分析方法,深入探究我国一流高校数据治理政策特征。研究表明:数据治理战略维度,目标导向明确、数据定义系统化、治理原则明晰;数据治理任务维度,以数据维护与数据安全为核心、全流程治理覆盖,但质量管理和平台建设薄弱、数据标准有待统一;数据治理保障维度,制度设计与执行机制相对完善,但技术支撑与经费保障不足。最后提出优化对策。 展开更多
关键词 “双一流”高校 数据治理 政策文本 典型特征
在线阅读 下载PDF
基于加权与动态选择的不平衡数据流分类算法
5
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
有限标签下的非平衡数据流分类方法
6
作者 李艳红 李志华 +2 位作者 郑建兴 白鹤翔 郭鑫 《大数据》 2025年第2期107-126,共20页
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见... 数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类非平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的非平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。 展开更多
关键词 数据流分类 多类非平衡 极限学习机 概念漂移 标签成本昂贵
在线阅读 下载PDF
基于大数据的职业教育评价助力纺织材料识别与应用课程建设研究
7
作者 吴佳林 秦春英 +2 位作者 刘梦林 陶培培 杨璧玲 《山东纺织经济》 2025年第9期46-49,共4页
本文以纺织材料识别与应用课程为例,探讨基于大数据的职业教育评价如何助力课程优化与人才培养。通过整合多源数据,构建动态评价模型,实现对学生知识掌握、技能应用及创新能力的精准评估。基于大数据的评价方法,有效推动课程设计优化。... 本文以纺织材料识别与应用课程为例,探讨基于大数据的职业教育评价如何助力课程优化与人才培养。通过整合多源数据,构建动态评价模型,实现对学生知识掌握、技能应用及创新能力的精准评估。基于大数据的评价方法,有效推动课程设计优化。通过构建纺织材料识别与应用课程的教学评价指标体系,提升教学质量,实现学习路径的可视化与个性化,从而为纺织行业培养具备数字化素养的高技能人才提供科学依据。 展开更多
关键词 新质生产力 大数据技术 评价体系 智慧课堂
在线阅读 下载PDF
基于类注意力的原型网络改进方法 被引量:3
8
作者 曹增辉 陈浩 曹雅慧 《自动化与信息工程》 2025年第1期59-65,共7页
小样本学习是图像分类任务中的一个重要挑战,能够有效解决因数据量较少而产生的模型准确率降低的问题。针对小样本学习难以准确获取类内共有特征的问题,提出一种基于类注意力的原型网络改进方法。利用掩膜图像进行数据预处理和图像增强... 小样本学习是图像分类任务中的一个重要挑战,能够有效解决因数据量较少而产生的模型准确率降低的问题。针对小样本学习难以准确获取类内共有特征的问题,提出一种基于类注意力的原型网络改进方法。利用掩膜图像进行数据预处理和图像增强,以提高原始数据质量;引入注意力机制,选择性地关注特征图中的重要信息,以增强特征提取能力;设计类注意力模块,提取具有注意力信息的类别原型。实验结果表明,在miniImageNet数据集上,该方法的分类准确率在基线基础上提高了2%,验证了其有效性。 展开更多
关键词 原型网络 小样本学习 数据增强 类注意力 图像分类
在线阅读 下载PDF
概念演化数据流主动学习方法
9
作者 李艳红 杜江涛 +2 位作者 王素格 白鹤翔 李德玉 《计算机技术与发展》 2025年第8期36-44,共9页
数据流分类方法研究在开放环境下的模型动态更新,以期从实时到达且不断变化的数据流中检测并适应概念演化,目前多数数据流分类方法通常假设数据流中样本的类别数是固定的,并且样本的标签可以不受限制地获取,这在真实场景下是不现实的。... 数据流分类方法研究在开放环境下的模型动态更新,以期从实时到达且不断变化的数据流中检测并适应概念演化,目前多数数据流分类方法通常假设数据流中样本的类别数是固定的,并且样本的标签可以不受限制地获取,这在真实场景下是不现实的。为此,该文提出了一种概念演化数据流主动学习方法(Active Learning Method for Concept Evolution Data Stream,ALM-CEDS)。定义基于样本标准差的基分类器重要性度量,提出基于加权预测概率的样本预测方法,提升分类器的分类性能;提出基于混合标签查询策略的分类器更新方法,使用难区分和代表当前数据分布的样本更新分类器;提出基于微簇q-近邻轮廓系数的新类检测方法,在数据流中快速识别新类。在4个真实数据流与5个合成数据流上的对比实验表明,该概念演化数据流主动学习方法在分类性能上优于已有的6种数据流学习方法。 展开更多
关键词 数据流分类 概念演化 主动学习 新类检测 聚类
在线阅读 下载PDF
基于迁移类内变化增强数据的小样本学习方法 被引量:2
10
作者 李小雨 罗娜 《计算机工程》 北大核心 2025年第9期242-251,共10页
小样本学习致力于通过极少数量的训练样本,甚至一个样本来实现对新类数据的分类。面对这种挑战,数据增强成为小样本学习中一种直接而有效的解决方法,但是确保增强数据的多样性和可辨别性是数据增强的关键。为此,提出一种基于迁移基类类... 小样本学习致力于通过极少数量的训练样本,甚至一个样本来实现对新类数据的分类。面对这种挑战,数据增强成为小样本学习中一种直接而有效的解决方法,但是确保增强数据的多样性和可辨别性是数据增强的关键。为此,提出一种基于迁移基类类内变化的两阶段数据增强方法,分为特征学习和小样本学习阶段。在特征学习阶段,模型通过自监督任务学习基类数据的个体特征表达,有监督任务则学习类辨别特征,模型通过这两种特征获得基类数据的类内变化并建模基类的类内变化分布。在小样本学习阶段,模型从基类的类内变化分布中采样与任务相关的类内变化信息并添加到小样本特征中,以实现增强小样本数据的目的。实验结果表明,在5-way 1-shot情况下,所提方法在miniImageNet、tieredImageNet和CUB数据集上的分类性能相较于基线模型提升了4~7百分点,在5-way 5-shot情况下提升了3~7百分点,相较于其他数据增强方法,也展现了具有竞争力的性能,这表明生成的增强数据在保持可辨别性的同时增强小样本数据的多样性,并验证了该方法的可行性和有效性。 展开更多
关键词 小样本学习 数据增强 类内变化 类辨别特征 个体特征
在线阅读 下载PDF
中美英大学出版社数据运营:进展、影响因素及路径建议
11
作者 凌青 杨丹丹 《出版科学》 北大核心 2025年第6期51-62,共12页
首先,梳理了中美英大学出版社主要发展特色,中国大学出版社在改革开放以后异军突起,通过转企改制获得了市场竞争主体地位,数字时代经过探索和优化,进入了层次丰富的数据运营阶段,出现了数据运营头部现象;美国大学出版社秉持突破与创新... 首先,梳理了中美英大学出版社主要发展特色,中国大学出版社在改革开放以后异军突起,通过转企改制获得了市场竞争主体地位,数字时代经过探索和优化,进入了层次丰富的数据运营阶段,出现了数据运营头部现象;美国大学出版社秉持突破与创新的精神,较好地解决了传统馆配市场快速萎缩、大学补贴减少以及数字技术主导下学术出版模式不断被重塑的挑战;英国在数字革命和开放获取出版模式下出现了一批新大学出版社,为英国大学出版社的失衡格局带来了新的生机。其次,剖析了中美英大学出版社数据运营不同进展阶段及其特征表现,进取型大学出版社乘势抓住数字技术和开放科学带来的数据运营新机遇;一流大学出版社完成优质内容、品牌积累后,进入数据运营富有竞争力的阶段;头部大学出版社已迈入从产品开发到生态构建的成熟数据运营阶段。再次,探析了推动大学出版社数据运营的三种影响因素,即有利于促进和推动数据运营的政策环境,包括税收补贴和各类资金资助以及大学出版社协会的专业支持,这些宏观管理举措和外部专业支持力量能有效缓解大学出版社人手不足与成本压力之困;内容和品牌积累,帮助大学出版社形成竞争壁垒;卓越的管理能力与进取、创新的出版精神,为数据运营生态建设提供有力的机制保障。最后,提出进一步推动中国大学出版社数据运营三个主体层面的路径建议,即在政策层面扩大资助资金来源、加强资助项目管理和有针对性的税收优惠;大学出版社层面从找准自身定位和探索跨界合作两个维度寻求突破;寻求大学出版社协会专业层面的支持。 展开更多
关键词 头部大学出版社 一流大学出版社 进取型大学出版社 数据运营 推动因素
在线阅读 下载PDF
类级代码异味的半监督学习检测方法
12
作者 瞿志豪 陈军华 高建华 《计算机工程与设计》 北大核心 2025年第10期2741-2747,共7页
基于机器学习的代码异味检测面临数据集较小、缺乏系统性以及手动注释耗时等挑战,限制了模型性能的提升。为此分析了一种代码异味的半监督学习检测方法,旨在通过结合未标注数据和有限标注数据来提高监督学习分类器的性能。实验结果表明... 基于机器学习的代码异味检测面临数据集较小、缺乏系统性以及手动注释耗时等挑战,限制了模型性能的提升。为此分析了一种代码异味的半监督学习检测方法,旨在通过结合未标注数据和有限标注数据来提高监督学习分类器的性能。实验结果表明,半监督学习分类器(semi supervised learning classifier)的性能明显优于监督学习分类器,在Data Class和Feature Envy两种代码异味检测中,F-measure分别提高了3%的和10%。 展开更多
关键词 代码异味 机器学习 监督学习 半监督学习 半监督学习分类器 Feature Envy Data Class
在线阅读 下载PDF
对话状态追踪模型的数据增强方法研究 被引量:1
13
作者 刘舒曼 冯洋 《中文信息学报》 北大核心 2025年第4期96-104,共9页
对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问... 对话状态追踪模型能够支持任务型对话系统识别任务相关的槽位值。然而,由于标注难度大、领域多样化,对话状态追踪模型常面临训练语料稀少和类别难度不均衡等问题。为了解决这些问题,该文提出了使用数据增强的方法。针对类别难度不均衡问题,该文使用局部噪声强化槽位值的多样性,加强模型学习槽位无关对话结构的能力;针对训练语料稀少问题,该文根据语料中由槽位结构构成的任务逻辑序列,通过采样生成逻辑合法的槽位值序列,增强语料逻辑多样性,增加语料数量。该文方法在数据集上经对比和分析实验,能显著缓解对话状态追踪模型中存在的类别难度不均衡和语料稀少问题。 展开更多
关键词 对话状态追踪 数据增强 类别难度不均衡
在线阅读 下载PDF
基于局部合力改进的Borderline-SMOTE过采样方法
14
作者 吕峰 宋媚 +2 位作者 赵礼 祝义 李赫男 《南京师大学报(自然科学版)》 北大核心 2025年第5期93-103,共11页
数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样... 数据分类是保障大数据分析有效进行的关键环节,解决数据分类中的类别不平衡成为当前研究的热点.过采样技术凭借其简洁性、有效性等特点,成为处理类不平衡问题的主要途径之一.现有的过采样技术在处理不平衡数据中类重叠时缺乏合理的采样策略,导致机器学习模型预测时出现过拟合.因此,本文提出一种基于局部合力改进的Borderline-SMOTE过采样方法(IBSLG).首先,根据少数类样本最近邻分布构建边界区域;其次,基于局部合力计算边界区域内样本的集中度,根据集中度将样本划分为低概率/高概率边界样本;然后,基于两类边界样本分布,计算缩放因子构建新边界区域;最后,基于类不平衡比,对新边界区域自适应生成新样本.通过IBSLG与6种采样方法在4种分类器、8个不平衡数据集上进行对比实验,结果表明,IBSLG在大部分数据集上取得了最优的F1、G-mean、AUC和Friedman排名,并在大部分分类器上取得了最高的平均次优率,说明所提方法的有效性. 展开更多
关键词 不平衡数据 过拟合 类重叠 过采样 Borderline-SMOTE 局部合力
在线阅读 下载PDF
基于凝聚式层次聚类的微调筛选过采样方法 被引量:1
15
作者 谷铮 陈学斌 +1 位作者 张宏扬 李雨欣 《计算机应用》 北大核心 2025年第7期2138-2144,共7页
针对不平衡数据集分类效果差的问题,提出一种基于凝聚式层次聚类(AHC)的微调筛选过采样方法,该方法可适用于不平衡数据的多分类情况。首先,在不平衡数据集的聚类过程中应用AHC算法,分别聚类多数类与少数类,从而在考虑类别间关系的同时... 针对不平衡数据集分类效果差的问题,提出一种基于凝聚式层次聚类(AHC)的微调筛选过采样方法,该方法可适用于不平衡数据的多分类情况。首先,在不平衡数据集的聚类过程中应用AHC算法,分别聚类多数类与少数类,从而在考虑类别间关系的同时有效避免类重叠问题;其次,为了平衡数据集并保留原始数据的特征,设计一种微调过采样算法;再次,为了提升生成样本的分类准确率,提出一种基于倾向评分匹配的标签倾向评估与筛选方法;最后,通过实验对所提出的方法进行验证,并将该方法与MDO(Mahalanobis Distance-based Over-sampling technique)、AND-SMOTE(Automatic Neighborhood size Determination method for Synthetic Minority Over-sampling TEchnique)和K-means SMOTE这3种方法进行比较。实验结果表明,在Abalone、Contraceptive和Yeast等6个不同的数据集上,所提方法展现出了良好的性能,验证了它的有效性。 展开更多
关键词 不平衡数据 多分类 过采样 凝聚式层次聚类 标签倾向评估
在线阅读 下载PDF
DRO框架下不平衡分类损失函数重加权优化 被引量:1
16
作者 李佳静 林耿 《计算机应用研究》 北大核心 2025年第8期2428-2436,共9页
在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不... 在不平衡数据的多分类任务中,由于类别分布存在数量差异,分类器的决策边界往往偏向多数类别,从而导致模型难以实现准确分类。现有研究主要关注于数据平衡策略和损失函数的结构调整,忽视了样本标签可能存在标注错误或噪声,标签信息的不确定性会进一步增加分类的难度。为解决这一问题,提出了一种名为加权标签分布稳健(weighted label distributionally robust Kullback-Leibler,WLDR-KL)的损失函数。该损失利用先验信息和标签权重显式地调整模型对少数类别的关注度,通过优化最不利的集合下的预测分布来应对数据标签不确定性下的不平衡分类任务。此外,利用Monte Carlo模拟提出了一种不平衡数据集的仿真方法,以更全面地评估各损失函数在不同类别和不同数量差异水平下的表现。在多组模拟数据集、UCI和Kaggle数据集上的实验结果表明,所提出的方法在处理不平衡数据时表现良好,并且在top-k准确率、F_(1)值、精度、召回率上均实现了一定程度的提升,为解决不平衡分类问题提供了一种有效的方法。 展开更多
关键词 不平衡分类 数据标签不确定性 加权标签分布稳健损失
在线阅读 下载PDF
实景三维地理实体数据建模方法探讨
17
作者 曹一冰 张江水 +2 位作者 华一新 张政 杨渊 《时空信息学报》 2025年第5期502-515,共14页
地理实体数据是新型基础测绘与实景三维中国建设的核心产品,其组织、生产、管理与服务对建立智慧城市、服务数字中国、发展数字经济具有重要意义。针对当前地理实体在赋能行业应用中存在的多元特征统一表征、多模态数据统一组织、复杂... 地理实体数据是新型基础测绘与实景三维中国建设的核心产品,其组织、生产、管理与服务对建立智慧城市、服务数字中国、发展数字经济具有重要意义。针对当前地理实体在赋能行业应用中存在的多元特征统一表征、多模态数据统一组织、复杂组成结构嵌套与关联、全生命周期建模与多版本信息管理等难题,本文围绕地理实体数据模型及其全生命周期建模方法展开研究。首先,在厘清相关概念的基础上,阐述地理实体的基本特征与分类,设计统一的地理实体数据模型;其次,为解决地理实体数据的来源问题,构建面向对象的地理实体全生命周期建模流程,并对建模过程中的类模板构建、分类编码统一、实例化方法等关键技术进行论述;最后,以城市安全管控、企业安全生产等智慧城市应用场景为例,开展建模实验,来验证方法可行性。研究成果可为实景三维中国地理实体数据建设与应用提供模型支撑和方法借鉴。 展开更多
关键词 实景三维 地理实体 数据模型 地理实体建模 地理实体类模板 地理实体实例化
在线阅读 下载PDF
用于植物病虫害图像识别的数据增强方法
18
作者 肖宇 吴杰 马驰 《计算机技术与发展》 2025年第3期210-214,共5页
在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的Saliency... 在深度学习的植物病虫害图像识别领域,区域数据增强是提高模型泛化能力的关键策略。该技术通过有选择性地移除图像的特定区域,促使模型更加专注于提取那些区分度较低的特征,进而增强了模型对新数据的适应性和识别能力。所提出的SaliencyBatchMix数据增强方法利用类激活映射(CAM)计算语义百分比图(SPM)后,按Batch的维度选择具有代表性的图像区域,并将图像区域作为指示性补丁与目标图像混合,以引导模型学习更恰当的特征表示。该方法可减少训练中裁剪区域的无意义像素,并且减少了标签噪声。在GhostNet架构下的实验中,SaliencyBatchMix分别在IP102和Embrapa数据集上实现了72.05%和96.86%的准确率。对比于使用CutMix方法分别提升了0.62百分点和1百分点。通过对结果的对比和消融实验分析,验证了SaliencyBatchMix在提高模型泛化能力和准确率的有效性。 展开更多
关键词 数据增强 类激活映射 深度学习 植物病虫害识别 GhostNet
在线阅读 下载PDF
数字孪生中混合知识蒸馏辅助的异构联邦类增量学习
19
作者 张铭泉 贾圆圆 张荣华 《智能系统学报》 北大核心 2025年第4期905-915,共11页
在数字孪生背景下,联邦学习面临数据非独立同分布和类别动态变化的挑战,即空间和时间范围内的数据异构问题。为解决这一问题,本文构建了一个数字孪生背景下的联邦类增量学习整体框架,并提出了一种混合知识蒸馏辅助的联邦类增量学习方法... 在数字孪生背景下,联邦学习面临数据非独立同分布和类别动态变化的挑战,即空间和时间范围内的数据异构问题。为解决这一问题,本文构建了一个数字孪生背景下的联邦类增量学习整体框架,并提出了一种混合知识蒸馏辅助的联邦类增量学习方法。具体来说,与传统联邦学习本地更新方式不同,本文方法通过自适应语义蒸馏损失和自适应注意力蒸馏损失集成的混合知识蒸馏方法提取旧全局模型中输出层的软标签语义知识和中间层的高维特征知识,使客户端模型在拟合新数据的同时有效减少对旧数据的遗忘,提升联邦类增量模型的性能。在相同的数据异构情况下,与对比模型相比,本文方法在CIFAR100数据集上精度提升1.85%~2.56%,在医学CT图像数据集OrganAMNIST、OrganCMNIST、OrganSMNIST上也取得了最优或次优的性能。 展开更多
关键词 数字孪生 联邦类增量学习 混合知识蒸馏 数据异构 图像分类 灾难性遗忘 CT图像 联邦学习
在线阅读 下载PDF
采用原型学习的类概念漂移网络数据检测与分类算法 被引量:1
20
作者 陈坤 李青 +2 位作者 褚瑞娟 樊讯池 王润泽 《信息工程大学学报》 2025年第1期14-20,共7页
受网络设备更新、通信协议升级等影响,网络数据的分布、类别和属性发生不可预知的漂移特性,导致基于机器学习的网络数据分类模型的分类精度下降。针对此问题,提出一种采用原型学习的类概念漂移网络数据检测与分类算法。该算法从时间序... 受网络设备更新、通信协议升级等影响,网络数据的分布、类别和属性发生不可预知的漂移特性,导致基于机器学习的网络数据分类模型的分类精度下降。针对此问题,提出一种采用原型学习的类概念漂移网络数据检测与分类算法。该算法从时间序列的角度处理网络数据,利用带有注意力机制的网络提取数据的时空特征。借鉴原型学习思想,使用样本与原型之间的距离进行分类。当发生类概念漂移时,设定合适的阈值以区分新类,并使用其均值更新原型矩阵。实验结果表明,使用原型匹配分类不仅比传统的softmax分类器准确率高,且当数据发生类概念漂移时,所提算法能够有效检测漂移,并在漂移数据上能够表现出较好的分类性能。 展开更多
关键词 原型学习 概念漂移 新类检测 网络数据
在线阅读 下载PDF
上一页 1 2 50 下一页 到第
使用帮助 返回顶部