期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
GA-Mixup:一种基于特征对齐插值的样本增广方法
1
作者 井晶 《电脑知识与技术》 2025年第9期18-21,28,共5页
针对复杂特殊环境下样本数据稀缺的问题,文章提出了一种基于特征对齐插值的样本增广方法——GA-Mixup。该方法通过在特征空间内进行几何对齐和插值,生成融合了不同图像几何信息和外观纹理的新样本。在多个图像分类数据集上的实验结果表... 针对复杂特殊环境下样本数据稀缺的问题,文章提出了一种基于特征对齐插值的样本增广方法——GA-Mixup。该方法通过在特征空间内进行几何对齐和插值,生成融合了不同图像几何信息和外观纹理的新样本。在多个图像分类数据集上的实验结果表明,GA-Mixup相比现有前沿算法,在提升准确率的同时降低了计算成本。例如,在ImageNet数据集上,GA-Mixup的准确率提升了1.82%,计算量降低了1.88至2.03倍。 展开更多
关键词 样本增广 特征对齐 图像插值 几何对齐 mixup
在线阅读 下载PDF
前缀标签嵌入的参数高效微调与预测分数引导Mixup的文本分类方法
2
作者 庞宇宏 线岩团 +1 位作者 相艳 黄于欣 《微电子学与计算机》 2025年第2期31-38,共8页
文本分类旨在根据文本的特征,将其划分到一个或多个类别中。目前,在面对文本对抗攻击时,传统的深度学习模型和微调预训练语言模型往往面临着过拟合问题。由于训练数据的特定性,使得模型在处理与训练数据分布不同的对抗性样本时,无法充... 文本分类旨在根据文本的特征,将其划分到一个或多个类别中。目前,在面对文本对抗攻击时,传统的深度学习模型和微调预训练语言模型往往面临着过拟合问题。由于训练数据的特定性,使得模型在处理与训练数据分布不同的对抗性样本时,无法充分泛化,进而降低了模型在对抗性攻击场景中的鲁棒性。一些参数高效的微调方法采用轻量级的模型结构,由于相对较低的表达能力使得模型无法有效捕捉对抗性攻击的复杂特征,导致其鲁棒性差。此外,在模型分类过程中,无论是用于分类的特征向量还是起到引导作用的前缀向量,对分类结果的影响机制尚未得到清晰的认识导致模型的可解释性差。本文提出一个新的方法,将前缀标签嵌入与预训练语言模型融合,在分类层面引入标签与文本相似度的打分机制,通过预测分数引导下的Mixup,有效地挖掘与分类密切相关的特征,缓解过拟合问题,提升模型的鲁棒性。同时结合多头机制,使模型获得更加丰富的特征表达,提升模型可解释性。实验表明,该框架在保持参数高效微调前提下提高了针对4种不同类型的文本攻击的鲁棒性,同时保持了干净文本的可比准确性。 展开更多
关键词 文本分类 鲁棒性 预训练语言模型 前缀标签嵌入 mixup数据增强 参数高效微调
在线阅读 下载PDF
CVNN-TMN:基于Mixup增强的少样本特定辐射源识别方法
3
作者 胡治隆 谭伟杰 牛坤 《贵州师范大学学报(自然科学版)》 北大核心 2025年第5期66-75,共10页
特定辐射源识别(Specific emitter identification,SEI)通过分析设备信号硬件特征保障物联网数据安全。现有的深度学习方法在进行特定辐射源识别时,样本数量受限,过于依赖大量已标记样本,无法做到高区分度表征,存在识别性能差的问题。... 特定辐射源识别(Specific emitter identification,SEI)通过分析设备信号硬件特征保障物联网数据安全。现有的深度学习方法在进行特定辐射源识别时,样本数量受限,过于依赖大量已标记样本,无法做到高区分度表征,存在识别性能差的问题。针对这些问题,提出了基于样本插值(Mixup)增强的少样本SEI方法。首先采用Mixup的增强方式来扩展无线电信号样本的数量解决标注样本不足的问题;其次,基于孪生神经网络与复数神经网络(Complex-valued neural networks,CVNN)构建变体三元组网络(Triplet margin network based on CVNN,CVNN-TMN)提高模型的泛化能力和区分度,实现了少样本场景下特定辐射源的精准识别。实验结果表明,与现有多种先进SEI方法对比,在训练集和测试集样本划分比例不同情况下,提出的CVNN-TMN识别精度整体有5%~30%的提升,表明所构建的CVNN-TMN模型在区分度上的优异表现。 展开更多
关键词 特定辐射源识别 少样本学习 mixup 复数神经网络 三元组损失
在线阅读 下载PDF
A Compact Manifold Mixup Feature-Based Open-Set Recognition Approach for Unknown Signals
4
作者 Yang Ying Zhu Lidong +1 位作者 Li Chengjie Sun Hong 《China Communications》 2025年第4期322-338,共17页
There are all kinds of unknown and known signals in the actual electromagnetic environment,which hinders the development of practical cognitive radio applications.However,most existing signal recognition models are di... There are all kinds of unknown and known signals in the actual electromagnetic environment,which hinders the development of practical cognitive radio applications.However,most existing signal recognition models are difficult to discover unknown signals while recognizing known ones.In this paper,a compact manifold mixup feature-based open-set recognition approach(OR-CMMF)is proposed to address the above problem.First,the proposed approach utilizes the center loss to constrain decision boundaries so that it obtains the compact latent signal feature representations and extends the low-confidence feature space.Second,the latent signal feature representations are used to construct synthetic representations as substitutes for unknown categories of signals.Then,these constructed representations can occupy the extended low-confidence space.Finally,the proposed approach applies the distillation loss to adjust the decision boundaries between the known categories signals and the constructed unknown categories substitutes so that it accurately discovers unknown signals.The OR-CMMF approach outperformed other state-of-the-art open-set recognition methods in comprehensive recognition performance and running time,as demonstrated by simulation experiments on two public datasets RML2016.10a and ORACLE. 展开更多
关键词 manifold mixup open-set recognition synthetic representation unknown signal recognition
在线阅读 下载PDF
基于TensorMixup的脑胶质瘤全自动分割 被引量:1
5
作者 计亚荣 王瑜 +1 位作者 肖洪兵 邢素霞 《中国医学物理学杂志》 CSCD 2022年第12期1502-1509,共8页
脑胶质瘤及其子区域的全自动分割对临床脑胶质瘤患者的诊断、治疗与病情监控具有重要意义。本文改进传统Mixup方法,提出TensorMixup模型,并将其应用于三维U-Net脑胶质瘤分割任务。算法核心思想包括,首先从两位患者相同模态的核磁共振脑... 脑胶质瘤及其子区域的全自动分割对临床脑胶质瘤患者的诊断、治疗与病情监控具有重要意义。本文改进传统Mixup方法,提出TensorMixup模型,并将其应用于三维U-Net脑胶质瘤分割任务。算法核心思想包括,首先从两位患者相同模态的核磁共振脑影像中分别获取肿瘤区域所在边界框的图像序列,并从获取的图像序列中选取尺寸为128×128×128体素的图像块,然后使用一个所有元素均独立采样于贝塔分布的张量,混合图像块的信息,接着将上述张量映射为矩阵,用于混合图像块的独热编码标签序列,从而合成新图像及其标注数据,最后使用合成数据训练模型,以提高模型的分割精度。在BraTs2019数据集的测试结果显示,本文算法在完整肿瘤、肿瘤核心与增强肿瘤区域的平均Dice值依次可达91.32%、85.67%与82.20%,证明使用TensorMixup进行脑胶质瘤分割,具有可行性与有效性。 展开更多
关键词 脑胶质瘤 Tensormixup mixup 数据增强 深度学习
在线阅读 下载PDF
融合类别先验Mixup数据增强的罪名预测方法 被引量:6
6
作者 线岩团 陈文仲 +2 位作者 余正涛 张亚飞 王红斌 《自动化学报》 EI CAS CSCD 北大核心 2022年第8期2097-2107,共11页
罪名预测是人工智能技术应用于司法领域的代表性任务.该任务根据案情描述和事实预测被告人被判的罪名.由于各类罪名样本数量高度不平衡,分类模型训练时分类器易偏向高频罪名类别,从而导致低频罪名预测性能不佳.针对罪名预测类别不平衡问... 罪名预测是人工智能技术应用于司法领域的代表性任务.该任务根据案情描述和事实预测被告人被判的罪名.由于各类罪名样本数量高度不平衡,分类模型训练时分类器易偏向高频罪名类别,从而导致低频罪名预测性能不佳.针对罪名预测类别不平衡问题,提出融合类别先验Mixup数据增强策略的罪名预测模型,改进低频罪名预测效果.该模型利用双向长短期记忆网络与结构化自注意力机制学习文本向量表示,在此基础上,通过Mixup数据增强策略在向量表示空间中合成伪样本,并利用类别先验使合成样本的标签偏向低频罪名类别,以此来扩增低频罪名训练样本.实验结果表明,与现有方法相比,该方法在准确率、宏精确率、宏召回率和宏F1值上都获得了大幅提升,低频罪名预测的宏F1值提升达到13.5%. 展开更多
关键词 类别先验mixup 罪名预测 类别不平衡分类 低频罪名
在线阅读 下载PDF
基于域间Mixup微调策略的跨被试运动想象脑电信号分类算法 被引量:3
7
作者 蒋云良 周阳 +2 位作者 张雄涛 苗敏敏 张永 《智能系统学报》 CSCD 北大核心 2024年第4期909-919,共11页
为了缓解传统微调算法的灾难性遗忘问题,本文提出了一种基于域间Mixup微调策略的跨被试运动想象脑电信号分类算法Mix-Tuning。Mix-Tuning通过预训练、微调的二阶段训练方式,实现跨领域知识迁移。预训练阶段,Mix-Tuning使用源域数据初始... 为了缓解传统微调算法的灾难性遗忘问题,本文提出了一种基于域间Mixup微调策略的跨被试运动想象脑电信号分类算法Mix-Tuning。Mix-Tuning通过预训练、微调的二阶段训练方式,实现跨领域知识迁移。预训练阶段,Mix-Tuning使用源域数据初始化模型参数,挖掘源域数据潜在信息。微调阶段,Mix-Tuning通过域间Mixup,生成域间插值数据微调模型参数。域间Mixup数据增强策略引入源域数据潜在信息,缓解传统微调算法在样本稀疏场景下的灾难性遗忘问题,提高模型的泛化性能。Mix-Tuning被进一步应用于运动想象脑电信号分类任务,实现了跨被试正向知识迁移。Mix-Tuning在BMI数据集的运动想象任务达到了85.50%的平均分类准确率,相较于被试–依赖和被试–独立训练方式的预测准确率58.72%和84.01%,分别提高26.78%和1.49%。本文分析结果可为跨被试运动想象脑电信号分类算法提供参考。 展开更多
关键词 域间mixup 预训练 微调 脑电信号 运动想象 跨被试知识迁移 卷积神经网络 正则化
在线阅读 下载PDF
基于多尺度卷积神经网络和类内mixup操作的磁瓦表面质量识别 被引量:4
8
作者 张京爱 王江涛 《计算机应用》 CSCD 北大核心 2021年第1期275-279,共5页
铁氧体磁瓦由于形状的不规则性和表面缺陷的多样性给基于计算机视觉的表面质量识别带来很大的挑战。针对该问题,将深度学习技术引入到磁瓦表面质量识别中,提出一种基于卷积神经网络的磁瓦表面质量识别系统。首先将磁瓦目标从采集到的图... 铁氧体磁瓦由于形状的不规则性和表面缺陷的多样性给基于计算机视觉的表面质量识别带来很大的挑战。针对该问题,将深度学习技术引入到磁瓦表面质量识别中,提出一种基于卷积神经网络的磁瓦表面质量识别系统。首先将磁瓦目标从采集到的图像中分割出来并进行旋转从而得到标准图像,然后把改进后的多尺度ResNet18作为骨干网络来设计识别系统。训练时,设计一种新颖的类内mixup操作来提高系统对样本的泛化能力。为了更加贴近实际应用场景,在考虑到光线变化、姿态差异等因素的前提下构建了磁瓦缺陷数据集。在自建的数据集中进行实验的结果表明,该系统可以达到97.9%的识别准确率,为磁瓦缺陷的自动识别提供了可行的思路。 展开更多
关键词 磁瓦 表面缺陷检测 卷积神经网络 mixup ResNet18
在线阅读 下载PDF
一种融合多通道CycleGAN和Mixup的情感语音合成方法 被引量:4
9
作者 贾宁 郑纯军 《现代电子技术》 2022年第15期80-87,共8页
现有的循环一致性生成对抗网络(CycleGAN)提供了一个双向情感语料转化的突破,但是真实目标和转换后的语音之间仍然存在很大的差距。为了缩小这一差距,提出融合多通道CycleGAN和Mixup的情感语音合成方法,包含三个阶段:多通道CycleGAN、基... 现有的循环一致性生成对抗网络(CycleGAN)提供了一个双向情感语料转化的突破,但是真实目标和转换后的语音之间仍然存在很大的差距。为了缩小这一差距,提出融合多通道CycleGAN和Mixup的情感语音合成方法,包含三个阶段:多通道CycleGAN、基于Mixup的损失估计和基于Mixup的有效情感区域加重。其中,设计门控单元GTLU和音频显著性区域的图像表达方法,结合基于改进GTLU的全局CycleGAN和基于显著性区域的局部CycleGAN构成了第一个阶段中的多通道CycleGAN,基于Mixup方法设计了损失的计算方法和情感区域的不同加重程度计算。结合多项流行的语音合成方法,在IEMOCAP情感语料库上实施了多组生成情感语料的对比实验,利用双向三层长短期记忆网络(LSTM)模型作为验证模型,实验结果证明,所提出的情感语音合成方法获得的语音,其平均意见得分(MOS)和语音情感识别精度(UA)均有不同程度的提升,分别获得3.4%和2.7%的改善,在主观评价和客观实验上均优于现有的GANs模型,从而确保该模型生成语音具备高可靠性和良好的自然度。 展开更多
关键词 情感语音合成 多通道CycleGAN mixup GTLU 图像重构 损失估计 有效情感区域加重
在线阅读 下载PDF
基于Mixup算法和卷积神经网络的柑橘黄龙病果实识别研究 被引量:26
10
作者 陆健强 林佳翰 +4 位作者 黄仲强 王卫星 邱洪斌 杨瑞帆 陈平福 《华南农业大学学报》 CAS CSCD 北大核心 2021年第3期94-101,共8页
【目的】解决传统柑橘黄龙病果实图像识别方法依赖人工设计特征、费时费力、网络模型参数量大、识别准确率低等问题。【方法】首先,采集柑橘黄龙病的果实图像,并对其进行翻转、旋转、仿射、高斯扰动等数据扩增;采用Mixup算法建立样本之... 【目的】解决传统柑橘黄龙病果实图像识别方法依赖人工设计特征、费时费力、网络模型参数量大、识别准确率低等问题。【方法】首先,采集柑橘黄龙病的果实图像,并对其进行翻转、旋转、仿射、高斯扰动等数据扩增;采用Mixup算法建立样本之间的线性关系,增强模型识别数据样本的鲁棒性;然后,迁移Xception网络在ImageNet数据集上的先验知识,提出一种基于Mixup算法和卷积神经网络的柑橘黄龙病果实识别模型-XResNeXt模型;最后,采用动量梯度下降优化方法,有效地减缓震荡影响,并且有效地加速模型向局部最优点收敛。【结果】采用数据扩增数据集训练的X-ResNeXt模型准确率可以达到91.38%;在进行迁移学习优化后,训练时间减少了432 s,准确率提升为91.97%;结合Mixup混类数据增强进一步训练,模型准确率提升为93.74%;最后,利用动量梯度下降方法进行模型收敛优化,最终模型的准确率达到94.29%,比Inception-V3和Xception网络分别提高了3.98%和1.51%。【结论】在数据量较少情况下,降低模型复杂度并迁移已有先验知识,有助于模型性能提升;Mixup混类数据增强方法有利于提高模型识别柑橘黄龙病果实图像样本的适应性,提升柑橘黄龙病果实识别模型性能;X-ResNeXt模型在准确率与召回率指标上优于经典识别模型,可为柑橘黄龙病的高精度、快速无损识别提供参考。 展开更多
关键词 柑橘黄龙病 mixup算法 梯度下降 卷积神经网络 Xception网络
在线阅读 下载PDF
基于LBP和Mixup数据增强后的肺音识别 被引量:1
11
作者 古依聪 郭涛 +2 位作者 李成 刘启明 石帅 《计算机与数字工程》 2023年第1期268-272,共5页
肺音蕴含着重要的生理病理信息。对肺音进行智能化识别,是推进医疗现代化的一种重要方式。论文针对肺音分类问题,采用梅尔谱图(Mel)、小波变换(WT)、短时傅里叶变换(STFT)、恒Q变换(CQT)四种方法进行特征提取,并且使用构建的卷积神经网... 肺音蕴含着重要的生理病理信息。对肺音进行智能化识别,是推进医疗现代化的一种重要方式。论文针对肺音分类问题,采用梅尔谱图(Mel)、小波变换(WT)、短时傅里叶变换(STFT)、恒Q变换(CQT)四种方法进行特征提取,并且使用构建的卷积神经网络(CNN)和卷积神经网络与随机子空间判别结合法(CNN-RSM)对肺音进行分类。最终Mel谱图在CNN-RSM的测试集中的准确率为76.01%,特异度为89.7%,ICBHI得分为66.38%。经过与使用同一数据库的其他作者综合对比,本文肺音识别方法更具优势。 展开更多
关键词 梅尔谱图 卷积神经网络 随机子空间判别 局部二值模式 mixup
在线阅读 下载PDF
基于Mixup训练及多模型决策融合的腰椎间盘突出诊断 被引量:1
12
作者 李英 陈健 +2 位作者 苏志海 海金金 闫镔 《信息工程大学学报》 2024年第3期265-271,共7页
医疗多中心数据集的分布是存在差异的,由单一中心数据集训练的模型泛化性往往不佳,导致训练好的模型在应用时受到很大的限制。Mixup训练方法能够有效提升模型泛化性,基于Dempster-Shafer证据理论(Dempster-Shafer Evidence Theory,DST)... 医疗多中心数据集的分布是存在差异的,由单一中心数据集训练的模型泛化性往往不佳,导致训练好的模型在应用时受到很大的限制。Mixup训练方法能够有效提升模型泛化性,基于Dempster-Shafer证据理论(Dempster-Shafer Evidence Theory,DST)的模型融合方法能够有效融合多个模型的最佳决策。因此,针对单一中心训练的医疗模型泛化性较差的问题,通过Mixup训练增强模型的泛化性能,并采用多模型决策融合的方式获得最佳决策结果,提出了一个针对腰椎间盘突出诊断的有效模型。经过外部测试集测试,该方法获得了88.22%的分类准确率、88.12%的F1分数和87.69%的AUC值。 展开更多
关键词 腰椎核磁影像 腰椎间盘突出诊断 mixup 多模型决策融合
在线阅读 下载PDF
基于Mixup数据增强的LSTM-FCN时间序列分类 被引量:4
13
作者 王天 刘兆英 +2 位作者 张婷 刘博文 李玉鑑 《应用科技》 CAS 2022年第2期8-14,共7页
在时间序列分类任务中,针对时间序列数据少和多样性导致深度学习模型准确率不高的问题,提出Mixup数据增强的长短期记忆网络–全卷积网络(LSTM-FCN)时间序列分类算法。该算法首先使用Mixup对原始数据进行数据增强,通过简单的线性插值对... 在时间序列分类任务中,针对时间序列数据少和多样性导致深度学习模型准确率不高的问题,提出Mixup数据增强的长短期记忆网络–全卷积网络(LSTM-FCN)时间序列分类算法。该算法首先使用Mixup对原始数据进行数据增强,通过简单的线性插值对时序数据进行混合,得到新的混合之后的增强数据;然后使用增强数据训练LSTM-FCN,并进行分类。在30个UCRArchive2018数据集上的实验结果表明,使用Mixup数据增强的LSTM-FCN在26数据集上取得了比LSTM-FCN好的分类准确率,最高提高了4.79%。实验结果说明了本文方法可以提高深度学习模型的分类准确率。 展开更多
关键词 时间序列 时间序列分类 数据增强 mixup 长短期记忆网络–全卷积网络 深度学习 UCRArchive2018数据集 线性插值
在线阅读 下载PDF
Borderline-mixup不平衡数据集分类方法
14
作者 吴振煊 郭躬德 王晖 《计算机系统应用》 2023年第11期73-82,共10页
不平衡数据集问题从20年前就已经引起人们的重视,提出的相关解决方法层出不穷.Mixup是这几年比较流行的数据合成方法,其相关变体比比皆是,但是针对不平衡数据集提出的Mixup变体寥寥无几.本文针对不平衡数据集分类问题,提出了Mixup的变... 不平衡数据集问题从20年前就已经引起人们的重视,提出的相关解决方法层出不穷.Mixup是这几年比较流行的数据合成方法,其相关变体比比皆是,但是针对不平衡数据集提出的Mixup变体寥寥无几.本文针对不平衡数据集分类问题,提出了Mixup的变体——Borderline-mixup,其使用支持向量机选择边界样本,增加边界样本在采样器中被采样的概率,构建两个边界采样器,替代了原有的随机采样器.在14个UCI数据集以及CIFAR10长尾数据集上的实验结果表明,Borderline-mixup相比于Mixup在UCI数据集中都有提升,最高能达到49.3%的提升,在CIFAR10长尾数据集中,也能达到3%–3.6%左右的提升.显然,我们提出的Mixup变体在不平衡数据集分类中是有效的. 展开更多
关键词 mixup 支持向量机 不平衡数据集 边界样本 分类
在线阅读 下载PDF
基于跨域Mixup和自监督学习的少样本高光谱图像分类 被引量:1
15
作者 王岩 张晨阳 李照奎 《激光杂志》 北大核心 2024年第12期99-105,共7页
针对目标域标记样本稀缺引起的模型泛化性能不佳问题,提出了一种基于跨域Mixup和自监督学习的少样本高光谱图像分类方法。首先,利用少样本学习从源域提取更有利于目标域分类的元知识。其次,将Mixup技术应用到少样本学习中,将源域和目标... 针对目标域标记样本稀缺引起的模型泛化性能不佳问题,提出了一种基于跨域Mixup和自监督学习的少样本高光谱图像分类方法。首先,利用少样本学习从源域提取更有利于目标域分类的元知识。其次,将Mixup技术应用到少样本学习中,将源域和目标域的查询集进行特征级Mixup,通过源域数据扩展目标域数据的分布,增加目标域数据的多样性,从而提高模型的泛化性能。最后,通过目标域自监督学习来约束少样本学习过程,以获取更鲁棒的特征表示,进而缓解模型的过拟合问题。在两个公共高光谱数据集上进行了大量实验,与现有主流方法相比,所提方法平均准确率分别提升了3.2%和3.6%以上。 展开更多
关键词 高光谱图像 跨域分类 少样本学习 mixup 自监督学习
原文传递
基于Mixup的心电图多标签异常心律检测方法 被引量:1
16
作者 倪娟 王剑卓 《自动化与信息工程》 2024年第3期51-55,共5页
针对心电图不同样本间的高变异性,以及深度学习模型泛化能力不足的问题,提出一种基于Mixup的心电图多标签异常心律检测方法。首先,通过Mixup方法将心电图与白噪声混合;然后,利用混合样本训练深度学习模型;最后,在CPSC2018数据集上进行实... 针对心电图不同样本间的高变异性,以及深度学习模型泛化能力不足的问题,提出一种基于Mixup的心电图多标签异常心律检测方法。首先,通过Mixup方法将心电图与白噪声混合;然后,利用混合样本训练深度学习模型;最后,在CPSC2018数据集上进行实验,该方法的F1分数相较于Inception-ResNet-v2、MLC-CNN、STA-CRNN分别提升了0.014、0.031、0.023。 展开更多
关键词 mixup方法 心电图 多标签 异常心律检测 深度学习模型
在线阅读 下载PDF
基于EALMDA的医疗命名实体识别数据增强方法
17
作者 道路 刘纳 +2 位作者 郑国风 李晨 杨杰 《郑州大学学报(理学版)》 北大核心 2026年第1期43-50,共8页
医疗命名实体识别是从非结构化医疗文本中识别命名实体,在许多下游任务中起重要作用。医疗命名实体的复杂性需要专家利用领域知识进行标注,导致医疗领域存在严重的标注数据稀缺问题。为解决该问题,提出了一种基于实体感知掩码局部融合... 医疗命名实体识别是从非结构化医疗文本中识别命名实体,在许多下游任务中起重要作用。医疗命名实体的复杂性需要专家利用领域知识进行标注,导致医疗领域存在严重的标注数据稀缺问题。为解决该问题,提出了一种基于实体感知掩码局部融合命名实体识别数据增强(entity aware mask local mixup data augmentation,EALMDA)方法。首先,使用实体感知掩码通道提取关键元素并掩码非实体部分,以保留核心语义。其次,通过上下文实体相似度和k近邻两种采样策略的线性组合对掩码句子进行融合,保留核心语义的同时增加样本的多样性。最后,经序列线性化操作后,将句子输入生成的模型中得到增强样本。在NCBI-disease等五个主流医疗命名实体识别数据集上,模拟低资源场景与主流的数据增强基线方法进行对比实验,所提方法的性能相比基线方法有显著提升。 展开更多
关键词 数据增强 命名实体识别 自然语言处理 生成模型 mixup
在线阅读 下载PDF
基于Mixup数据增强的可再生能源场景生成方法
18
作者 贺誉 江聪美 张良恒 《建模与仿真》 2024年第4期4664-4673,共10页
随着可再生能源渗透率的持续提升,其出力不确定性所带来的挑战也日益凸显。如何精准刻画可再生能源的不确定性,为电力系统安全运行、调度以及规划等相关决策提供科学的数据支撑已成为当前研究的热点之一。生成式对抗网络(Generative Adv... 随着可再生能源渗透率的持续提升,其出力不确定性所带来的挑战也日益凸显。如何精准刻画可再生能源的不确定性,为电力系统安全运行、调度以及规划等相关决策提供科学的数据支撑已成为当前研究的热点之一。生成式对抗网络(Generative Adversarial Networks,GAN)因其强大的特征提取能力和生成能力被广泛应用于可再生能源不确定性建模任务中。然而研究表明GAN的训练稳定性、在小样本数据集上的生成效果、对风光出力数据的特征提取能力等存在不足。本文针对以上存在的问题,深入研究了改进GAN模型的搭建以及Mixup数据增强策略在生成模型中的植入方法采用了Wasserstein条件生成式对抗网络(Wasserstein Conditional Generative Adversarial Networks,WCGAN)提升模型的训练稳定性,并且可以生成特定标签的可再生能源场景。并且在生成模型数据处理阶段引入Mixup数据增强策略,通过对输入的原始样本数据以及其标签信息进行线性插值,混合形成新的样本,增扩模型的输入数据,使得生成模型能够在只有小样本数据量作为输入时依然能够训练达到拟合。本文提出的基于WCGAN-GP与Mixup的可再生能源场景生成模型相比于传统GAN模型,其训练过程更加稳定,并且能够在原始输入数据量较小的极端情况下,也能充分捕捉可再生能源出力的时空特性,生成高质量的可再生能源场景。 展开更多
关键词 场景生成 可再生能源 生成对抗网络 数据增强 mixup 小样本训练
在线阅读 下载PDF
基于FSLSTM的架空输电线路覆冰预测
19
作者 汪峰 马梓茗 《自然灾害学报》 北大核心 2025年第4期190-201,共12页
为了提高架空输电线路覆冰预测模型精度,提出了一种考虑覆冰和气象因素相关性的输电线路覆冰预测模型。首先,采用滑动窗口分解将导线覆冰数据分解为趋势分量和季节分量,减小原始数据的复杂性。然后,通过傅里叶变换求得覆冰数据的核心周... 为了提高架空输电线路覆冰预测模型精度,提出了一种考虑覆冰和气象因素相关性的输电线路覆冰预测模型。首先,采用滑动窗口分解将导线覆冰数据分解为趋势分量和季节分量,减小原始数据的复杂性。然后,通过傅里叶变换求得覆冰数据的核心周期,按该周期将覆冰数据分段,构建基于傅里叶变换分段长短期记忆网络(Fourier transform segmented long shortterm memory network,FSLSTM),捕获覆冰数据的局部相关性和全局相关性。最后,通过数据增强算法(Mixup)扩大导线覆冰数据,提高预测模型的泛化性能。结果表明,所提出的预测模型精度较高,相比于传统的长短期记忆(long short-term memory,LSTM)网络等预测模型,其均方误差为0.097和0.079,平均绝对误差为0.232和0.220,平均绝对百分比误差为5.19%和8.08%。覆冰厚度对温度最为敏感,其次是湿度和风速,光照和压强较弱。 展开更多
关键词 覆冰预测 滑动窗口分解 傅里叶变换 长短期记忆网络 mixup
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部