期刊文献+
共找到227篇文章
< 1 2 12 >
每页显示 20 50 100
基于伪标签的二阶段时序半监督学习框架
1
作者 彭鸿鑫 骆淑云 罗志一 《电子科技》 2026年第2期9-18,共10页
针对部分场景下时序分类问题中标签数据稀缺问题,文中提出了一种基于伪标签的二阶段时序半监督学习框架。在第1阶段,利用对比学习进行训练,构建基分类模型,并对无标签数据进行类别标记。在第2阶段,借助合适的伪标签技术对模型进行再训练... 针对部分场景下时序分类问题中标签数据稀缺问题,文中提出了一种基于伪标签的二阶段时序半监督学习框架。在第1阶段,利用对比学习进行训练,构建基分类模型,并对无标签数据进行类别标记。在第2阶段,借助合适的伪标签技术对模型进行再训练,以充分利用标签数据和无标签数据之间的紧密关联来提升模型性能。在多个公开时序分类数据集进行实验来验证所提框架的有效性,并对不同第2阶段伪标签训练方法的适用条件进行深入探讨。实验结果表明,在标签数据比例仅为1%和5%的情况下,所提学习框架在两个基模型和多个数据集上的准确率平均提升了约5.1%和3.5%,充分证明了所提方法能够有效解决半监督时序分类问题。 展开更多
关键词 半监督分类 时序数据 学习框架 伪标签技术 二阶段训练 对比学习 预训练 模型微调
在线阅读 下载PDF
Multilevel Modeling of Binary Outcomes with Three-Level Complex Health Survey Data
2
作者 Shafquat Rozi Sadia Mahmud +2 位作者 Gillian Lancaster Wilbur Hadden Gregory Pappas 《Open Journal of Epidemiology》 2017年第1期27-43,共17页
Complex survey designs often involve unequal selection probabilities of clus-ters or units within clusters. When estimating models for complex survey data, scaled weights are incorporated into the likelihood, producin... Complex survey designs often involve unequal selection probabilities of clus-ters or units within clusters. When estimating models for complex survey data, scaled weights are incorporated into the likelihood, producing a pseudo likeli-hood. In a 3-level weighted analysis for a binary outcome, we implemented two methods for scaling the sampling weights in the National Health Survey of Pa-kistan (NHSP). For NHSP with health care utilization as a binary outcome we found age, gender, household (HH) goods, urban/rural status, community de-velopment index, province and marital status as significant predictors of health care utilization (p-value < 0.05). The variance of the random intercepts using scaling method 1 is estimated as 0.0961 (standard error 0.0339) for PSU level, and 0.2726 (standard error 0.0995) for household level respectively. Both esti-mates are significantly different from zero (p-value < 0.05) and indicate consid-erable heterogeneity in health care utilization with respect to households and PSUs. The results of the NHSP data analysis showed that all three analyses, weighted (two scaling methods) and un-weighted, converged to almost identical results with few exceptions. This may have occurred because of the large num-ber of 3rd and 2nd level clusters and relatively small ICC. We performed a sim-ulation study to assess the effect of varying prevalence and intra-class correla-tion coefficients (ICCs) on bias of fixed effect parameters and variance components of a multilevel pseudo maximum likelihood (weighted) analysis. The simulation results showed that the performance of the scaled weighted estimators is satisfactory for both scaling methods. Incorporating simulation into the analysis of complex multilevel surveys allows the integrity of the results to be tested and is recommended as good practice. 展开更多
关键词 HEALTH Care Utilization COMPLEX HEALTH SURVEY with Sampling WEIGHTS Simulations for COMPLEX SURVEY pseudo LIKELIHOOD THREE-LEVEL data
暂未订购
多源数据融合的航空发动机轴承智能故障诊断
3
作者 刘涵 刘勤明 +1 位作者 叶春明 汪宇杰 《计算机集成制造系统》 北大核心 2025年第11期4191-4210,共20页
为应对航空发动机轴承在极端复杂工况下的故障诊断需求,提出了一种新的航空发动机轴承高精度智能故障诊断方法。首先,构建了具有一维自适应归一化卷积神经网络模块和一维物理特性指导的卷积神经网络模块的双通道伪孪生神经网络,有效应... 为应对航空发动机轴承在极端复杂工况下的故障诊断需求,提出了一种新的航空发动机轴承高精度智能故障诊断方法。首先,构建了具有一维自适应归一化卷积神经网络模块和一维物理特性指导的卷积神经网络模块的双通道伪孪生神经网络,有效应对多源传感器数据的融合问题,提取关键特征并实现多源数据的高效融合。其次,采用星雀优化算法优化门控循环单元模块进行故障状态识别,提高了模型的自适应性、鲁棒性及泛化能力,特别是在复杂工况和噪声环境下。最后,通过算例验证模型的有效性,提出方法的故障诊断准确率分别达到99.99%、100%和100%,与现有几种诊断方法对比,所提方法的识别准确率最高提高了23.97%,展现出明显的性能优势。此外,进行了泛化能力验证实验与噪声对抗实验,结果表明了其优越的抗噪声能力和强大的泛化性能。 展开更多
关键词 多源传感器数据 故障诊断 伪孪生神经网络 星雀优化算法 门控循环单元
在线阅读 下载PDF
基于智能手机的地下车库北斗伪卫星信号分析
4
作者 王新龙 蔚保国 +3 位作者 张衡 黄璐 程建强 毕京学 《计算机测量与控制》 2025年第2期203-211,共9页
随着全球卫星导航系统不断完善和经济社会快速发展,人们对室内位置服务需求日趋强烈,对于智能手机端的室内高精度定位技术研究蓬勃发展;针对商用智能手机接收北斗伪卫星信号实现室内定位难题,开展智能手机端的北斗室内伪卫星观测数据质... 随着全球卫星导航系统不断完善和经济社会快速发展,人们对室内位置服务需求日趋强烈,对于智能手机端的室内高精度定位技术研究蓬勃发展;针对商用智能手机接收北斗伪卫星信号实现室内定位难题,开展智能手机端的北斗室内伪卫星观测数据质量分析工作,选取多款主流品牌智能手机,分别从数据完整率、周跳比、载噪比、多普勒频移、载波相位等方面分析手机GNSS芯片性能,为室内停车场环境下智能手机伪卫星定位提供数据支撑,为北斗室内外一体化提供参考;研究表明:在地下停车场环境下,静止状态时部分手机的载噪比,星间载波相位差的数据连续性稳定性已经可以达到专用测量接收机水平;步行状态下,部分手机的星间数据差的数据质量甚至优于测量型接收机。 展开更多
关键词 数据质量分析 伪卫星 智能手机 室内定位 载波相位差
在线阅读 下载PDF
准噶尔盆地玛湖凹陷三叠系白碱滩组优质滩坝砂地震预测
5
作者 苏艳丽 叶迪 +3 位作者 钦黎明 贺陆明 王贤 徐群洲 《中国矿业》 北大核心 2025年第S1期625-630,共6页
玛湖凹陷三叠系白碱滩组滩坝砂体沉积广泛发育。研究区白二段滩坝砂体储层在横向上变化迅速,出油砂岩单层厚度较薄,储层与非储层之间弹性参数差异微小等特征,常规地震预测手段难以识别薄砂岩。本文采用井震结合的方式,并深入开展古地貌... 玛湖凹陷三叠系白碱滩组滩坝砂体沉积广泛发育。研究区白二段滩坝砂体储层在横向上变化迅速,出油砂岩单层厚度较薄,储层与非储层之间弹性参数差异微小等特征,常规地震预测手段难以识别薄砂岩。本文采用井震结合的方式,并深入开展古地貌分析,在充分了解地质条件的基础上,综合运用地震多属性刻画岩相的展布特征。针对传统阻抗曲线无法有效识别细砂岩这一难题,通过拟声波阻抗地震反演技术,准确识别出油细砂岩。因此,建立了一套适用于研究区滩坝砂岩性的地震识别方法,为研究区后续的评价与开发工作提供了关键的技术支撑,有力推动了相关勘探开发进程。 展开更多
关键词 滩坝砂体 井震结合 古地貌分析 地震属性 拟声波阻抗
在线阅读 下载PDF
多光谱激光雷达伪监测数据的纠正技术 被引量:1
6
作者 丁华峰 曹元 《现代雷达》 北大核心 2025年第6期39-45,共7页
由于温度变化、机械振动和电磁干扰等因素造成的耦合干扰,使得多光谱激光雷达(LiDAR)伪监测数据不能真实反映目标物体的实际信息,致使数据失真。为了提高多光谱LiDAR数据的准确性和可靠性,需对多光谱LiDAR伪监测数据进行纠正。首先,使... 由于温度变化、机械振动和电磁干扰等因素造成的耦合干扰,使得多光谱激光雷达(LiDAR)伪监测数据不能真实反映目标物体的实际信息,致使数据失真。为了提高多光谱LiDAR数据的准确性和可靠性,需对多光谱LiDAR伪监测数据进行纠正。首先,使用去均值方式消除多光谱LiDAR测量过程中环境温度引起的偏差问题,并采用五点三次平滑法进一步去除机械振动导致的干扰噪声;然后,通过最小二乘法去除趋势项,解决电磁干扰对数据的影响,实现多光谱LiDAR伪监测数据预处理;最后,在已知基站位置的基础上,采用伪距差分法实现对多光谱LiDAR伪监测数据的纠正。实验结果表明,所提方法获取的多光谱LiDAR测量效果较好,具有较小的位移频率监测误差,可以有效提高测量结果的准确性和可靠性。 展开更多
关键词 多光谱激光雷达 伪监测数据 信号预处理 耦合干扰消除 数据纠正
原文传递
基于灰色关联分析与混合模型的煤矿甲烷伪数据识别研究 被引量:1
7
作者 刘雄 赵鹏 +10 位作者 李雪峰 郝永 张增荣 李成 贺宇 薛挺 胡云 孟庆林 梁光清 吴科 王炎培 《煤矿安全》 北大核心 2025年第12期19-25,共7页
为解决现有方法对趋势型伪数据识别能力不足的问题,研究并构建了融合灰色关联分析与混合模型的煤矿甲烷伪数据识别方法。首先,以灰色关联分析(Grey Relational Analysis,GRA)为特征提取核心,通过与甲烷浓度高度相关的温度、湿度、风速... 为解决现有方法对趋势型伪数据识别能力不足的问题,研究并构建了融合灰色关联分析与混合模型的煤矿甲烷伪数据识别方法。首先,以灰色关联分析(Grey Relational Analysis,GRA)为特征提取核心,通过与甲烷浓度高度相关的温度、湿度、风速、气压等环境变量构建比较序列,筛选关键特征,并结合小波阈值降噪、支持向量机异常识别及心跳压缩机制,形成了多环节数据清洗链;其次,设计了自回归积分滑动平均(Auto Regressive Integrated Moving Average,ARIMA)与长短期记忆网络(Long Short-Term Memory,LSTM)串联的预测结构,先由LSTM建模非线性时序,再以ARIMA对残差趋势修正,并利用均方根误差(Root Mean Square Error,RMSE)动态阈值实现伪数据的自动识别。试验结果表明:所提模型在500组样本上的识别准确率为87%,RMSE为0.09,平均绝对误差(Mean Absolute Error,MAE)为0.04,平均响应时间仅33 ms;在趋势型伪数据检测中,伪数据识别率达85%,数据恢复率达93%。与自编码器(Auto Encoder)及卷积神经网络(Convolutional Neural Network,CNN)-长短期记忆网络相比,该模型在有限样本下识别率接近96%,损失值收敛更快,并在多类实际矿井场景中保持最低均方误差(Mean Square Error,MSE),其中高瓦斯作业面MSE约0.43,显著低于对照模型的0.66和0.75。消融实验进一步验证了GRA特征筛选、ARIMA趋势修正及RMSE动态阈值的关键作用。 展开更多
关键词 伪数据识别 煤矿安全监控系统 智能监测 灰色关联分析 ARIMA LSTM 趋势漂移检测
在线阅读 下载PDF
持续测试时域自适应图像分类方法 被引量:1
8
作者 陆霆洋 吕凡 +2 位作者 周涛 姚睿 胡伏原 《中国图象图形学报》 北大核心 2025年第8期2660-2674,共15页
目的持续测试时适应(continual test-time adaption,CTTA)旨在不使用任何源数据情况下,使源预训练模型适应持续变化的目标域。目前持续测试时适应主要依赖于自训练方法,在基于平均教师模型框架下将数据增强后样本的预测值作为伪标签,构... 目的持续测试时适应(continual test-time adaption,CTTA)旨在不使用任何源数据情况下,使源预训练模型适应持续变化的目标域。目前持续测试时适应主要依赖于自训练方法,在基于平均教师模型框架下将数据增强后样本的预测值作为伪标签,构建一致性损失函数实现模型的自训练。然而,现有方法中使用随机数据增强策略忽视了域间差异的重要性,导致模型稳定性和泛化性失衡等问题,使得在某些域间进行知识转移变得更具挑战性。为此,提出一种面向域间差异的持续测试时适应方法,聚焦于计算机视觉领域中的图像分类任务,探讨如何通过持续测试时适应技术提升模型对新域的适应能力。方法首先,提出一种基于域间差异的弹性数据增强策略。通过构建表示域间特征风格的Gram矩阵,计算相邻域间的差异,选取合适的弹性因子控制数据增强的强度,在数据预处理层面考虑域间差异性,使模型能更好地适应域复杂多变的情况。其次,提出一种全局弹性对称交叉熵损失函数。将基于域间差异计算取得的弹性因子应用于伪标签生成以及一致性损失函数的构建中,在模型优化层面考虑域间差异性,增强模型对不同域变化下的理解和适应能力。最后,提出一种基于置信度的伪标签自纠错策略。在弹性数据增强下,强数据增强通过对原始数据进行较大程度的变换来实现,模型在预测过程中可能面临预测偏差的问题,而弱数据增强涉及较小程度的变换,不会显著改变基本特征,模型对其预测的置信度较高。该策略利用高置信度的弱数据增强预测值对强数据增强的预测值进行自纠错,减少误差积累现象。结果在CIFAR10-C、CIFAR100-C和ImageNet-C 3个数据集上与多种先进算法进行比较,相较于基线方法CoTTA,错误率分别降低了约2.3%、2.7%和3.6%。在CIFAR10-C数据集中进行了消融实验,进一步验证了各个模块的有效性。为了符合更实际的域变化场景,在CIFAR100-C设计了域随机输入实验,结果显示本文方法在域随机输入的情况下错误率低于现有方法,对比基线平均错误率降低了3.9%,证明了本文方法可以有效地评估域间关系,并部署灵活策略以提升模型对持续变化目标域的适应能力。结论本文算法平衡了模型在持续测试时适应场景中的泛化性和稳定性,有效减少了误差积累现象。 展开更多
关键词 持续测试时适应(CTTA) GRAM矩阵 域间差异 全局对称交叉熵 弹性数据增强 伪标签自纠错 持续学习
原文传递
基于互一致性的半监督带钢表面缺陷检测模型
9
作者 甘青松 王亚 刘哲 《宝钢技术》 2025年第4期49-55,共7页
针对传统半监督检测模型关注位置信息不足导致伪标签不准确的问题,提出了基于互一致性的标签筛选(MCBF)策略。该策略在伪标签筛选环节,通过比较连续训练轮次中伪标签的IoU(Intersection over Union,衡量两个边界框的重合程度)评估位置变... 针对传统半监督检测模型关注位置信息不足导致伪标签不准确的问题,提出了基于互一致性的标签筛选(MCBF)策略。该策略在伪标签筛选环节,通过比较连续训练轮次中伪标签的IoU(Intersection over Union,衡量两个边界框的重合程度)评估位置变化,并结合两轮次的平均置信度来评价伪标签的稳定性,设定阈值进行筛选。在生成伪标签的阶段,分析相邻轮次的位置信息和置信度的互一致性,使网络兼顾类别置信度和位置信息。此外,设计了一种适用于带钢缺陷检测的新型数据增强策略Copy-Fill-Smooth,有效提升了检测效果。在NEU数据集和私有带钢数据集,评价指标AP@50分别达到了68.8%和66.1%,显示了该策略相比其他半监督检测模型在带钢缺陷检测领域的显著优势。 展开更多
关键词 缺陷检测 伪标签 互一致性 数据增强
在线阅读 下载PDF
基于数据增广和伪标签生成的波阻抗反演
10
作者 程程 赵岩 《石油地球物理勘探》 北大核心 2025年第3期642-654,共13页
基于深度学习的波阻抗反演往往需要大量标签数据驱动模型进行网络训练,但实际情况中标签数据(测井数据)获取难度较大、成本较高,通常只有少量的标签数据可用于训练。为此,提出一种基于数据增广和伪标签生成的半监督波阻抗反演方法。首先... 基于深度学习的波阻抗反演往往需要大量标签数据驱动模型进行网络训练,但实际情况中标签数据(测井数据)获取难度较大、成本较高,通常只有少量的标签数据可用于训练。为此,提出一种基于数据增广和伪标签生成的半监督波阻抗反演方法。首先,利用三次样条插值法对标签波阻抗数据进行插值后随机重采样;然后,用正演方法计算增广波阻抗相对应的地震记录;最后,将增广后的地震记录和波阻抗作为网络训练集,训练网络并预测波阻抗。将筛选出的高质量预测数据作为伪标签,并对伪标签进行数据增广,大量扩充训练数据集。由于时间卷积网络(Temporal Convolutional Network,TCN)在时序数据建模上具有优势,可以捕获数据的长期依赖关系,很好地完成波阻抗反演任务。Marmousi模型的测试结果显示,所提方法适用于少量标签数据的波阻抗反演问题,具有良好的抗噪性能,且对于不同的标签分布情况依旧有较好的反演精度。实际勘探数据的反演结果表明,该方法能有效地解决地震波阻抗反演问题。 展开更多
关键词 波阻抗反演 时间卷积网络 数据增广 伪标签 半监督学习
在线阅读 下载PDF
基于半监督学习的非结构化道路缺陷检测算法
11
作者 朱思远 李佳圣 +2 位作者 邹丹平 何迪 郁文贤 《计算机工程》 北大核心 2025年第9期14-24,共11页
非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义,但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题,提出一种MAM(Multi-Augmentation with Memory)半监督... 非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义,但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题,提出一种MAM(Multi-Augmentation with Memory)半监督目标检测算法。首先,引入缓存机制存储无标注图像和带有伪标注图像的框回归位置信息,避免了后续匹配造成的计算资源浪费。其次,设计混合数据增强策略,将缓存的伪标签图像与无标签图像混合输入学生模型,以增强模型对新数据的泛化能力,并使图像的尺度分布更加均衡。MAM算法不受目标检测模型的限制,并且更好地保持了目标框的一致性,避免了计算一致性损失。实验结果表明,MAM算法相比其他全监督学习和半监督学习算法更具优越性,在自建的非结构化道路缺陷数据集Defect上,在标注比例为10%、20%和30%的场景下,MAM算法的均值平均精度(mAP)相比于Soft Teacher算法分别提升了6.8、11.1和6.0百分点,在自建的非结构化道路坑洼数据集Pothole上,在标注比例为15%和30%的场景下,MAM算法的mAP相比于Soft Teacher算法分别提升了5.8和4.3百分点。 展开更多
关键词 非结构化道路 缺陷目标检测 半监督学习 伪标签 缓存机制 混合数据增强
在线阅读 下载PDF
基于单细胞测序数据探索阿尔茨海默病的发病机制
12
作者 任彦学 赵琳琳 +4 位作者 何敏 于倩 汪煜楠 黄山 张惊宇 《中国实验诊断学》 2025年第6期634-642,共9页
目的应用单细胞测序技术探索阿尔茨海默病的发病机制。方法从单细胞转录组数据库下载疾病组及对照组数据,下载后进行数据质控,利用Seurat软件进行数据整合、聚类,利用T-分布随机邻域嵌入和一致流形逼近与投影软件进行图的可视化。利用Si... 目的应用单细胞测序技术探索阿尔茨海默病的发病机制。方法从单细胞转录组数据库下载疾病组及对照组数据,下载后进行数据质控,利用Seurat软件进行数据整合、聚类,利用T-分布随机邻域嵌入和一致流形逼近与投影软件进行图的可视化。利用SingleR与人工检查的综合方式完成细胞注释,最后将进一步进行基因差异分析、拟时序分析、细胞间通讯分析。结果细胞图谱构建结果显示:疾病组细胞类型为中性粒细胞、小胶质细胞、神经元以及星形胶质细胞。对照组细胞类型为神经元与星形胶质细胞;基因表达差异结果显示:CD74、B2M、SPP1、NEAT等基因在两组数据中均差值较为显著;拟时序分析结果显示:疾病组中神经元分布不均,对照组中的神经元均匀分布,星形胶质细胞则是相反的结果。细胞间通讯分析显示:在疾病组中神经元与其他细胞类型的细胞间通讯较弱,而星形胶质细胞细胞与其他细胞通讯作用强,小胶质细胞与其他细胞也有着若干受体配体对以及信号转导通路。并且小胶质细胞与星形胶质细胞通过SPP1信号通路进行细胞间相互作用的数量多。结论本研究通过单细胞测序技术得知在疾病组CD74、B2M、SPP1、NEAT1等基因表达量较高,且SPP1通路间的细胞相互作用可能为阿尔茨海默病的潜在发病机制。 展开更多
关键词 单细胞转录组测序 阿尔茨海默病 数据图谱 拟时序分析 细胞通讯
暂未订购
基于伪孪生网络的无监督学习多语言神经机器翻译方法
13
作者 都力铭 屈丹 +1 位作者 张传财 席阳丽 《郑州大学学报(工学版)》 北大核心 2025年第6期8-14,共7页
无监督神经机器翻译采用单语数据进行训练时会产生大量噪音信息,使得机器翻译模型在训练迭代过程中的误差不断积累,影响翻译效果。针对此问题,在跨语言预训练模型(XLM)的基础上,提出了一种基于伪孪生网络的无监督神经机器翻译方法。该... 无监督神经机器翻译采用单语数据进行训练时会产生大量噪音信息,使得机器翻译模型在训练迭代过程中的误差不断积累,影响翻译效果。针对此问题,在跨语言预训练模型(XLM)的基础上,提出了一种基于伪孪生网络的无监督神经机器翻译方法。该方法将模型编码器分为两个模块,其中伪孪生网络部分引入了一种噪声过滤门机制,利用其对编码过程中的噪音特征进行过滤,使得模型能够更好地学习源语言和目标语言之间的映射关系。实验结果表明:在英语同德语、法语、罗马尼亚语3种语言之间的交互翻译任务中,所提方法相较于基线系统平均提升了3.5百分点,证明了其翻译效果的优越性,并使用消融实验对该模型各组件进行了有效性验证,同时在德译英翻译任务中模拟了该方法在不同噪声条件下的性能测试,表现出较好的抗噪性。 展开更多
关键词 无监督机器翻译 伪孪生网络 单语数据 噪声过滤门机制 跨语言预训练模型
在线阅读 下载PDF
基于半监督学习的单视角点云三维人体姿态与形状估计
14
作者 方程浩 王康侃 《图学学报》 北大核心 2025年第2期393-401,共9页
在有限标签样本的条件下,单视角点云的三维人体姿态和形状估计一直存在模型估计精度低、泛化能力弱等问题。现有的方法通常采用微调方法优化模型,但对新样本的微调步骤大大增加了运行复杂度,本质上没有提高模型的泛化能力。为解决以上问... 在有限标签样本的条件下,单视角点云的三维人体姿态和形状估计一直存在模型估计精度低、泛化能力弱等问题。现有的方法通常采用微调方法优化模型,但对新样本的微调步骤大大增加了运行复杂度,本质上没有提高模型的泛化能力。为解决以上问题,提出了一种基于半监督学习的三维人体姿态与形状估计方法,在有限的标签数据条件下,利用大量无标签人体点云数据提高模型估计精度和泛化能力。具体地,首先对无标签数据进行弱增强和强增强,同时估计2种增强样本的三维人体参数模型。然后对弱增强样本的预测结果进行伪标签准确性判断,并基于一致性正则化思想约束强增强样本的预测结果,以迭代方式逐步优化伪标签质量和增加用于训练的伪标签数量,进而提升模型的估计精度。该算法在多种公开数据集上做了充分的定量和定性实验,实验结果证明该算法在有限标签样本的条件下提高了三维人体姿态和形状的估计精度,并增强了模型的泛化性能。 展开更多
关键词 三维人体姿态与形状估计 单视角点云 半监督学习 伪标签 点云数据增强
在线阅读 下载PDF
基于稀疏自编码的电网伪波动数据快速清洗
15
作者 王金忠 《电子设计工程》 2025年第10期121-124,129,共5页
目前的电网伪波动数据清洗方法应用后的数据损失量大,无法对规定数据实现快速清洗。为解决这一问题,提出基于稀疏自编码的电网伪波动数据快速清洗方法。通过稀疏自编码建立电网伪波动数据检测模型,基于稀疏自编码算法分析数据运行模式,... 目前的电网伪波动数据清洗方法应用后的数据损失量大,无法对规定数据实现快速清洗。为解决这一问题,提出基于稀疏自编码的电网伪波动数据快速清洗方法。通过稀疏自编码建立电网伪波动数据检测模型,基于稀疏自编码算法分析数据运行模式,在数据库内部训练数据,通过小波分解实现数据特征提取。对于电网数据进行编码并计算局部密度值,根据计算结果与密度峰值实现电网伪波动数据聚类,通过将电网伪波动数据进行剔除处理从而实现电网伪波动数据快速清洗。实验结果表明,所提方法能够有效减小数据损失量,清洗时间在5 s内,清洗效果显著。 展开更多
关键词 稀疏自编码 电网数据 伪波动数据 快速清洗
在线阅读 下载PDF
伪周期数据流局部异常离群因子检测仿真
16
作者 陈玉姝 王丽楠 王晨华 《计算机仿真》 2025年第4期386-390,共5页
为了精准检测伪周期数据流异常,提出一种基于局部离群因子的伪周期数据流异常检测方法。通过伪周期数据流的空间维度,展开网格划分处理。对邻域粗糙集模型展开分析构建特征冗余度度量特征冗余图,采用图割理论得到特征划分子集。引入聚... 为了精准检测伪周期数据流异常,提出一种基于局部离群因子的伪周期数据流异常检测方法。通过伪周期数据流的空间维度,展开网格划分处理。对邻域粗糙集模型展开分析构建特征冗余度度量特征冗余图,采用图割理论得到特征划分子集。引入聚类簇数评估方法确定最优特征分割,同时根据建立最优类簇结构评估指标展开伪周期数据流特征选择。利用改进孤立森林(iForest)和局部离群因子相结合的方式分别展开周期数据流异常检测,将获取的检测结果融合进而得到最终的伪周期数据流异常检测结果。实验结果表明,所提方法可以有效检测出伪周期数据流异常,获取良好的检测效果。 展开更多
关键词 局部离群因子 伪周期 数据流 异常检测
在线阅读 下载PDF
融合扩增技术的无监督域适应方法
17
作者 曹艺 郭茂祖 吴伟宁 《软件学报》 北大核心 2025年第7期3253-3270,共18页
域适应(domain adaptation,DA)是一类训练集(源域)和测试集(目标域)数据分布不一致条件下的机器学习任务.其核心在于如何克服数据域的分布差异对分类器泛化能力的负面影响,即设计合理而有效的训练策略,通过最小化数据域之间的差异,获得... 域适应(domain adaptation,DA)是一类训练集(源域)和测试集(目标域)数据分布不一致条件下的机器学习任务.其核心在于如何克服数据域的分布差异对分类器泛化能力的负面影响,即设计合理而有效的训练策略,通过最小化数据域之间的差异,获得高泛化能力的分类模型.研究了源域中包含标注信息,目标域中缺少标注信息条件下的无监督域适应(unsupervised domain adaptation,UDA)任务.将其形式化为如何利用部分标注样本和其余未标注样本进行分类器训练的半监督学习问题,进而引入伪标签(pseudo label,PL)和一致性正则化(consistent regularization,CR)这两种半监督学习技术,对所观测数据域有目的进行标记和样本扩增,使用扩增后的训练样本学习分类器,从而,在无监督域适应任务上取得了良好的泛化能力.提出一种融合扩增技术的无监督域适应(augmentation-based unsupervised domain adaptation,A-UDA)方法,在分类器的训练过程中:首先,使用随机数据增强技术(random augmentation)对目标域中的未标注样本进行扩增,即样本扩增;其次,利用模型的预测输出结果,对高置信度的未标注样本添加伪标记,即标注扩增;最后,使用扩增后的数据集训练分类模型,利用最大均值差异(maximum mean difference,MMD)计算源域和目标域的分布距离,通过最小化该分布距离获得具有高泛化能力的分类器.在MNIST-USPS,Office-Home和ImageCLEF-DA等多个无监督域适应任务上对所提出方法进行比较,与现有其他工作相比,获得了更好的分类效果. 展开更多
关键词 无监督域适应 半监督学习 数据扩增 伪标签 一致性正则化
在线阅读 下载PDF
一种汽车玻璃缺陷检测方法——结合潜在扩散模型数据增强的改进YOLOv5s算法
18
作者 罗志学 黄诗浩 《莆田学院学报》 2025年第2期79-85,共7页
针对汽车玻璃缺陷样本稀缺的问题,提出了一种基于潜在扩散模型的数据增强方法。该方法利用潜在扩散模型生成高质量的合成缺陷图像,再结合伪标签标注技术,显著提升了数据集的多样性。为解决原始YOLOv5s算法在跨尺度多目标检测任务中易漏... 针对汽车玻璃缺陷样本稀缺的问题,提出了一种基于潜在扩散模型的数据增强方法。该方法利用潜在扩散模型生成高质量的合成缺陷图像,再结合伪标签标注技术,显著提升了数据集的多样性。为解决原始YOLOv5s算法在跨尺度多目标检测任务中易漏检与错检的问题,通过在颈部区域引入BiFPN结构,实现多尺度特征的高效融合。实验结果表明,改进的算法对缺陷的识别精度明显提高,为汽车玻璃缺陷检测提供了可靠的技术支持与理论参考。 展开更多
关键词 汽车玻璃 潜在扩散模型 数据增强 伪标签标注 YOLOv5s BiFPN
在线阅读 下载PDF
伪裂变产物基础核数据库的分析与制作
19
作者 邢亮 沈华韵 +1 位作者 衷斌 徐琪 《核科学与工程》 北大核心 2025年第4期778-783,共6页
伪裂变产物法是一种简洁、高效的燃耗模拟方法,其计算精度依赖于伪裂变产物数据准确性,进而与裂变产物核数据质量密切相关。通过分析、汇总国内外最新的重要评价核数据库,建立了235U和239Pu的裂变产物核数据库,其中包括含1 280种核素的2... 伪裂变产物法是一种简洁、高效的燃耗模拟方法,其计算精度依赖于伪裂变产物数据准确性,进而与裂变产物核数据质量密切相关。通过分析、汇总国内外最新的重要评价核数据库,建立了235U和239Pu的裂变产物核数据库,其中包括含1 280种核素的235U和239Pu裂变产物集、含2 813种核素的中子反应截面数据库以及含4 113种核素的衰变数据库。制作的裂变产物核数据库可以为伪裂变产物数据研制提供基础核数据。 展开更多
关键词 伪裂变产物 裂变产物 裂变产额 中子反应截面 核衰变数据
在线阅读 下载PDF
巷−孔瞬变电磁自适应波场反变换及虚拟波场特征
20
作者 范克睿 郭建磊 +4 位作者 王若宇 庄明 樊芳泽 徐胜 赵文涛 《煤田地质与勘探》 北大核心 2025年第11期53-65,共13页
【目的】针对巷道开挖轮廓线外侧含水层不易被探查的难题,采用巷−孔瞬变电磁观测抵近探查与波场变换相结合的方式,同时接收来自前方与开挖轮廓线外的探测信号并突出含水层的边界信息。为获取波场运动学特征合理、对地层电性结构变化敏... 【目的】针对巷道开挖轮廓线外侧含水层不易被探查的难题,采用巷−孔瞬变电磁观测抵近探查与波场变换相结合的方式,同时接收来自前方与开挖轮廓线外的探测信号并突出含水层的边界信息。为获取波场运动学特征合理、对地层电性结构变化敏感的虚拟波场,提出一种自适应波场反变换算法,从而提高巷−孔瞬变电磁数据波场反变换的精度与效率。【方法】针对瞬变电磁波场变换核函数动态范围大、反变换方程病态程度高的固有难题,利用波场变换核函数在无穷区间上的解析解,提出一种根据瞬变电磁采集时间等参数自动求取波场反变换积分区间的方法,最大程度压制核函数的动态范围;进而基于精细积分方法建立积分步长与迭代过程自适应的波场反变换方程求解算法,将病态方程组的求解转化为稳定的积分求解问题。对开挖轮廓线外侧的含水层,采用有限体积法对其响应信号进行正演模拟并获取其垂直磁场分量的虚拟波场记录;同时也对井下实测数据采用同样的算法进行波场反变换。【结果】获取的虚拟波场记录具有合理的波场运动学特征,虚拟波场记录中的反射波轨迹与单炮地震记录的时距曲线存在合理的相似度;在数值精度方面,虚拟波场的回代数据与正演/实测数据具有较高的吻合度,其最大相对误差均小于10%。【结论】在巷−孔观测模式下,所提出的自适应波场反变换方法能够获取物理意义明确、数值精度可靠的虚拟波场记录,虚拟波场对于电性差异明显的含水层边界响应敏感,从而为进一步开展虚拟波场成像提供了可靠的数据支持。 展开更多
关键词 瞬变电磁法 巷−孔观测模式 波场变换 自适应 虚拟波场特征
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部