期刊文献+
共找到2,733篇文章
< 1 2 137 >
每页显示 20 50 100
基于关键数据趋势分析的工控流式数据快速质检方法
1
作者 张可佳 廖燕 张岩 《计算机应用研究》 北大核心 2026年第1期83-90,共8页
工控流式数据是反映生产过程的关键信息载体,其质量检测对于指导生产具有重要意义。在物联网技术快速发展背景下,工控流式数据增速快、增量大,且现有质检方法多侧重单一维度优化、难以兼顾准确性与速度平衡。借鉴降本增效的管理学思想,... 工控流式数据是反映生产过程的关键信息载体,其质量检测对于指导生产具有重要意义。在物联网技术快速发展背景下,工控流式数据增速快、增量大,且现有质检方法多侧重单一维度优化、难以兼顾准确性与速度平衡。借鉴降本增效的管理学思想,提出了一种仅对关键数据进行趋势分析的快速质检方法。首先,引入容忍度机制,通过量化数据波动的可接受范围筛除非关键数据,减少处理量以提高算法处理效率;其次,根据关键数据数量动态匹配趋势函数,并结合时间衰减与波动敏感度构建加权误差机制,以确保质检的准确性;最后,为验证方法的有效性,模拟真实工业应用场景开展实验。实验结果表明该方法在运行速度、准确性及稳定性方面表现良好,能够有效实现工控流式数据质检中效率与精度的协同优化。 展开更多
关键词 工控流式数据 降本增效 容忍度 趋势匹配 快速质检
在线阅读 下载PDF
基于增量加权的概念漂移数据流分类算法
2
作者 吴勇华 梅颖 卢诚波 《上海交通大学学报》 北大核心 2026年第1期112-122,I0005-I0007,共14页
概念漂移是数据流挖掘中最常见的现象之一,数据流中隐含的知识模式随时间动态变化,导致先前建立的分类器的准确性下降.针对这一问题,提出基于增量加权的概念漂移数据流分类(SCIW)算法.该算法采用启发式的权重更新策略,结合基于准确性差... 概念漂移是数据流挖掘中最常见的现象之一,数据流中隐含的知识模式随时间动态变化,导致先前建立的分类器的准确性下降.针对这一问题,提出基于增量加权的概念漂移数据流分类(SCIW)算法.该算法采用启发式的权重更新策略,结合基于准确性差异的自适应方法,同时改进了基于泊松分布的重采样策略.SCIW算法能够适应不同类型的概念漂移,有效缓解了分类器准确率下降的问题.在14个合成数据集和6个真实数据集上的实验结果表明,SCIW算法和自适应随机森林(ARF)算法在准确率方面表现出色,明显优于其他对比算法;SCIW算法在时间和内存消耗方面明显优于ARF算法,总体平均时间消耗约为ARF的83%,总体平均内存消耗约为ARF算法的13%. 展开更多
关键词 数据流 概念漂移 分类算法 集成学习 自适应
在线阅读 下载PDF
一种用于Sketch数据流测量的过滤器去噪方法
3
作者 邵婧 周盛文 +1 位作者 赵艺琳 黄家玮 《计算机工程与应用》 北大核心 2026年第3期297-302,共6页
数据流高度倾斜的分布特性严重影响了概率型数据结构(Sketch)的测量准确性。用于分离频繁项和非频繁项的过滤器算法被提出,可以提升现有Sketch的测量精度。然而,现有的这些过滤算法都难以避免不同频率项之间的累积效应,导致过滤结果存... 数据流高度倾斜的分布特性严重影响了概率型数据结构(Sketch)的测量准确性。用于分离频繁项和非频繁项的过滤器算法被提出,可以提升现有Sketch的测量精度。然而,现有的这些过滤算法都难以避免不同频率项之间的累积效应,导致过滤结果存在误差。为了解决这个问题,提出了一种新的具有通用性的去噪方法,通过分析相邻计数器的统计信息推断过滤器的全局状态,从而缓解由于哈希冲突带来的噪声影响。实验结果表明,该方法可以部署在不同的过滤器算法上,有效提升了现有过滤器的过滤准确性,并改善了现有Sketch在数据流处理中的性能。 展开更多
关键词 数据流处理 概率型数据结构Sketch 过滤器算法 去噪
在线阅读 下载PDF
基于变密度的自适应数据流的异常检测算法
4
作者 唐承海 杨雨晴 +2 位作者 杨海峰 蔡江辉 周立婵 《计算机科学》 北大核心 2026年第2期216-226,共11页
数据流是一类具有高生成率、动态分布特性的数据,其异常检测旨在从这一类数据中发现偏离预期行为的数据流,从而为医疗、工业生产、金融等诸多领域的决策提供支持。现有数据流异常检测方法普遍面临参数敏感性高、时空开销大、阈值选取难... 数据流是一类具有高生成率、动态分布特性的数据,其异常检测旨在从这一类数据中发现偏离预期行为的数据流,从而为医疗、工业生产、金融等诸多领域的决策提供支持。现有数据流异常检测方法普遍面临参数敏感性高、时空开销大、阈值选取难等问题。为了解决上述问题,提出一种基于变密度的自适应数据流的异常检测方法。首先定义了可变局部离群因子(Va-riable Local Outlier Factor,VLOF),VLOF通过对比数据点在并行的不同k值的邻域窗口下,其局部可达密度和局部异常因子的变化情况,度量数据点的密度分布,降低单一k近邻密度度量导致的结果不准确。其次,计算VLOF与k值的相对增长率和绝对均值率,以反映数据流的动态变化趋势,并将适应这种动态变化趋势的数据点定义为核心点,通过核心点加快对后续正常点的判断。最后,将相对增长率和绝对均值率作为数据点理论分布的度量指标,计算理论分布和新数据点实际分布的差异,从而自适应地将偏离理论分布的点识别为异常。为了验证提出算法的有效性,在多个UCI数据集和真实数据集下与8个算法进行对比实验,实验结果表明:与基线模型相比,所提方法在精确率、召回率、F1性能指标上表现良好,且时间和空间效率也有相应提升。 展开更多
关键词 数据流异常检测 变密度 可变局部离群因子 核心点 自适应阈值
在线阅读 下载PDF
基于流式计算的地震大数据处理方法 被引量:1
5
作者 朱婧 田野 +1 位作者 贾丹丹 张訸 《地震研究》 北大核心 2026年第1期168-175,共8页
随着地震监测技术的不断进步和地震台网数量的增加,地震数据的采集量呈爆炸式增长。针对海量地震数据处理中存在的运算速率瓶颈、处理时间较长以及存储资源有限的问题,提出了1种高效的地震大数据处理方法,构建1个集成数据实时采集、传... 随着地震监测技术的不断进步和地震台网数量的增加,地震数据的采集量呈爆炸式增长。针对海量地震数据处理中存在的运算速率瓶颈、处理时间较长以及存储资源有限的问题,提出了1种高效的地震大数据处理方法,构建1个集成数据实时采集、传输、处理及存储的综合性计算平台。首先利用Flink框架从各个地震台站实时获取观测数据,通过filter、map、process等算子对数据进行解析处理,并序列化为JSON格式缓存至Kafka消息队列中。Flink作为消费者角色从Kafka中接收数据,进行进一步的计算、分析和建模,最终将处理后的数据存储到HBase分布式数据库中,实现了数据的即时访问和深度分析。此外,通过Flink的流处理能力和Kafka的高吞吐量消息传递机制,确保了数据处理的实时性和稳定性。实验结果表明,系统每秒能够读写约130万条数据,相当于每秒处理约700 MB的数据量。在数据检索方面,该方法检索速度相较于传统工具提高了60%以上。通过模拟实验和实际地震数据的测试,验证了该方法在处理大规模地震数据流时的稳定性和可靠性。 展开更多
关键词 地震大数据 流式计算 Apache Flink Apache Kafka Apache HBase
在线阅读 下载PDF
基于多数据流并行传输的C-V2X资源调度协议的优化及性能分析
6
作者 窦祖芳 王亚龙 +2 位作者 葛磊蛟 杨乔礼 李泰国 《汽车工程》 北大核心 2026年第2期376-387,477,共13页
车联网通信技术通过支持并行数据流的方式,有效提升了服务质量(QoS)。然而,现有C-V2X技术在传输过程中未能充分考虑多数据流特征的差异性,导致通信资源调度不均衡及严重浪费。因此,本文首先提出基于多数据流并行的S-SPS资源调度协议,依... 车联网通信技术通过支持并行数据流的方式,有效提升了服务质量(QoS)。然而,现有C-V2X技术在传输过程中未能充分考虑多数据流特征的差异性,导致通信资源调度不均衡及严重浪费。因此,本文首先提出基于多数据流并行的S-SPS资源调度协议,依据各类数据流生成频率及服务需求优化资源重选计数器(RC)窗口参数,旨在提高系统资源利用率并降低碰撞概率;其次,对所提协议建立离散时间马尔可夫链(DTMC)模型,获得平均时延、冲突概率和平均信道利用率等系统性能指标,并通过多目标模型优化RC窗口参数,实现系统时延和利用率的均衡;最后,通过数值仿真分析并验证该协议。仿真结果表明,与现有协议相比,所提协议在单流和多流传输时均能获得更低的平均时延、更高的信道利用率和吞吐量。 展开更多
关键词 C-V2X Mode 4 S-SPS算法 多优先级数据流 离散时间马尔可夫链
在线阅读 下载PDF
分布式测震实时流数据容错系统应用研究
7
作者 李杨 冯兵 +2 位作者 蔡寅 张秀萍 许利娜 《计算机应用与软件》 北大核心 2026年第2期64-70,146,共8页
为增强测震流式数据采集的容错纠错能力,提高数据处理的稳定性和可靠性,提出基于ZooKeeper的分布式测震实时流数据处理方法。构建ZooKeeper分布式服务架构;通过监听动作完成整个流程中的主备切换,并继续进行数据消费行为,实现服务注册... 为增强测震流式数据采集的容错纠错能力,提高数据处理的稳定性和可靠性,提出基于ZooKeeper的分布式测震实时流数据处理方法。构建ZooKeeper分布式服务架构;通过监听动作完成整个流程中的主备切换,并继续进行数据消费行为,实现服务注册、服务加载、服务容错、策略调度功能。测试结果表明该方法下系统平均每小时服务修复时间(MTTR)降低98.4%,平均每小时故障间隔时间(MTTF)提升33.5%,对于故障场景下数据完整率提升20%,能够较好解决测震流式数据面临的稳定性和可靠性困难,具备区域地震台网技术推广应用潜力。 展开更多
关键词 实时流数据 容错纠错 协调服务 服务模型
在线阅读 下载PDF
基于深度时域网络的飞行流数据风险辨识
8
作者 曾丽君 丁松滨 陈晨 《航空工程进展》 2026年第1期132-140,共9页
与航后飞行品质监控技术相比,监测飞行实时流数据将有助于实现运行风险的在线辨识和预警。提出基于飞行流数据深度学习的风险辨识方法,并以飞机进近阶段典型风险开展实验验证。设计以时域卷积网络与门控循环单元组合的深度时域网络(DTN... 与航后飞行品质监控技术相比,监测飞行实时流数据将有助于实现运行风险的在线辨识和预警。提出基于飞行流数据深度学习的风险辨识方法,并以飞机进近阶段典型风险开展实验验证。设计以时域卷积网络与门控循环单元组合的深度时域网络(DTN)结构,基于离线飞行数据集,通过DTN网络实现长时记忆和局部时间依赖的异常特征提取;将DTN网络简化为适用于在线风险辨识的DTN-R网络,开展真实进近段飞行流数据的在线风险辨识实验。结果表明:DTN-R网络能够准确识别超速、下滑道偏离、襟翼延迟等典型风险,通过不同风险特征的学习,DTN网络可以推广应用到其他类型的风险辨识;DTN-R网络给出了风险置信率得分,为协助分析风险异常的诱因、保障飞行安全提供了有效手段。 展开更多
关键词 时域卷积网络 深度学习 飞行流数据 风险辨识 航空安全
在线阅读 下载PDF
基于多尺度注意力与双流融合特征的微表情识别
9
作者 郭小龙 薛珮芸 +1 位作者 白静 徐姜帅 《现代电子技术》 北大核心 2026年第5期175-184,共10页
为了解决微表情识别中特征提取能力不足和样本数据不均衡导致的识别偏差问题,文中提出一种基于多尺度注意力与双流融合特征的微表情识别方法。首先设计多尺度注意力模块,通过光流和差分序列特征的融合提升微表情关键动态信息的提取能力... 为了解决微表情识别中特征提取能力不足和样本数据不均衡导致的识别偏差问题,文中提出一种基于多尺度注意力与双流融合特征的微表情识别方法。首先设计多尺度注意力模块,通过光流和差分序列特征的融合提升微表情关键动态信息的提取能力;其次设计了改进的多核Inception模块,结合深度可分离卷积和多尺寸卷积核,在提升特征表达能力的同时降低计算复杂度;最后采用数据扩充策略和Focal Loss损失函数以缓解样本类间不均导致的识别偏移。实验结果显示,该方法在CASMEⅡ、SMIC-HS、SAMM和MEGC2019等4个自发微表情数据集上实现了优异性能。其中UAR和UF1指标分别达到最高,为0.914和0.912,显著优于近期主流方法。同时,设计的消融实验验证了多尺度注意力模块和多核Inception模块在特征提取中的关键作用。实验结果表明,所提方法通过多维度融合、创新特征提取、数据扩充和改善损失函数等操作,获得了高精度且具有竞争力的微表情识别性能。 展开更多
关键词 微表情识别 多尺度注意力 双流特征融合 深度可分离卷积 数据扩充 Focal Loss损失函数
在线阅读 下载PDF
基于Kolmogorov不等式的数据流漂移检测方法
10
作者 韩萌 孟凡兴 +3 位作者 李春鹏 张瑞华 何菲菲 丁剑 《计算机工程与应用》 北大核心 2025年第9期102-115,共14页
在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂... 在现实数据环境中,数据分布经常随着时间推移而变化,该现象称为概念漂移。概念漂移会显著影响原分类模型的性能。因此,当概念漂移出现时,分类模型需及时调整以适应数据分布变化,从而保证学习的有效性。探讨了Kolmogorov不等式在概念漂移检测领域的应用潜力。提出了一种基于错误率的Kolmogorov漂移检验策略,利用Kolmogorov不等式设计了概念漂移检测方法,并利用该算法来检测数据流中突然或逐渐出现的概念漂移。提出了一种尾部实例调整策略,减轻了漂移检测样本集中旧实例的影响,从而进一步降低了漂移检测延迟。实验表明,与经典或先进的漂移检测器相比,提出的算法在分类准确率方面表现最佳。在漂移检测性能方面,提出的算法在误检率和检测延迟方面的表现均位于前列,达到了较好的平衡。在运行时间方面也表现出了良好的性能。在上述四个指标的总体比较中优于其他算法,达到了该研究的预期。 展开更多
关键词 概念漂移 漂移检测 数据流 分类 Kolmogorov不等式
在线阅读 下载PDF
基于贝叶斯网络的动态数据流异常值快速检测方法
11
作者 陈智斌 陆瑛 +2 位作者 农英雄 黄聪 李喆 《微型电脑应用》 2025年第4期174-179,共6页
异常值是一类常见的动态数据流,会在一定程度上降低动态数据流的质量,为确定动态数据流的异常状态,提出基于贝叶斯网络的动态数据流异常值快速检测方法。在连续通信网络环境中,从丢失数据补偿、冗余数据剔除、数据标准化3个方面来收集... 异常值是一类常见的动态数据流,会在一定程度上降低动态数据流的质量,为确定动态数据流的异常状态,提出基于贝叶斯网络的动态数据流异常值快速检测方法。在连续通信网络环境中,从丢失数据补偿、冗余数据剔除、数据标准化3个方面来收集动态数据流,完成动态数据流的预处理工作。利用改进结构的贝叶斯网络,提取动态数据流特征,在区块链技术的支持下,检测动态数据流中的稳定和噪声异常,输出动态数据流异常值的统计结果。通过性能测试实验得出结论,与传统检测方法相比,优化设计方法的漏检率和误检率分别降低0.715%和1.49%,即优化设计方法在检测性能方面具有明显优势。 展开更多
关键词 贝叶斯网络 动态数据流 数据异常 快速检测
在线阅读 下载PDF
概念演化数据流主动学习方法
12
作者 李艳红 杜江涛 +2 位作者 王素格 白鹤翔 李德玉 《计算机技术与发展》 2025年第8期36-44,共9页
数据流分类方法研究在开放环境下的模型动态更新,以期从实时到达且不断变化的数据流中检测并适应概念演化,目前多数数据流分类方法通常假设数据流中样本的类别数是固定的,并且样本的标签可以不受限制地获取,这在真实场景下是不现实的。... 数据流分类方法研究在开放环境下的模型动态更新,以期从实时到达且不断变化的数据流中检测并适应概念演化,目前多数数据流分类方法通常假设数据流中样本的类别数是固定的,并且样本的标签可以不受限制地获取,这在真实场景下是不现实的。为此,该文提出了一种概念演化数据流主动学习方法(Active Learning Method for Concept Evolution Data Stream,ALM-CEDS)。定义基于样本标准差的基分类器重要性度量,提出基于加权预测概率的样本预测方法,提升分类器的分类性能;提出基于混合标签查询策略的分类器更新方法,使用难区分和代表当前数据分布的样本更新分类器;提出基于微簇q-近邻轮廓系数的新类检测方法,在数据流中快速识别新类。在4个真实数据流与5个合成数据流上的对比实验表明,该概念演化数据流主动学习方法在分类性能上优于已有的6种数据流学习方法。 展开更多
关键词 数据流分类 概念演化 主动学习 新类检测 聚类
在线阅读 下载PDF
有限标签下的非平衡数据流分类方法
13
作者 李艳红 李志华 +2 位作者 郑建兴 白鹤翔 郭鑫 《大数据》 2025年第2期107-126,共20页
数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见... 数据流分类是数据流挖掘的重要研究内容,其核心任务是从实时到达的数据流中快速捕获概念漂移,并及时调整分类模型。极限学习机具有训练速度快和泛化性能好的优点,然而目前基于极限学习机的数据流分类方法很少可以同时处理数据流中常见的多类非平衡、概念漂移、标签成本昂贵的问题。为此,提出了一种有限标签下的非平衡数据流分类方法。该方法定义了预测概率差值与信息熵相结合的样本预测确定性度量,提出了不确定性标签请求策略;定义了基于类不平衡比率和样本预测误差的样本重要性度量;提出了基于概念漂移指数的分类器的更新与重构机制。在6个人工数据流和3个真实数据流上的对比实验表明,本文提出方法的分类性能优于已有的6种数据流分类方法的分类性能。 展开更多
关键词 数据流分类 多类非平衡 极限学习机 概念漂移 标签成本昂贵
在线阅读 下载PDF
基于加权与动态选择的不平衡数据流分类算法
14
作者 韩萌 李春鹏 +3 位作者 李昂 孟凡兴 何菲菲 张瑞华 《计算机工程与应用》 北大核心 2025年第10期79-95,共17页
在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别... 在数据挖掘领域中,数据流挖掘是一项关键任务,旨在处理不断产生和演化的数据流。与传统的批处理数据挖掘不同,数据流挖掘强调对实时数据的处理和分析,具有更高的时效性和实用性。然而,现实世界的数据流中存在多类别不平衡、变化的类别不平衡比和概念漂移等实际挑战,会极大地降低分类器的性能。针对这些问题,提出了一种基于加权与动态选择的不平衡数据流分类算法(sample difficulty weighting and dynamic ensemble selection,SDW-DES),通过综合考虑样本难度和数据动态性,为实时应用提供可靠解决方案。引入一种基于样本分类难度的加权策略,结合样本的边际值和Focal Loss,以更有效地关注易分类错误的样本和少数类样本,从而提高分类器的准确性。提出一种灵活的动态集成选择方法,通过设计样本滑动窗口和困难样本滑动窗口,来综合分析分类器在不同窗口上的表现并加权,选出集成中最好的分类器进行预测,以适应数据分布的动态变化。在多种数据流环境和评估指标上与9种先进的算法进行了全面的实验评估,实验结果表明SDW-DES在4个评估指标中平均排名第一,并且更能够适应数据流中的不平衡和概念漂移问题。 展开更多
关键词 数据流分类 多类不平衡 概念漂移 样本加权 动态集成选择
在线阅读 下载PDF
面向6G核心网的AI-Native NWDAF网元开发架构 被引量:2
15
作者 何世文 戴诗棋 +3 位作者 董浩磊 彭石林 张晓宇 钱育蓉 《移动通信》 2025年第1期81-90,共10页
内生智能的通信网络被认为是第六代移动通信网络发展的关键技术之一。在深入分析开发内生智能网络数据分析功能网元所面临的数据采集、隐私保护、模型管理以及灵活可扩展等挑战的基础上,提出一种具备并行化数据采集与处理能力、高效化... 内生智能的通信网络被认为是第六代移动通信网络发展的关键技术之一。在深入分析开发内生智能网络数据分析功能网元所面临的数据采集、隐私保护、模型管理以及灵活可扩展等挑战的基础上,提出一种具备并行化数据采集与处理能力、高效化模型训练与管理机制以及强容错性和可扩展性的内生智能网络数据分析功能网元开发架构。该架构旨在实现数据采集、数据分析、数据存储、模型决策一体化的目标,从而能有效应对第六代移动通信网络环境中的复杂需求。结合Kubernetes、流式化处理、微服务化等前沿技术,开发了实验室环境中的验证系统平台,进而验证了所提出架构的有效性并分析了系统性能。 展开更多
关键词 内生智能 流式处理 网络数据分析功能网元
在线阅读 下载PDF
数据挖掘驱动的直播电商供应链定价与协调机制研究
16
作者 司凤山 李乐 王晶 《宜宾学院学报》 2025年第11期1-9,共9页
基于直播电商作为数字经济与实体经济深度融合关键载体的背景,其供应链定价与协调机制对利益分配具有决定性影响。构建制造商、主播和直播平台三方博弈模型,系统分析收益分担比例、直播间活跃度、数据挖掘技术及主播引流等核心变量在不... 基于直播电商作为数字经济与实体经济深度融合关键载体的背景,其供应链定价与协调机制对利益分配具有决定性影响。构建制造商、主播和直播平台三方博弈模型,系统分析收益分担比例、直播间活跃度、数据挖掘技术及主播引流等核心变量在不同决策模式下的作用机制。结果显示:合理设定收益分担比例可有效平衡三方利益分配,实现多方共赢;提升直播间活跃度既能增强市场响应速度,又能直接驱动利润增长;数据挖掘技术作为新质生产力代表,可显著优化供应链运营效率并降低决策成本;在高敏感系数的市场环境中,主播引流策略能明显扩大制造商的利润空间。 展开更多
关键词 直播电商 数据挖掘 直播引流 定价策略 协调机制
在线阅读 下载PDF
直播数据驱动下丝绸服饰设计模式构建
17
作者 朱伟明 陈诗圯 +1 位作者 魏琪 陈雨琦 《毛纺科技》 北大核心 2025年第10期79-88,共10页
海量冗余信息的涌入使丝绸服饰品牌传统的设计环节容易出现滞缓和误判的困境,如何建立一套由电商直播数据为牵引的丝绸服饰设计新范式,已成为丝绸服饰品牌在开展直播业务时亟待解决的难题。文章以电商直播数据为切入点,研究电商直播数... 海量冗余信息的涌入使丝绸服饰品牌传统的设计环节容易出现滞缓和误判的困境,如何建立一套由电商直播数据为牵引的丝绸服饰设计新范式,已成为丝绸服饰品牌在开展直播业务时亟待解决的难题。文章以电商直播数据为切入点,研究电商直播数据介入丝绸服饰设计的方法,对电商直播数据进行采集并分析,提出前期调研与设计研发阶段路径,构建以“数据-产品-数据”为牵引的交互模式,以改善产品设计结果的精准性,缓解产品库存积压,最后以S品牌为例进行设计实践,通过对以往夏季波段品类的各项数据进行设计分析,依托月度销售数据、品类销售数据以及品类结构数据等相关信息建立设计构思,对夏季波段品类展开设计实践。实践结果表明,该模式显著提升了丝绸服饰设计的市场精准度与设计决策的科学性,有效减少设计冗余,有助于提升销售表现。 展开更多
关键词 电商直播 直播数据 丝绸服饰 设计模式
在线阅读 下载PDF
基于特征识别和随机森林的网络数据流冗余去除算法
18
作者 高倩 《邵阳学院学报(自然科学版)》 2025年第3期1-8,共8页
针对现有网络数据流冗余去除算法易忽略数据流分类以及冗余特征强相关问题,导致冗余数据去除效率不高,网络数据存储空间利用率低,提出了基于特征识别和随机森林的网络数据流冗余去除算法。首先,依据网络数据流的五元组属性,获取数据的... 针对现有网络数据流冗余去除算法易忽略数据流分类以及冗余特征强相关问题,导致冗余数据去除效率不高,网络数据存储空间利用率低,提出了基于特征识别和随机森林的网络数据流冗余去除算法。首先,依据网络数据流的五元组属性,获取数据的流属性和时间戳,计算样本数据权重值获取数据边缘分布特征,确定数据包权重,完成数据流分类;然后,采用主动采样方法提取识别网络数据流冗余信息特征;最后,引入随机森林算法构建冗余去除模型,通过特征选择与混合采样的方法对模型加以改进,通过对冗余数据进行编码替换完成去除处理。实验结果表明,应用所研究方法能够使网络带宽占用低于6 bps,提高了网络数据存储空间的利用率。 展开更多
关键词 特征识别 改进随机森林 网络数据流分类 冗余去除
在线阅读 下载PDF
不平衡数据流的集成分类方法综述 被引量:2
19
作者 朱诗能 韩萌 +3 位作者 杨书蓉 代震龙 杨文艳 丁剑 《计算机工程与应用》 北大核心 2025年第2期59-72,共14页
现实世界的场景中,从数据流中学习会面临着类不平衡的问题,学习算法由于缺少训练数据而无法有效识别少数类样本。为了介绍不平衡数据流集成分类的研究现状和面临的挑战,依据近年来的不平衡数据流集成分类领域文献,从基于加权、选择和投... 现实世界的场景中,从数据流中学习会面临着类不平衡的问题,学习算法由于缺少训练数据而无法有效识别少数类样本。为了介绍不平衡数据流集成分类的研究现状和面临的挑战,依据近年来的不平衡数据流集成分类领域文献,从基于加权、选择和投票的决策规则和基于代价敏感学习、主动学习和增量学习的学习方式的角度详细分析和总结了不平衡数据流的集成方法,并比较了使用相同数据集的算法的性能。针对处理不同类型复杂数据流中的不平问题,从概念漂移、多类、噪声和类重叠四个方面对其集成分类算法进行总结,分析了经典算法的时间复杂度。对动态数据流、缺失信息的数据流、多标签数据流和不确定数据流中不平衡问题的分类挑战提出了下一步的集成策略研究。 展开更多
关键词 不平衡数据流 集成分类 决策规则 学习方式 复杂数据流
在线阅读 下载PDF
基于主动−被动增量集成的概念漂移适应方法 被引量:1
20
作者 祁晓博 陈佳明 +3 位作者 史颖 亓慧 郭虎升 王文剑 《自动化学报》 北大核心 2025年第5期1131-1144,共14页
数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理... 数据流是一组随时间连续到来的数据序列,在数据流不断产生的过程中,由于各种因素的影响,数据分布随时间推移可能以不可预测的方式发生变化,这种现象称为概念漂移.在漂移发生后,当前模型需要及时响应数据流中的实时分布变化,并有效处理不同类型的概念漂移,从而避免模型泛化性能下降.针对这一问题,提出一种基于主动–被动增量集成的概念漂移适应方法(CDAM-APIE).该方法首先使用在线增量集成策略构建被动集成模型,对新样本进行实时预测以动态更新基模型权重,有利于快速响应数据分布的瞬时变化,并增强模型适应概念漂移的能力.在此基础上,利用增量学习和概念漂移检测技术构建主动基模型,提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能.实验结果表明,CDAMAPIE能够对概念漂移做出及时响应,同时有效提高模型的泛化性能. 展开更多
关键词 概念漂移 数据流分类 增量学习 在线集成
在线阅读 下载PDF
上一页 1 2 137 下一页 到第
使用帮助 返回顶部