期刊文献+
共找到263篇文章
< 1 2 14 >
每页显示 20 50 100
Strategy for Data Stream Processing Based on Measurement Metadata: An Outpatient Monitoring Scenario 被引量:1
1
作者 Mario Diván Luis Olsina Silvia Gordillo 《Journal of Software Engineering and Applications》 2011年第12期653-665,共13页
In this work we discuss SDSPbMM, an integrated Strategy for Data Stream Processing based on Measurement Metadata, applied to an outpatient monitoring scenario. The measures associated to the attributes of the patient ... In this work we discuss SDSPbMM, an integrated Strategy for Data Stream Processing based on Measurement Metadata, applied to an outpatient monitoring scenario. The measures associated to the attributes of the patient (entity) under monitoring, come from heterogeneous data sources as data streams, together with metadata associated with the formal definition of a measurement and evaluation project. Such metadata supports the patient analysis and monitoring in a more consistent way, facilitating for instance: i) The early detection of problems typical of data such as missing values, outliers, among others;and ii) The risk anticipation by means of on-line classification models adapted to the patient. We also performed a simulation using a prototype developed for outpatient monitoring, in order to analyze empirically processing times and variable scalability, which shed light on the feasibility of applying the prototype to real situations. In addition, we analyze statistically the results of the simulation, in order to detect the components which incorporate more variability to the system. 展开更多
关键词 MEASUREMENT data stream processing C-INCAMI STATISTICAL Analysis
暂未订购
Modeling and Performance Evaluation of Streaming Data Processing System in IoT Architecture
2
作者 Feng Zhu Kailin Wu Jie Ding 《Computers, Materials & Continua》 2025年第5期2573-2598,共26页
With the widespread application of Internet of Things(IoT)technology,the processing of massive realtime streaming data poses significant challenges to the computational and data-processing capabilities of systems.Alth... With the widespread application of Internet of Things(IoT)technology,the processing of massive realtime streaming data poses significant challenges to the computational and data-processing capabilities of systems.Although distributed streaming data processing frameworks such asApache Flink andApache Spark Streaming provide solutions,meeting stringent response time requirements while ensuring high throughput and resource utilization remains an urgent problem.To address this,the study proposes a formal modeling approach based on Performance Evaluation Process Algebra(PEPA),which abstracts the core components and interactions of cloud-based distributed streaming data processing systems.Additionally,a generic service flow generation algorithmis introduced,enabling the automatic extraction of service flows fromthe PEPAmodel and the computation of key performance metrics,including response time,throughput,and resource utilization.The novelty of this work lies in the integration of PEPA-based formal modeling with the service flow generation algorithm,bridging the gap between formal modeling and practical performance evaluation for IoT systems.Simulation experiments demonstrate that optimizing the execution efficiency of components can significantly improve system performance.For instance,increasing the task execution rate from 10 to 100 improves system performance by 9.53%,while further increasing it to 200 results in a 21.58%improvement.However,diminishing returns are observed when the execution rate reaches 500,with only a 0.42%gain.Similarly,increasing the number of TaskManagers from 10 to 20 improves response time by 18.49%,but the improvement slows to 6.06% when increasing from 20 to 50,highlighting the importance of co-optimizing component efficiency and resource management to achieve substantial performance gains.This study provides a systematic framework for analyzing and optimizing the performance of IoT systems for large-scale real-time streaming data processing.The proposed approach not only identifies performance bottlenecks but also offers insights into improving system efficiency under different configurations and workloads. 展开更多
关键词 System modeling performance evaluation streaming data process IoT system PEPA
在线阅读 下载PDF
A Granularity-Aware Parallel Aggregation Method for Data Streams
3
作者 WANG Yong-li XU Hong-bing XU Li-zhen QIAN Jiang-bo LIU Xue-jun 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期133-137,共5页
This paper focuses on the parallel aggregation processing of data streams based on the shared-nothing architecture. A novel granularity-aware parallel aggregating model is proposed. It employs parallel sampling and li... This paper focuses on the parallel aggregation processing of data streams based on the shared-nothing architecture. A novel granularity-aware parallel aggregating model is proposed. It employs parallel sampling and linear regression to describe the characteristics of the data quantity in the query window in order to determine the partition granularity of tuples, and utilizes equal depth histogram to implement partitio ning. This method can avoid data skew and reduce communi cation cost. The experiment results on both synthetic data and actual data prove that the proposed method is efficient, practical and suitable for time-varying data streams processing. 展开更多
关键词 data streams parallel processing linear regression AGGREGATION data skew
在线阅读 下载PDF
FPGA-Based Stream Processing for Frequent Itemset Mining with Incremental Multiple Hashes
4
作者 Kasho Yamamoto Masayuki Ikebe +1 位作者 Tetsuya Asai Masato Motomura 《Circuits and Systems》 2016年第10期3299-3309,共11页
With the advent of the IoT era, the amount of real-time data that is processed in data centers has increased explosively. As a result, stream mining, extracting useful knowledge from a huge amount of data in real time... With the advent of the IoT era, the amount of real-time data that is processed in data centers has increased explosively. As a result, stream mining, extracting useful knowledge from a huge amount of data in real time, is attracting more and more attention. It is said, however, that real- time stream processing will become more difficult in the near future, because the performance of processing applications continues to increase at a rate of 10% - 15% each year, while the amount of data to be processed is increasing exponentially. In this study, we focused on identifying a promising stream mining algorithm, specifically a Frequent Itemset Mining (FIsM) algorithm, then we improved its performance using an FPGA. FIsM algorithms are important and are basic data- mining techniques used to discover association rules from transactional databases. We improved on an approximate FIsM algorithm proposed recently so that it would fit onto hardware architecture efficiently. We then ran experiments on an FPGA. As a result, we have been able to achieve a speed 400% faster than the original algorithm implemented on a CPU. Moreover, our FPGA prototype showed a 20 times speed improvement compared to the CPU version. 展开更多
关键词 data Mining Frequent Itemset Mining FPGA stream processing
在线阅读 下载PDF
面向6G核心网的AI-Native NWDAF网元开发架构 被引量:2
5
作者 何世文 戴诗棋 +3 位作者 董浩磊 彭石林 张晓宇 钱育蓉 《移动通信》 2025年第1期81-90,共10页
内生智能的通信网络被认为是第六代移动通信网络发展的关键技术之一。在深入分析开发内生智能网络数据分析功能网元所面临的数据采集、隐私保护、模型管理以及灵活可扩展等挑战的基础上,提出一种具备并行化数据采集与处理能力、高效化... 内生智能的通信网络被认为是第六代移动通信网络发展的关键技术之一。在深入分析开发内生智能网络数据分析功能网元所面临的数据采集、隐私保护、模型管理以及灵活可扩展等挑战的基础上,提出一种具备并行化数据采集与处理能力、高效化模型训练与管理机制以及强容错性和可扩展性的内生智能网络数据分析功能网元开发架构。该架构旨在实现数据采集、数据分析、数据存储、模型决策一体化的目标,从而能有效应对第六代移动通信网络环境中的复杂需求。结合Kubernetes、流式化处理、微服务化等前沿技术,开发了实验室环境中的验证系统平台,进而验证了所提出架构的有效性并分析了系统性能。 展开更多
关键词 内生智能 流式处理 网络数据分析功能网元
在线阅读 下载PDF
基于大数据技术的DRGs绩效评价信息分析处理系统 被引量:2
6
作者 陈立真 《自动化技术与应用》 2025年第2期80-84,共5页
当前的信息处理分析系统在处理数据时缺乏实时性,导致系统平均响应时间较长。对此,设计基于大数据技术的DRGs绩效评价信息处理分析系统。根据绩效评价信息处理要求,建立包含三层结构软件层次总体架构;采用改进烟花算法建立信息集成模型... 当前的信息处理分析系统在处理数据时缺乏实时性,导致系统平均响应时间较长。对此,设计基于大数据技术的DRGs绩效评价信息处理分析系统。根据绩效评价信息处理要求,建立包含三层结构软件层次总体架构;采用改进烟花算法建立信息集成模型,汇总DRGs绩效评价信息;采用离散化数据流对汇总的信息进行实时、快速聚类分析;最后结合内存存储模式和同步复制技术,实现信息的分布式存储。实验结果表明:所提系统在不同数据量条件下的系统操作指令平均响应时间始终保持在4 s,说明所提系统的实时性较好。 展开更多
关键词 大数据技术 绩效评价系统 信息集成 流处理 信息存储
在线阅读 下载PDF
面向煤矿AI应用的多源异构数据分层分类仓储技术 被引量:1
7
作者 张智星 付翔 +4 位作者 张小强 秦一凡 黄金宇 杨宇琪 贾一帆 《工矿自动化》 北大核心 2025年第9期18-24,共7页
在煤矿智能化转型进程中,多源异构数据呈爆发式增长,但煤炭企业对这些数据的应用仍停留在可视化的初级阶段,且面临三大瓶颈:数据结构多样难以统一存储,阻碍AI应用的数据关联分析;数据质量参差不齐,导致AI模型无法直接有效分析;数据体量... 在煤矿智能化转型进程中,多源异构数据呈爆发式增长,但煤炭企业对这些数据的应用仍停留在可视化的初级阶段,且面临三大瓶颈:数据结构多样难以统一存储,阻碍AI应用的数据关联分析;数据质量参差不齐,导致AI模型无法直接有效分析;数据体量庞大,造成数据查询与分析效率低,严重制约智能应用落地。针对上述问题,提出了一种面向煤矿AI应用的多源异构数据分层分类仓储技术,该技术框架主要由Flink数据流处理服务、数据分层存储、数据分类存储、AI模型应用服务、主数据及元数据管理构成。Flink数据流处理服务是数据的核心处理单元,主要实现井下各子系统(综采、掘进、主运输、综合保障等)实时数据的脏数据清理、异常值填充、数据格式统一等处理,为后续面向煤矿AI应用的特征值快速计算及模型的有效应用提供标准数据条件。数据分层存储完成海量多源异构数据的分级编码与结构化整合后,存储到数据分类存储体系中。通过主数据及元数据管理,确保关键数据的一致性与完整性,并实现数据语义的清晰明确表达,为AI模型应用提供清晰明确的数据信息保障。测试结果表明:该技术可以实现海量多源异构数据的合理分层分类存储、不同类型数据与对应存储介质的精准匹配。煤矿现场应用结果表明:应用该技术后,工业数据平均查询延迟降低到1.1 s,数据质量合格率提高到93%,占用内存大的非结构化数据由高成本的高频存储转为低成本分布式存储。 展开更多
关键词 煤矿AI应用 多源异构数据 煤矿工业数据 数据分类存储 数据分层存储 Flink数据流处理 AI模型应用 主数据及元数据管理
在线阅读 下载PDF
面向Apache Flink流式分析应用的高吞吐优化技术 被引量:2
8
作者 秦政 许利杰 +4 位作者 陈伟 王毅 吴铭钞 曾鸿斌 王伟 《软件学报》 北大核心 2025年第7期3184-3208,共25页
随着大数据时代的到来,海量的用户数据赋能了众多数据驱动的行业应用,例如智慧交通、智能电网、商品推荐等.在数据实时性要求高的应用场景下,数据中的业务价值随时间增长快速降低,因此数据分析系统需要具有高吞吐和低延迟能力,以Apache ... 随着大数据时代的到来,海量的用户数据赋能了众多数据驱动的行业应用,例如智慧交通、智能电网、商品推荐等.在数据实时性要求高的应用场景下,数据中的业务价值随时间增长快速降低,因此数据分析系统需要具有高吞吐和低延迟能力,以Apache Flink为代表的流式大数据处理系统得到广泛应用.Flink通过在集群的计算节点上并行化计算任务,水平扩展系统吞吐率.然而,已有研究指出,Flink存在单点性能弱,集群水平可扩展性差的问题.为了提高流式大数据处理系统的吞吐率,研究者在控制平面设计、系统算子实现和垂直可扩展性等方面开展优化,但现有工作尚缺乏对流式分析应用数据流的关注.流式分析应用是由事件流驱动并使用有状态处理函数的应用,例如智能电网场景下的低电压检测应用、商品推荐场景下的广告活动分析应用等.对典型的流式分析应用的数据流特征进行分析,总结其中存在的3个水平可扩展性瓶颈并给出相应的优化策略,包括:键级水位线,动态负载分发策略和基于键值的数据交换策略.基于上述优化技术,对Flink框架进行扩展并形成原型系统Trilink,选取真实场景数据集:低电压检测应用,桥梁拱顶监测应用和典型流式分析测试基准Yahoo Streaming Benchmark,与现有工作进行测试比较.实验结果表明,相较于Flink,Trilink在单机环境下吞吐率提升了5倍以上,8节点下水平扩展加速比提高了1.6倍以上. 展开更多
关键词 流式处理 分布式系统 性能优化 大数据系统
在线阅读 下载PDF
基于Spark Streaming的实时数据分析系统及其应用 被引量:30
9
作者 韩德志 陈旭光 +2 位作者 雷雨馨 戴永涛 张肖 《计算机应用》 CSCD 北大核心 2017年第5期1263-1269,共7页
为了实现对实时网络数据流的快速分析,设计一种分布式实时数据流分析系统(DRDAS),能有效解决并发访问数据流的收集、存储和实时分析问题,为大数据环境的网络安全检测提供了一种有效的数据分析平台;根据Spark Streaming运行的原理设计一... 为了实现对实时网络数据流的快速分析,设计一种分布式实时数据流分析系统(DRDAS),能有效解决并发访问数据流的收集、存储和实时分析问题,为大数据环境的网络安全检测提供了一种有效的数据分析平台;根据Spark Streaming运行的原理设计一种动态采样的K-Means并行算法,与DRDAS结合能实时有效地检测大数据环境下的各种分布式拒绝服务(DDo S)攻击。实验结果显示:DRDAS具有好的可扩展性、容错性和实时处理能力,与动态采样的K-Means并行算法结合能实时地检测各种DDo S攻击,缩短了攻击的检测时间。 展开更多
关键词 SPARK streaming框架 分布式流处理 网络数据分析 分布式拒绝服务攻击
在线阅读 下载PDF
一种基于风洞数采系统的流式处理程序设计
10
作者 黄心跃 刘赟 《测控技术》 2025年第3期50-55,共6页
在风洞试验过程中,科学合理的数据采集软件可以获取准确可靠的试验数据,为分析问题、验证假设和得出结论提供有力支持。风洞试验中常见的数据采集软件运行方式是待系统完成所有采集内容后再整体刷新信号波形,这种方式构造简单,具有实用... 在风洞试验过程中,科学合理的数据采集软件可以获取准确可靠的试验数据,为分析问题、验证假设和得出结论提供有力支持。风洞试验中常见的数据采集软件运行方式是待系统完成所有采集内容后再整体刷新信号波形,这种方式构造简单,具有实用性,但也存在弊端,无法实时监视信号的动态数据,在一定程度上限制了程序内部数据的简易处理能力。因此,研究了一种适用于风洞试验特性的流式处理程序,采用缓存更替算法、扫描偏移算法等技术手段,将动态数据与静态数据逐一匹配,实现多通道下信号数据的实时更新和载荷数据的实时处理、显示与存储。与传统模式相比,流式处理程序不仅方便操作人员监视记录模型在试验过程中受到的气动力,还可以细化模型进入气流分离、失速临界点等特定区域时的历程数据,更有利于进行研究与分析。 展开更多
关键词 风洞试验 数采软件 流式处理 历程数据
在线阅读 下载PDF
基于动态时间窗格的数据仓库流批一体优化方法
11
作者 陈滨林 唐小勇 《计算机应用研究》 北大核心 2025年第8期2460-2466,共7页
数据仓库是企业数据管理核心,批处理和流处理是大数据分析的两种核心数据处理范式。为了解决传统批处理技术产出时延和资源消耗高的问题,以及流处理技术在处理多流数据关联和历史数据计算时面临的数据质量挑战,提出了一种流批一体处理... 数据仓库是企业数据管理核心,批处理和流处理是大数据分析的两种核心数据处理范式。为了解决传统批处理技术产出时延和资源消耗高的问题,以及流处理技术在处理多流数据关联和历史数据计算时面临的数据质量挑战,提出了一种流批一体处理方法。所提方法通过分析数据集在不同时间窗格中的变化,融合了基于调度时间的动态时间窗格划分和基于DFS算法的最简数据集搜索。实验结果表明,与主流微批处理方法相比,该方法将整体计算时间缩短57.2%,内存消耗减少24.2%,同时确保了数据的强一致性。该方法对于企业构建高处理效率、低资源消耗的流批一体化数据仓库具有重要参考价值。 展开更多
关键词 数据仓库 数据流处理 动态时间窗格 最简数据集 流批一体化
在线阅读 下载PDF
基于Spark Streaming流技术的机动车缉查布控系统设计 被引量:3
12
作者 陈丽 王锐 《顺德职业技术学院学报》 2016年第4期10-15,共6页
机动车缉查布控系统以治安交通卡口系统为基础,将公路运行车辆的构成、流量分布、违章情况等信息进行汇总,实现对车辆轨迹的查询分析,从而为交通规划、管理和案件侦破等提供有效决策。由于机动车的数量增长迅猛,且机动车违规违章具有流... 机动车缉查布控系统以治安交通卡口系统为基础,将公路运行车辆的构成、流量分布、违章情况等信息进行汇总,实现对车辆轨迹的查询分析,从而为交通规划、管理和案件侦破等提供有效决策。由于机动车的数量增长迅猛,且机动车违规违章具有流动性、偶发性的特点,造成卡口系统录入的数据量巨大,传统的机动车缉查布控技术只能在预设条件下对数据进行查询,不能实现快速地实时分析查询。通过采用Spark Streaming技术进行大数据实时处理,实现实时显示和告警机动车违规违章活动热点,分析和预测机动车活动轨迹。 展开更多
关键词 机动车缉查布控系统 交通管理 Sparkstreaming 流数据处理
在线阅读 下载PDF
StreamQCTree:一种流数据方压缩结构 被引量:1
13
作者 甘亮 刘东红 +1 位作者 贾焰 韩伟红 《计算机工程与应用》 CSCD 北大核心 2011年第19期140-143,185,共5页
数据流管理系统计算聚集查询结果保存在内存中形成流数据方(StreamCube),提供快速、精确的在线OLAP查询。有限的内存空间需要一种有效的存储方法来存储更大时间窗口的流数据方。提出一种基于QC-Tree结构的流数据方StreamQCTree生成、裁... 数据流管理系统计算聚集查询结果保存在内存中形成流数据方(StreamCube),提供快速、精确的在线OLAP查询。有限的内存空间需要一种有效的存储方法来存储更大时间窗口的流数据方。提出一种基于QC-Tree结构的流数据方StreamQCTree生成、裁剪及查询方法。将QC-Tree结构中上界集划分为基本上界类和附加上界类;并分析附加上界类的成本计算模型;根据该模型在固定存储空间下,采用动态选择物化结点的方案选择物化部分附加上界类,使对StreamQCTree的平均查询响应时间最小。实验表明,StreamQCTree能够有效地访问数据方且获得较好的压缩效果。 展开更多
关键词 网络安全事件监控 streamQCTree 流数据方 数据压缩 联机分析处理 QC-Tree
在线阅读 下载PDF
引信大容量存储测试数据显示预处理方法研究
14
作者 郝淑文 梁鹏飞 吴奇 《工程技术研究》 2025年第2期37-39,共3页
针对引信测量装置采集的大量回放数据存储容量大、处理效率低等问题,文章设计了一种创新的滤波与游程编码(run-length encoding,RLE)压缩相结合的流式处理算法。该算法通过对原始数据进行有效滤波处理,去除冗余信息,随后采用RLE压缩技... 针对引信测量装置采集的大量回放数据存储容量大、处理效率低等问题,文章设计了一种创新的滤波与游程编码(run-length encoding,RLE)压缩相结合的流式处理算法。该算法通过对原始数据进行有效滤波处理,去除冗余信息,随后采用RLE压缩技术进一步缩减数据量。典型实测数据表明,该算法不仅显著提高了数据处理的效率,还确保了数据的完整性,对推动引信测量数据的高效分析处理具有重要的参考价值和实际应用意义。 展开更多
关键词 大容量数据处理 信号压缩 引信测量装置 RLE 流式处理算法
在线阅读 下载PDF
水利云环境下多源异构数据流式处理框架研究
15
作者 王娟 舒林新 《软件》 2025年第7期94-96,共3页
随着水利行业对数据处理需求的增长,传统的数据处理方式已无法满足实时性要求。本研究提出了一种基于水利云平台的多源异构数据流式处理框架,通过数据接入、流计算与智能调度技术,提升了多源异构数据的实时处理能力。采用强化学习优化... 随着水利行业对数据处理需求的增长,传统的数据处理方式已无法满足实时性要求。本研究提出了一种基于水利云平台的多源异构数据流式处理框架,通过数据接入、流计算与智能调度技术,提升了多源异构数据的实时处理能力。采用强化学习优化资源调度,实现了数据流的高效处理与实时响应。实验表明,框架在处理延迟、资源利用和系统稳定性方面优于传统方法,具备较强的应用潜力,对水利大数据智能化管理具有重要意义。 展开更多
关键词 水利云平台 多源异构数据 流式处理 数据优化 云资源调度
在线阅读 下载PDF
基于边缘计算的实时数据处理技术研究
16
作者 密海婷 《长江信息通信》 2025年第9期130-132,共3页
随着物联网设备激增和5G网络部署,传统云计算面临延迟高、带宽消耗大等挑战。边缘计算将计算资源下沉到网络边缘,为实时数据处理提供有效途径。本文聚焦边缘计算环境下的分布式同步机制这一关键技术,提出压缩向量时钟算法(CVC)和预测性... 随着物联网设备激增和5G网络部署,传统云计算面临延迟高、带宽消耗大等挑战。边缘计算将计算资源下沉到网络边缘,为实时数据处理提供有效途径。本文聚焦边缘计算环境下的分布式同步机制这一关键技术,提出压缩向量时钟算法(CVC)和预测性同步策略,解决多边缘节点间数据一致性与实时性平衡问题。通过分层同步架构和基于LSTM的预测模型,显著降低同步延迟和存储开销,提高系统容错能力。该技术在智能交通、工业物联网等领域应用前景广阔。 展开更多
关键词 边缘计算 实时数据处理 流式处理 资源调度 负载均衡
在线阅读 下载PDF
大数据环境下监控系统的设计与实现 被引量:1
17
作者 殷春 《数字通信世界》 2025年第8期1-3,共3页
随着物联网技术发展和设备数量的激增,监控系统面临着数据量庞大、处理速度要求高、存储压力大等挑战,针对传统监控系统在大数据环境下遇到的技术瓶颈,本文设计一套基于分布式架构的监控系统解决方案。该系统采用Hadoop生态圈技术,结合... 随着物联网技术发展和设备数量的激增,监控系统面临着数据量庞大、处理速度要求高、存储压力大等挑战,针对传统监控系统在大数据环境下遇到的技术瓶颈,本文设计一套基于分布式架构的监控系统解决方案。该系统采用Hadoop生态圈技术,结合流式计算框架Storm实现数据实时处理,运用Kafka消息队列解决数据传输问题,通过MongoDB分布式数据库存储海量数据,系统实现了数据采集、传输、处理、存储及展示全流程自动化,经过测试验证,可支持每秒百万级数据处理能力,数据处理延迟控制在毫秒级,为大数据环境下监控系统建设提供参考。 展开更多
关键词 分布式架构 流式计算 实时处理 数据存储
在线阅读 下载PDF
一种面向并发AI数据流边缘处理集群的资源配置算法
18
作者 陈逸飞 陈庆奎 《智能计算机与应用》 2025年第11期1-8,共8页
面对多个AI (Artificial Intelligence)数据流需要并发处理以及边缘处理集群中各个单元的处理能力不同的情况,如何充分利用边缘集群中的各类资源,降低AI数据流任务的处理时间和能耗,是一个具有重要意义的课题。本文设计了一个面向并发A... 面对多个AI (Artificial Intelligence)数据流需要并发处理以及边缘处理集群中各个单元的处理能力不同的情况,如何充分利用边缘集群中的各类资源,降低AI数据流任务的处理时间和能耗,是一个具有重要意义的课题。本文设计了一个面向并发AI数据流的边缘集群架构,并对并发AI数据流以及边缘处理集群中的处理单元资源进行建模,提出了一种面向并发AI数据流边缘处理集群的资源配置算法DLBE-PSO,该算法是基于粒子群的多目标优化算法,采用混沌映射与非线性递减结合的方式来更新权重,提高算法后期的局部搜索能力,同时对任务处理时间、边缘集群能耗、边缘集群负载均衡这3个关键指标进行分析。 展开更多
关键词 并发AI数据流 多目标优化 粒子群 任务处理时间 能耗 负载均衡
在线阅读 下载PDF
面向实时处理场景的流式大数据架构优化与应用实践研究
19
作者 李宜学 《计算机应用文摘》 2025年第14期122-124,共3页
随着数据生成速度的指数级增长,传统批处理架构已无法满足实时数据处理需求。文章针对实时处理场景深入研究了流式大数据架构的优化策略与应用实践。通过分析Lambda架构的核心思想与层次划分,结合Apache Kafka,Apache Flink等关键技术组... 随着数据生成速度的指数级增长,传统批处理架构已无法满足实时数据处理需求。文章针对实时处理场景深入研究了流式大数据架构的优化策略与应用实践。通过分析Lambda架构的核心思想与层次划分,结合Apache Kafka,Apache Flink等关键技术组件,提出了一套高效的流式大数据处理方案。结果表明,该方案能够显著提升数据处理速度与准确性,降低系统延迟,为实时决策提供有力支持。 展开更多
关键词 流式大数据架构 实时处理 Lambda架构 Apache Kafka Apache Flink
在线阅读 下载PDF
基于Spark Streaming的实时交通数据处理平台 被引量:13
20
作者 谭亮 周静 《计算机系统应用》 2018年第10期133-139,共7页
交通大数据是解决城市交通问题的最基本条件,是制定宏观城市交通发展战略规划和进行微观道路交通管理与控制的重要保障.针对于智能交通系统中数据产生快、实时性强、数据量大的特点,本文基于Spark Streaming和Apache Kafka的组合构建了... 交通大数据是解决城市交通问题的最基本条件,是制定宏观城市交通发展战略规划和进行微观道路交通管理与控制的重要保障.针对于智能交通系统中数据产生快、实时性强、数据量大的特点,本文基于Spark Streaming和Apache Kafka的组合构建了一个实时交通数据处理平台,用于处理通过双基基站采集的数据,采用时间窗口机制从持续的Kafka分布式消息队列中获取数据,并按照规则将数据分类处理后保存到数据库.本文对平台的系统架构和内部结构进行了详细的介绍,并通过实验验证了系统的实时处理能力,完全可以在大规模高并发的数据流下进行应用. 展开更多
关键词 大数据 流处理系统 双基基站数据 SPARK streamING APACHE Kafka
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部