期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
An Improvement of Data Cleaning Method for Grain Big Data Processing Using Task Merging 被引量:1
1
作者 Feiyu Lian Maixia Fu Xingang Ju 《Journal of Computer and Communications》 2020年第3期1-19,共19页
Data quality has exerted important influence over the application of grain big data, so data cleaning is a necessary and important work. In MapReduce frame, parallel technique is often used to execute data cleaning in... Data quality has exerted important influence over the application of grain big data, so data cleaning is a necessary and important work. In MapReduce frame, parallel technique is often used to execute data cleaning in high scalability mode, but due to the lack of effective design, there are amounts of computing redundancy in the process of data cleaning, which results in lower performance. In this research, we found that some tasks often are carried out multiple times on same input files, or require same operation results in the process of data cleaning. For this problem, we proposed a new optimization technique that is based on task merge. By merging simple or redundancy computations on same input files, the number of the loop computation in MapReduce can be reduced greatly. The experiment shows, by this means, the overall system runtime is significantly reduced, which proves that the process of data cleaning is optimized. In this paper, we optimized several modules of data cleaning such as entity identification, inconsistent data restoration, and missing value filling. Experimental results show that the proposed method in this paper can increase efficiency for grain big data cleaning. 展开更多
关键词 GRAIN big DATA DATA Cleaning task MERGING Hadoop MAPREDUCE
在线阅读 下载PDF
Online Shuffling with Task Duplication in Cloud
2
作者 ZANG Qimeng GUO Song 《ZTE Communications》 2017年第4期38-42,共5页
Task duplication has been widely adopted to mitigate the impact of stragglers that run much longer than normal tasks. However,task duplication on data pipelining case would generate excessive traffic over the datacent... Task duplication has been widely adopted to mitigate the impact of stragglers that run much longer than normal tasks. However,task duplication on data pipelining case would generate excessive traffic over the datacenter networks. In this paper, we study minimizing the traffic cost for data pipelining task replications and design a controller that chooses the data generated by the first finished task and discards data generated later by other replications belonging to the same task. Each task replication communicates with the controller when it finishes a data processing, which causes additional network overhead. Hence, we try to reduce the network overhead and make a trade-off between the delay of data block and the network overhead. Finally, extensive simulation results demonstrate that our proposal can minimize network traffic cost under data pipelining case. 展开更多
关键词 CLOUD computing big data SHUFFLING task DUPLICATION TRAFFIC
在线阅读 下载PDF
大数据赋能的多任务旅游信息分析框架 被引量:1
3
作者 杨光辉 李源彬 杨红兵 《无线电通信技术》 北大核心 2025年第1期187-195,共9页
以旅游大数据为基础,考虑长时间范围内的滞后效应以及不同搜索强度指数(Search Intensity Index,SII)之间的多任务影响,提出一种基于大数据的多任务旅游信息分析(Multi-tasking Tourism Information Analysis Based on Big Data,MTIABD... 以旅游大数据为基础,考虑长时间范围内的滞后效应以及不同搜索强度指数(Search Intensity Index,SII)之间的多任务影响,提出一种基于大数据的多任务旅游信息分析(Multi-tasking Tourism Information Analysis Based on Big Data,MTIABD)框架。使用融合信息重排序技术预测旅游需求,具体根据图引导结构模拟历史变量对未来变量的滞后影响。每个变量通过时间维度上的卷积神经网络(Convolutional Neural Network,CNN)进行独立编码,利用二分图动态建模滞后效应,通过图聚合进行挖掘,实现对旅游需求的精准预测。基于上述技术,构建旅游需求预测系统,旅游者能够根据需求检索不同景点的信息。在真实数据集上进行大量实验,结果表明所提出的MTIABD框架在一步和多步预测方面均优于现有方法。在平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)指标下,相较于基于实例的多变量时间序列图预测框架(Instance-wise Graph-rased Framework for Multivariate Time Series Forecasting,IGMTF),MTIABD在HK-2021数据集上的性能提高了16.75%,在MO-2021数据集上的性能提高了19.79%。 展开更多
关键词 大数据 多任务 图神经网络 滞后效应
在线阅读 下载PDF
基于云计算的电力大数据中心任务调度方法研究 被引量:1
4
作者 冯杨 《微型电脑应用》 2025年第1期243-245,263,共4页
针对现有云环境下电力大数据中心在任务调度时存在的能耗高、运算效率低等问题,在电力云数据中心架构的基础上,以最小完成时间和最小云资源花费为优化目标函数建立了多目标优化的云计算任务调度模型,并将改进的粒子群算法与遗传算法相... 针对现有云环境下电力大数据中心在任务调度时存在的能耗高、运算效率低等问题,在电力云数据中心架构的基础上,以最小完成时间和最小云资源花费为优化目标函数建立了多目标优化的云计算任务调度模型,并将改进的粒子群算法与遗传算法相结合用于模型求解。通过实验分析单目标调度和多目标调度,验证了所提方法的可行性和优越性。与常规方法相比,所提方法可以更好地平衡运算效率和云资源花费之间的关系,并在完成时间和云资源花费上都具有良好的性能。该研究为电力云计算中心的发展提供了一定的参考。 展开更多
关键词 云计算 电力大数据 任务调度 粒子群优化算法 遗传算法
在线阅读 下载PDF
融入大概念、大任务、大问题的大单元体育教学:路径与保障
5
作者 罗燕 缪猛剑 吴进 《体育学刊》 北大核心 2025年第6期112-118,共7页
义务教育阶段体育与健康课程标准(2022版)首次提出了“大概念、大任务、大问题、大单元”等重要概念,是体育课程理念的标志性突破,这对于深化体育课程改革提出了新的要求。基于目前以上4个概念研究存在的问题,对大概念、大任务、大问题... 义务教育阶段体育与健康课程标准(2022版)首次提出了“大概念、大任务、大问题、大单元”等重要概念,是体育课程理念的标志性突破,这对于深化体育课程改革提出了新的要求。基于目前以上4个概念研究存在的问题,对大概念、大任务、大问题融入大单元教学路径与保障进行了探讨。研究认为,传统体育单元教学面临“技能学时‘短时化’、学习内容‘碎片化’、技能习得‘无痕化’、教学过程‘重复化’”困境,阻碍了学生体育核心素养的培育与发展。以高中学段(水平五)乒乓球教学为例,阐释了将大概念、大任务、大问题融入大单元教学的思路与方案。其保障策略为:(1)以运动兴趣为基点,实施选项课大单元教学;(2)以充足学时为保障,构建大单元结构化教学;(3)以教学方式转型为契机,创新大单元教学范式;(4)以集体教研为助力,提升大单元教学质量;(5)以体育素养为标准,实现大单元表现性评价。 展开更多
关键词 学校体育 大单元教学 大概念 大任务 大问题 乒乓球
在线阅读 下载PDF
定周期调度系统资源量化的设计与实现
6
作者 蔡黎明 张云龙 +3 位作者 卿林鑫 丁江伟 黄明 罗云瑞 《信息技术与标准化》 2025年第7期88-92,共5页
在大数据任务调度平台中,定周期任务调度是关键的调度方式。为确保资源的高效管理与调度系统的稳定负载,对定周期任务的调度资源进行合理量化至关重要,提出了一种基于触发频率分区段管理的调度资源量化方法。该方法通过精细划分调度系... 在大数据任务调度平台中,定周期任务调度是关键的调度方式。为确保资源的高效管理与调度系统的稳定负载,对定周期任务的调度资源进行合理量化至关重要,提出了一种基于触发频率分区段管理的调度资源量化方法。该方法通过精细划分调度系统内的定周期任务粒度,并设置可控的频度占比配置,实现了对调度资源的精准管理。经过模拟环境和实际生产环境的双重验证,结果表明该方法能有效量化管理定周期任务的调度资源,从而确保调度系统在复杂生产环境中的稳定运行。 展开更多
关键词 大数据 定周期任务 调度资源量化 频率 粒度
在线阅读 下载PDF
大数据驱动的科研过程评估分析系统
7
作者 廖龙龙 曾文滨 +2 位作者 方鑫 郑志伟 于元隆 《河南科技学院学报(自然科学版)》 2025年第3期70-79,共10页
目的 针对科研项目实施过程中的任务调度优化、任务数据实时共享、工效分析及其制约因素挖掘等需求,设计一种大数据驱动的科研过程评估分析系统HTower.方法 系统以任务为基本单元进行项目调度与实施过程跟踪分析,通过项目任务执行方案... 目的 针对科研项目实施过程中的任务调度优化、任务数据实时共享、工效分析及其制约因素挖掘等需求,设计一种大数据驱动的科研过程评估分析系统HTower.方法 系统以任务为基本单元进行项目调度与实施过程跟踪分析,通过项目任务执行方案与结果等内容的在线协同编辑,解决科研过程数据协同更新与共享难的问题,减少因频繁会议和即时消息通讯所浪费的科研时间.依据工时、工效、任务进度等科研过程量化评估结果,挖掘制约科研项目实施效率和个人科研效率提升的关键因素,指导项目负责人和科研人员提高科研效率和项目实施质量.结果 HTower系统可将项目任务完成的提前率提升到10.8%,准点率达到79.5%,既能通过量化评估分析制约科研项目实施效率的相关因素,也能用于研究生科研过程的量化评估.结论 HTower系统的应用不仅可提高项目任务调度水平和团队科研效率,而且可及时发现研究生科研效率较低的原因,优化导师的学术指导策略,促进研究生科研能力的提升. 展开更多
关键词 大数据 科研过程评估 任务调度 协同编辑 量化评估
在线阅读 下载PDF
新课标背景下初中地理“大任务教学”探究
8
作者 王自希 《当代教育理论与实践》 2025年第2期46-50,共5页
《义务教育课程方案(2022年版)》指出课程教学要坚持素养导向、体现育人为本。随着新课程改革的不断深入,传统的教学理论与方法难以满足当前中学地理的教学需求,存在填鸭式教学和满堂灌现象依然普遍、单元教学前后缺乏联系等问题。文章... 《义务教育课程方案(2022年版)》指出课程教学要坚持素养导向、体现育人为本。随着新课程改革的不断深入,传统的教学理论与方法难以满足当前中学地理的教学需求,存在填鸭式教学和满堂灌现象依然普遍、单元教学前后缺乏联系等问题。文章在分析大任务教学概念、主要特征和现实意义的基础上,提出教师要树立大单元教学观念、注重建构单元主题、注重课堂情景化设计、注重创造性设计并使用问题链等“大任务教学”实施的基本策略,为“低负高效”课堂赋能和初中地理教学提供参考。 展开更多
关键词 新课标 初中地理 “大任务”教学 教学模式
在线阅读 下载PDF
并发式Spark消息分发器
9
作者 何玉林 林泽杰 +2 位作者 徐毓阳 成英超 黄哲学 《深圳大学学报(理工版)》 北大核心 2025年第3期317-325,I0012,I0013,共11页
在大数据计算框架Spark中,驱动器采用迭代式消息分发机制,会增加任务提交的时间开销,影响任务执行的启动时间,限制了任务执行的并发性,导致多个执行器处于空闲等待状态,造成计算资源的浪费.使用线程池调度策略,构建一种高效且轻量级的... 在大数据计算框架Spark中,驱动器采用迭代式消息分发机制,会增加任务提交的时间开销,影响任务执行的启动时间,限制了任务执行的并发性,导致多个执行器处于空闲等待状态,造成计算资源的浪费.使用线程池调度策略,构建一种高效且轻量级的并发式Spark消息分发器.与迭代式Spark消息分发器不同,并发式消息分发器更加关注且更适合调度开销较大的细粒度任务作业,通过解析包含执行器重要信息的元数据,获取任务列表及各个任务对应的执行器标识,创建线程池并为每个任务启动异步计算,从而实现并发式任务分发,在保证系统稳定和任务顺利执行的前提下,最大程度地减少任务分发的时间开销.在虚拟机构建的仿真集群环境上,通过与迭代式消息分发器进行对比,证实了并发式消息分发器的良好效果.实验结果表明,在内存保持不变的前提下,并发式Spark消息分发器可减少约9%的任务执行时间,同时能提高约5%的中央处理器的利用率.并发式Spark消息分发器有效解决了迭代式消息分发机制针对细粒度任务分发的时间开销过大和计算资源浪费的问题. 展开更多
关键词 并行处理 大数据计算 Spark通信机制 消息分发 细粒度任务 线程池调度
在线阅读 下载PDF
基于任务合并的并行大数据清洗过程优化 被引量:50
10
作者 杨东华 李宁宁 +2 位作者 王宏志 李建中 高宏 《计算机学报》 EI CSCD 北大核心 2016年第1期97-108,共12页
数据质量问题会对大数据的应用产生致命影响,因此需要对存在数据质量问题的大数据进行清洗.MapReduce编程框架可以利用并行技术实现高可扩展性的大数据清洗,然而,由于缺乏有效的设计,在基于MapReduce的数据清洗过程中存在计算的冗余,导... 数据质量问题会对大数据的应用产生致命影响,因此需要对存在数据质量问题的大数据进行清洗.MapReduce编程框架可以利用并行技术实现高可扩展性的大数据清洗,然而,由于缺乏有效的设计,在基于MapReduce的数据清洗过程中存在计算的冗余,导致性能降低.因此文中的目的是对并行数据清洗过程进行优化从而提高效率.通过研究,作者发现数据清洗中一些任务往往都运行在同一输入文件上或者利用同样的运算结果,基于该发现文中提出了一种新的优化技术——基于任务合并的优化技术.针对冗余计算和利用同一输入文件的简单计算进行合并,通过这种合并可以减少MapReduce的轮数从而减少系统运行的时间,最终达到系统优化的目标.文中针对数据清洗过程中多个复杂的模块进行了优化,具体来说分别对实体识别模块、不一致数据修复模块和缺失值填充模块进行了优化.实验结果表明,文中提出的策略可以有效提高数据清洗的效率. 展开更多
关键词 大数据 多任务优化 海量数据 数据清洗 HADOOP MAPREDUCE
在线阅读 下载PDF
大数据时代下的情报分析与挖掘技术研究——电信客户流失情况分析 被引量:20
11
作者 王晓佳 杨善林 陈志强 《情报学报》 CSSCI 北大核心 2013年第6期564-574,共11页
大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升。要在发展中抢占先机,在大数据时代获取竞争优势,就必须对原有的情报分析思路进行必要的升... 大数据时代下的信息具有体量大、复杂性高、更新速度快的特点,从具有如此复杂特性的信息中挖掘出用户所需的情报,难度较以往有了很大的提升。要在发展中抢占先机,在大数据时代获取竞争优势,就必须对原有的情报分析思路进行必要的升级改造,以满足信息的情报属性。文章在介绍了大数据以及大数据环境下情报内涵转变的原因之后,提出了一种在大数据背景下的情报分析与挖掘的建模机理,首先应用MapReduce建立情报任务分解概念模型,然后针对分解后的某一单任务数据表进行预处理和数据挖掘工作,利用数学模型、人工智能等方法构造大数据时代下情报分析与数据挖掘的新思路。最后利用仿真实验来验证这一新思路的可行性和合理性。 展开更多
关键词 情报 大数据 数据挖掘 任务分解 MAPREDUCE
在线阅读 下载PDF
大数据流式计算框架Storm的任务迁移策略 被引量:26
12
作者 鲁亮 于炯 +3 位作者 卞琛 刘月超 廖彬 李慧娟 《计算机研究与发展》 EI CSCD 北大核心 2018年第1期71-92,共22页
Storm作为流式计算模式下最具代表性的平台之一,其默认轮询的调度机制未考虑到异构环境下不同工作节点的自身性能和负载差异,以及工作节点之间的网络传输开销和节点内部的进程与线程通信开销,无法充分发挥集群的性能.为了在各类资源约... Storm作为流式计算模式下最具代表性的平台之一,其默认轮询的调度机制未考虑到异构环境下不同工作节点的自身性能和负载差异,以及工作节点之间的网络传输开销和节点内部的进程与线程通信开销,无法充分发挥集群的性能.为了在各类资源约束的前提下最小化通信开销,在建立并论证Storm资源约束模型、最优通信开销模型和任务迁移模型的基础上,提出一种异构Storm环境下的任务迁移策略(task migration strategy for heterogeneous Storm cluster,TMSH-Storm),包括源节点选择算法和任务迁移算法.其中,源节点选择算法根据集群中各工作节点CPU、内存和网络带宽的负载情况以及各类资源的优先级顺序,将超出阈值的节点加入源节点集;任务迁移算法综合迁移开销、通信开销、节点资源约束以及节点和任务负载等因素,依次将源节点中的待迁移任务异步迁移至目的节点上.实验表明:相对于现有研究而言,TMSH-Storm能有效降低延迟和节点间通信开销,且执行开销较小. 展开更多
关键词 大数据 流式计算 STORM 通信开销 任务迁移
在线阅读 下载PDF
检视大概念、主题、学习任务群与学习项目--基于知识观的视角 被引量:57
13
作者 李卫东 《课程·教材·教法》 CSSCI 北大核心 2021年第6期82-88,共7页
对于任何课程,“知识”都是一个绕不过的存在,需要什么样的知识,如何理解和运用知识是学科教学的关键问题。“以大概念为核心”“以主题为引领”的双线并进,强调了课程知识的客观性和社会性的辩证统一,既摒弃机械操练知识的技术工具主义... 对于任何课程,“知识”都是一个绕不过的存在,需要什么样的知识,如何理解和运用知识是学科教学的关键问题。“以大概念为核心”“以主题为引领”的双线并进,强调了课程知识的客观性和社会性的辩证统一,既摒弃机械操练知识的技术工具主义,又避免忽视知识的相对主义和浪漫主义。“学习任务群”“学习项目”能优化课程内容,更新教学方式,考查“学习任务群”要凸显其课程内容构建方式的属性。知识观视角下的课程标准研制、课标教材编写和教学实施都需不断反思和改进。 展开更多
关键词 知识观 大概念 主题 学习任务群
在线阅读 下载PDF
面向大数据流式计算的任务管理技术综述 被引量:10
14
作者 梁毅 侯颖 +1 位作者 陈诚 金翊 《计算机工程与科学》 CSCD 北大核心 2017年第2期215-226,共12页
流式计算是大数据的一种重要计算模式,大数据流式计算已成为研究热点。任务管理是大数据流式计算的核心功能之一,负责对流式计算的任务进行资源调度及全生命周期管理。目前对于大数据流式计算的技术调研工作主要集中于流式计算应用需求... 流式计算是大数据的一种重要计算模式,大数据流式计算已成为研究热点。任务管理是大数据流式计算的核心功能之一,负责对流式计算的任务进行资源调度及全生命周期管理。目前对于大数据流式计算的技术调研工作主要集中于流式计算应用需求、体系结构及整体技术,缺乏对大数据流式计算任务管理技术的精细化调研分析。首先给出流式计算任务管理的抽象功能模型,其次基于该模型对任务管理的关键技术进行了分类和综述,最后对既有主流的大数据流式计算系统对上述关键技术的应用、集成和优化进行了调研分析。 展开更多
关键词 大数据流式计算 任务管理 抽象功能模型 资源分配 数据分发 容错
在线阅读 下载PDF
Storm环境下基于权重的任务调度算法 被引量:16
15
作者 鲁亮 于炯 +3 位作者 卞琛 英昌甜 师康利 蒲勇霖 《计算机应用》 CSCD 北大核心 2018年第3期699-706,共8页
大数据流式计算平台Apache Storm默认采用轮询的方式进行任务调度,未考虑到拓扑中各任务计算开销的差异以及任务之间不同类型的通信模式,在负载均衡和通信开销方面存在较大的优化空间。针对这一问题,提出一种Storm环境下基于权重的任务... 大数据流式计算平台Apache Storm默认采用轮询的方式进行任务调度,未考虑到拓扑中各任务计算开销的差异以及任务之间不同类型的通信模式,在负载均衡和通信开销方面存在较大的优化空间。针对这一问题,提出一种Storm环境下基于权重的任务调度算法(TSAW-Storm)。该算法首先根据各任务的CPU资源占用情况以及任务间的数据流大小,分别确定拓扑的点权和边权;并利用最大化边权增益的思想,逐步构建起各工作节点中承载的任务集合,在保证集群负载均衡的同时,尽可能将边权较大的节点间数据流转化为节点内数据流,从而降低网络传输开销。实验结果表明,在包含有8个工作节点的WordCount基准测试中,TSAW-Storm的系统延迟和节点间数据流大小相比Storm默认调度算法分别降低了30.0%和32.9%,且各工作节点的CPU负载标准差仅为Storm默认调度算法的25.8%;此外,在与在线调度算法的对比实验中,TSAW-Storm在系统延迟、节点间数据流大小和CPU负载标准差方面分别降低了7.76%、11.8%和5.93%,且算法的执行开销明显降低,有效提高了Storm系统的运行效率。 展开更多
关键词 大数据 流式计算 STORM 权重 任务调度 负栽均衡 通信开销
在线阅读 下载PDF
云计算环境中任务调度策略 被引量:2
16
作者 王海涛 张焕青 +2 位作者 肖世平 张学平 闫力 《信息通信技术》 2015年第6期57-63,共7页
在满足用户QoS的前提条件下,对海量任务进行高效调度并对云资源进行合理分配是云计算领域的一个研究热点。文章论述云计算环境下任务调度的概念、特点和目标,归纳了云计算任务调度的研究现状,并对传统任务调度算法、Hadoop中的任务调度... 在满足用户QoS的前提条件下,对海量任务进行高效调度并对云资源进行合理分配是云计算领域的一个研究热点。文章论述云计算环境下任务调度的概念、特点和目标,归纳了云计算任务调度的研究现状,并对传统任务调度算法、Hadoop中的任务调度算法、智能化的任务调度算法的实现机制和性能指标等进行了分析与比较。分析结果表明智能化任务调度算法性能优良且适应性强,是今后的研究重点。 展开更多
关键词 大数据 云计算 任务调度 调度算法
在线阅读 下载PDF
数据依赖约束下的任务调度资源选择算法 被引量:5
17
作者 廖彬 于炯 +1 位作者 张陶 杨兴耀 《计算机应用》 CSCD 北大核心 2014年第8期2260-2266,共7页
大数据环境下的计算任务往往具有一定数据依赖性关系(如MapReduce),现有的分布式存储系统任务资源选择策略选择离请求者最近的数据块响应服务,忽略了对数据块所在服务器CPU、磁盘I/O与网络等资源负载状态的考虑。在分析研究系统集群结... 大数据环境下的计算任务往往具有一定数据依赖性关系(如MapReduce),现有的分布式存储系统任务资源选择策略选择离请求者最近的数据块响应服务,忽略了对数据块所在服务器CPU、磁盘I/O与网络等资源负载状态的考虑。在分析研究系统集群结构、文件分块、数据块存储机制的基础上,定义了集群节点矩阵、CPU负载矩阵、磁盘I/O负载矩阵、网络负载矩阵、文件分块矩阵、数据块存储矩阵与数据块存储节点状态矩阵,为任务与数据之间的依赖性构建了基础数据模型,提出了一种数据依赖约束下的最优资源选择算法(ORS2DC)。任务调度节点负责维护基础数据,MapReduce任务与数据块读取任务由于依赖资源不同而采取不同的选择策略。实验结果表明:所提算法能够为任务选择质量更高的资源,提高任务完成质量的同时减轻了NameNode负担,减小了单点故障发生的概率。 展开更多
关键词 大数据计算 分布式存储系统 任务调度 数据模型 资源选择
在线阅读 下载PDF
大数据处理框架中基于MDP的任务调度算法 被引量:2
18
作者 冯延蓬 仵博 +2 位作者 孟宪军 何国坤 江建举 《深圳职业技术学院学报》 CAS 2014年第1期7-10,共4页
针对大数据处理框架MapReduce中的任务调度问题,提出一种基于Markov决策过程(Markov Decision Process,MDP)的任务调度算法,通过状态集来描述集群中节点的负载和作业的数据本地性需求,使用状态转移函数表示调度策略对状态的影响,采用值... 针对大数据处理框架MapReduce中的任务调度问题,提出一种基于Markov决策过程(Markov Decision Process,MDP)的任务调度算法,通过状态集来描述集群中节点的负载和作业的数据本地性需求,使用状态转移函数表示调度策略对状态的影响,采用值迭代求解算法求取最优策略,实现集群中节点的最优调度.实验结果表明,该算法能够保证数据本地性的同时,减少作业响应时间,提高系统综合性能. 展开更多
关键词 大数据 MAPREDUCE MARKOV决策过程 任务调度
在线阅读 下载PDF
目标·任务·行动——《“十四五”全国档案事业发展规划》档案数据能力建设分析 被引量:10
19
作者 吴雁平 刘永 《档案管理》 北大核心 2022年第2期37-40,共4页
为落实《“十四五”全国档案事业发展规划》中数据工作要求,推动档案数据能力建设,本文采用文本分析方法,从《规划》中出现的14处“数据”入手,对《规划》中涉及数据的4方面目标、7项任务、14个行动分层逐个进行梳理分析。档案数据工作... 为落实《“十四五”全国档案事业发展规划》中数据工作要求,推动档案数据能力建设,本文采用文本分析方法,从《规划》中出现的14处“数据”入手,对《规划》中涉及数据的4方面目标、7项任务、14个行动分层逐个进行梳理分析。档案数据工作就是档案数据化与数据档案化,其核心是档案数据能力建设。数据已经成为大数据环境下档案的三大来源之一,档案数据能力建设的实质是数据信息价值判断、保存、运用能力提升,制订数据档案法规是促进档案数据工作健康发展的重要保障。 展开更多
关键词 档案事业发展规划 档案数据能力建设 目标任务 任务分层 大数据环境 档案信息
在线阅读 下载PDF
FCD大数据并行处理的动态任务调度算法 被引量:5
20
作者 陈锋 张智 +2 位作者 李琴剑 陈宇强 陈国良 《中国科学技术大学学报》 CAS CSCD 北大核心 2018年第9期718-722,共5页
浮动车数据(floating car data, FCD)技术是大规模城市路网交通流实时采集的有效方法.城市交通的动态诱导和控制需要对海量FCD进行快速处理.鉴于此,提出了FCD并行计算的动态任务调度方法.针对FCD数据包计算时间的不确定性和动态性,根据... 浮动车数据(floating car data, FCD)技术是大规模城市路网交通流实时采集的有效方法.城市交通的动态诱导和控制需要对海量FCD进行快速处理.鉴于此,提出了FCD并行计算的动态任务调度方法.针对FCD数据包计算时间的不确定性和动态性,根据计算节点的处理能力进行数据包的动态分割,在处理过程中,采用动态任务分配策略以实现计算节点的同步.该方法在龙芯国产大数据一体机平台上进行了实现,并采用现场FCD数据进行了实验验证,结果表明,该方法较轮询和Min-Min调度算法,显著地提高了并行处理的性能. 展开更多
关键词 浮动车数据 大数据 并行计算 动态任务划分 动态任务调度
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部