期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
高效数据管理系统在大数据分析中的应用
1
作者 胡春洋 印士波 +1 位作者 刘瑞康 逯佳俊 《中国自动识别技术》 2025年第2期40-44,共5页
在大数据时代,高效的数据管理系统已成为大数据分析与应用的基础支撑。从简单的网页设计到庞大的系统构建,优化数据管理系统成为提高大数据处理效能的重要手段。本文基于大数据分析中数据管理系统的重要价值,重点介绍了Bloom Filter、Da... 在大数据时代,高效的数据管理系统已成为大数据分析与应用的基础支撑。从简单的网页设计到庞大的系统构建,优化数据管理系统成为提高大数据处理效能的重要手段。本文基于大数据分析中数据管理系统的重要价值,重点介绍了Bloom Filter、DataFrame、RDD、TDengine几种数据管理系统的工作原理和场景应用,并基于不同数据管理系统的优劣势分析,提出针对性的算法优化策略,以提升数据管理系统在大数据分析中的应用质量。 展开更多
关键词 大数据分析 高效数据管理系统 Bloom Filter dataframe RDD TDengine
在线阅读 下载PDF
三种动态脚本语言产生教学日历
2
作者 彭滔 林雨 《农业网络信息》 2016年第1期124-126,共3页
快速准确地制作一张教学日历是高校每个学期都需要做的事情,本文分别用php,python,R三种流行的计算机动态脚本语言进行编程,制作出教学日历,从算法来看,用两个简单的嵌套循环就可以实现。由于语言特点不同,各语言具体实现各有特色,本文... 快速准确地制作一张教学日历是高校每个学期都需要做的事情,本文分别用php,python,R三种流行的计算机动态脚本语言进行编程,制作出教学日历,从算法来看,用两个简单的嵌套循环就可以实现。由于语言特点不同,各语言具体实现各有特色,本文结合三种计算机语言的特点,分别进行算法优化,php结合html可以生成网页格式的日历,也可以写入指定的文件夹;python语言的pandas框架可以实现数据框的结构;r语言在数据框的基础上还有向量的概念可以利用。本文给出全部源代码,并进行了讲解,在对比分析的基础上,探讨各种语言的特色。 展开更多
关键词 PHP PYTHON r 双重循环 dataframe 数据框
在线阅读 下载PDF
基于Python数据分析的模块课选课分班软件的设计与实现——以深圳科学高中高二模块课为例
3
作者 唐新彩 胡燕 《中国信息技术教育》 2021年第18期70-73,共4页
为充分培养学生的信息素养,提升高中生的信息意识,多方面地培养学生学习兴趣,高中学校普遍会给学生开设校本课或者创新选修模块课。课程涉及多个科目和全年级的学生,学生按兴趣选择对应课程,但人工处理学生的选课结果耗时耗力,本文给出... 为充分培养学生的信息素养,提升高中生的信息意识,多方面地培养学生学习兴趣,高中学校普遍会给学生开设校本课或者创新选修模块课。课程涉及多个科目和全年级的学生,学生按兴趣选择对应课程,但人工处理学生的选课结果耗时耗力,本文给出基于Python的第三方数据分析处理库pandas的模块课分班软件,大大提高了分班效率,帮助教师快速获取学生的选课结果,充分体现了信息技术的优势。 展开更多
关键词 数据处理 PYTHON PANDAS dataframe 选课分班
在线阅读 下载PDF
基于Spark+Flask的大数据可视化系统设计与实现
4
作者 王源 陈智勇 《科学与信息化》 2022年第22期73-76,共4页
大数据时代,传统的数据离线处理手段与工具已经不适应行业与技术的发展要求,本文以大数据为基础,借助于Spark大数据实时流处理引擎与Flask应用框架,使用Python语言编程实现大数据的爬取采集、清洗与存储、建模分析、数据挖掘等功能,探... 大数据时代,传统的数据离线处理手段与工具已经不适应行业与技术的发展要求,本文以大数据为基础,借助于Spark大数据实时流处理引擎与Flask应用框架,使用Python语言编程实现大数据的爬取采集、清洗与存储、建模分析、数据挖掘等功能,探索并发现大数据背后所隐藏的行为模式和内在规律,最后调用可视化库PyEcharts对数据结果进行相应图表的渲染展示。 展开更多
关键词 SPARK dataframe 分布式文件系统 流数据 数据可视化
在线阅读 下载PDF
HXPY: A High-Performance Data Processing Package for Financial Time-Series Data
5
作者 郭家栋 彭靖姝 +1 位作者 苑航 倪明选 《Journal of Computer Science & Technology》 SCIE EI CSCD 2023年第1期3-24,共22页
A tremendous amount of data has been generated by global financial markets everyday,and such time-series data needs to be analyzed in real time to explore its potential value.In recent years,we have witnessed the succ... A tremendous amount of data has been generated by global financial markets everyday,and such time-series data needs to be analyzed in real time to explore its potential value.In recent years,we have witnessed the successful adoption of machine learning models on financial data,where the importance of accuracy and timeliness demands highly effective computing frameworks.However,traditional financial time-series data processing frameworks have shown performance degradation and adaptation issues,such as the outlier handling with stock suspension in Pandas and TA-Lib.In this paper,we propose HXPY,a high-performance data processing package with a C++/Python interface for financial time-series data.HXPY supports miscellaneous acceleration techniques such as the streaming algorithm,the vectorization instruction set,and memory optimization,together with various functions such as time window functions,group operations,down-sampling operations,cross-section operations,row-wise or column-wise operations,shape transformations,and alignment functions.The results of benchmark and incremental analysis demonstrate the superior performance of HXPY compared with its counterparts.From MiBs to GiBs data,HXPY significantly outperforms other in-memory dataframe computing rivals even up to hundreds of times. 展开更多
关键词 dataframe time-series data SIMD(single instruction multiple data) CUDA(Compute Unified Device Architecture)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部