期刊文献+

数据湖架构在健康大数据科学计算应用中的构想 被引量:10

Conception of Data Lake Architecture in Health Big Data Scientific Computing Environment
在线阅读 下载PDF
导出
摘要 随着健康大数据的飞速发展,对疾控科学计算环境提出新的架构要求和管理要求,数据湖架构能够解决疾控科学计算面临的问题.建设基于数据湖架构的科学计算环境,借助大数据分布式存储和分布式计算相关技术的应用,能够有效融合健康大数据,充分挖掘健康大数据价值;能够整合、优化现有计算资源,节约成本,实现根据任务需求,按需灵活分配计算资源;能够实现科研数据全生命周期管理,提高科学计算的工作效率和透明度,并提高疾控数据管理和分析应用的水平. The rapid development of health big data puts forward new architecture and management requirements for CDCs'scientific computing environment,and Data Lake architecture can solve the problems.To build a scientific computing environment based on Data Lake architecture with distributed storage and distributed computing,it can effectively integrate health big data,fully mining the value of health big data,in teg rate and optimize computing resources,realize the flexible distributi on of computi ng resources and save costs,realize the whole life cycle management of scientific research data,and improve the efficiency and transparency of scientific computing,promote the level of disease control data management and analysis.
作者 李言飞 LI Yanfei(Chinese Center for Disease Control and Prevention,Beijing 102206,China)
出处 《中国卫生信息管理杂志》 2020年第4期533-537,共5页 Chinese Journal of Health Informatics and Management
基金 国家科技重大专项项目(项目编号:2017ZX10303401-005)
关键词 大数据 数据湖 分布式存储 分布式计算 SPARK big data data lake distributed storage distributed computing Spark
  • 相关文献

参考文献5

二级参考文献33

共引文献220

同被引文献61

引证文献10

二级引证文献33

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部