期刊文献+
共找到112篇文章
< 1 2 6 >
每页显示 20 50 100
Open Source Initiatives for Big Data Governance and Security:A Survey
1
作者 hu baiqing wang wenjie chi harold liu 《ZTE Communications》 2018年第2期55-66,共12页
With the rapid development of lnternet technology, the volume of data has increased exponentially. As the large amounts of data are no longer easy to be managed and secured by the owners, big data security and privacy... With the rapid development of lnternet technology, the volume of data has increased exponentially. As the large amounts of data are no longer easy to be managed and secured by the owners, big data security and privacy has become a hot issue. One of the most popular research fields for solving the data security and data privacy is within the scope of big data governance and security, In this paper, we introduce the basic concepts of data governance and security. Then, all the state-of-the-art open source frameworks for data governance and security, including Apache Falcon, Apache Atlas, Apache Ranger, Apache Sentry and Kerberos, are detailed and discussed with descriptions of their implementation principles and possible applications. 展开更多
关键词 big data SECURITY GOVERNANCE open source initiatives
在线阅读 下载PDF
A Surfing Concurrence Transaction Model for Key-Value NoSQL Databases
2
作者 Changqing Li Jianhua Gu 《Journal of Software Engineering and Applications》 2018年第10期467-485,共19页
As more and more application systems related to big data were developed, NoSQL (Not Only SQL) database systems are becoming more and more popular. In order to add transaction features for some NoSQL database systems, ... As more and more application systems related to big data were developed, NoSQL (Not Only SQL) database systems are becoming more and more popular. In order to add transaction features for some NoSQL database systems, many scholars have tried different techniques. Unfortunately, there is a lack of research on Redis’s transaction in the existing literatures. This paper proposes a transaction model for key-value NoSQL databases including Redis to make possible allowing users to access data in the ACID (Atomicity, Consistency, Isolation and Durability) way, and this model is vividly called the surfing concurrence transaction model. The architecture, important features and implementation principle are described in detail. The key algorithms also were given in the form of pseudo program code, and the performance also was evaluated. With the proposed model, the transactions of Key-Value NoSQL databases can be performed in a lock free and MVCC (Multi-Version Concurrency Control) free manner. This is the result of further research on the related topic, which fills the gap ignored by relevant scholars in this field to make a little contribution to the further development of NoSQL technology. 展开更多
关键词 nosql big data SURFING CONCURRENCE TRANSACTION Model KEY-VALUE nosql databases REDIS
暂未订购
Evaluating urban public facilities of Shenzhen by application of open source data 被引量:1
3
作者 Miaoxi Zhao Gaofeng Xu Yun Li 《Geo-Spatial Information Science》 CSCD 2016年第2期中插4-中插4,129-139,共12页
This article applies open source data of public facilities through data mining, not only to evaluate the public facilities from an objective dimension, but also to reflect the sensory opinions of the group factually, ... This article applies open source data of public facilities through data mining, not only to evaluate the public facilities from an objective dimension, but also to reflect the sensory opinions of the group factually, eventually realizing the evaluation measurement of urban public facilities. The research takes Shenzhen city as an empirical case and chooses typical public facilities to mine data, resolve address and weight to explore the application of public facilities evaluation under dimension reduction of open source data. The empirical study consists of three parts. first, as the objective evaluation, we estimate the density distribution and per capita of public facility through data mining and address resolution. Second, as the subjective evaluation, we carry on the location analysis to high-score public facility through attention and satisfaction data of Internet evaluation. finally, as mentioned above, we calculate the weight of objective and subjective evaluation of public facility, eventually formatting the comprehensive evaluation of public facilities. 展开更多
关键词 open source data big data PUBLIC FACILITY SHENZHEN
全文增补中
OSS Project Assessment Based on Discriminant Analysis and Jump Diffusion Process Model for Fault Big Data
4
作者 Yoshinobu Tamura Hayato Watanabe Shigeru Yamada 《American Journal of Operations Research》 2020年第6期269-283,共15页
The bug tracking system is well known as the project support tool of open source software. There are many categorical data sets recorded on the bug tracking system. In the past, many reliability assessment methods hav... The bug tracking system is well known as the project support tool of open source software. There are many categorical data sets recorded on the bug tracking system. In the past, many reliability assessment methods have been proposed in the research area of software reliability. Also, there are several software project analyses based on the software effort data such as the earned value management. In particular, the software reliability growth models can </span><span style="font-family:Verdana;">apply to the system testing phase of software development. On the other</span><span style="font-family:Verdana;"> hand, the software effort analysis can apply to all development phase, because the fault data is only recorded on the testing phase. We focus on the big fault data and effort data of open source software. Then, it is difficult to assess by using the typical statistical assessment method, because the data recorded on the bug tracking system is large scale. Also, we discuss the jump diffusion process model based on the estimation method of jump parameters by using the discriminant analysis. Moreover, we analyze actual big fault data to show numerical examples of software effort assessment considering many categorical data set. 展开更多
关键词 open source Software big Fault data Discriminant Analysis open source Project
在线阅读 下载PDF
基于NoSQL数据库的空间大数据分布式存储策略 被引量:70
5
作者 李绍俊 杨海军 +1 位作者 黄耀欢 周芹 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2017年第2期163-169,共7页
基于关系型数据库的空间数据存储与处理是地理信息系统(geographic information system,GIS)领域的主流模式,但伴随着物联网、移动互联网、云计算及空间数据采集技术的发展,空间数据已从海量特征转变为大数据特征,对空间数据的存储和管... 基于关系型数据库的空间数据存储与处理是地理信息系统(geographic information system,GIS)领域的主流模式,但伴随着物联网、移动互联网、云计算及空间数据采集技术的发展,空间数据已从海量特征转变为大数据特征,对空间数据的存储和管理在数据量和处理模式上提出了新的挑战。首先分析了基于传统的集中式存储与管理模式在处理和应用大数据方面的局限性,包括存储对象的适应性、存储能力的可扩展性及高并发处理能力要求;然后在分析当前几大主流NoSQL数据库特点的基础上,指出了空间大数据基于NoSQL数据库的单一存储模式在数据操作方式、查询方式和数据高效管理方面存在的局限性;最后结合GIS领域空间大数据存储对数据库存储能力的可扩展性及数据处理和访问的高并发要求,提出基于内存数据库和NoSQL数据库的空间大数据分布式存储与综合处理策略,并开发了原型系统对提出的存储策略进行可行性和有效性进行了验证。 展开更多
关键词 空间数据库 大数据 nosql数据库 分布式存储
原文传递
NoSQL的分析与研究 被引量:3
6
作者 陈晓男 张海越 《科技创新导报》 2015年第10期62-62,共1页
大数据的存储与管理已经不能够使用传统的关系型数据库,N0SQL应运而生,它针对关系型数据库不能解决的问题,有效地管理大数据,该文对NoSQL进行了详细的介绍,并对它的优点和缺点进行了详尽的分析与阐述。
关键词 nosql 开源 大数据 数据库
在线阅读 下载PDF
基于大数据环境的NoSQL技术分析 被引量:11
7
作者 吕冬雪 《电子设计工程》 2016年第14期33-36,39,共5页
传统关系数据库满足不了当前海量数据的高效存储和管理、高并发访问、高可用性、高扩展性、高容错性等特点的大数据环境,同时,No SQL技术在海量数据存储方面展现了许多优秀性能,因此,No SQL技术越来越受到重视。本文总结了大数据环境对... 传统关系数据库满足不了当前海量数据的高效存储和管理、高并发访问、高可用性、高扩展性、高容错性等特点的大数据环境,同时,No SQL技术在海量数据存储方面展现了许多优秀性能,因此,No SQL技术越来越受到重视。本文总结了大数据环境对数据存储的挑战,重点分析了No SQL的理论基础、系统架构、数据模型、关键技术、安全问题等,并分析了几种典型的No SQL数据库。 展开更多
关键词 大数据 nosql 关系数据库 数据存储
在线阅读 下载PDF
大数据下的NoSQL数据库技术分析 被引量:13
8
作者 李伟 《信息通信》 2014年第7期72-73,共2页
随着大数据的不断发展和web2.0的快速应用,非关系型、分布式数据存储技术迅速发展,而NoSQL数据库的出现就是为了解决当前计算机体系结构在存储大数据时要求快速、可扩展的问题。文章总结了NoSQL的优势,分析了NoSQL数据库的系统架构、数... 随着大数据的不断发展和web2.0的快速应用,非关系型、分布式数据存储技术迅速发展,而NoSQL数据库的出现就是为了解决当前计算机体系结构在存储大数据时要求快速、可扩展的问题。文章总结了NoSQL的优势,分析了NoSQL数据库的系统架构、数据存储和关键技术。 展开更多
关键词 大数据 nosql数据库 数据存储 一致性哈希
在线阅读 下载PDF
大数据时代基于NoSQL数据库查询技术的应用 被引量:3
9
作者 陈果 《办公自动化》 2021年第5期59-60,46,共3页
随着互联网的普及与发展,网络平台产生的数据也越来越多,这些数据在内容和形式上呈现出多样化的特点,但并没有形成成熟的关系型数据库。为了满足人们的需求,基于NoSQL框架的数据查询技术由此产生。本文评估了NoSQL数据库的底层技术,考... 随着互联网的普及与发展,网络平台产生的数据也越来越多,这些数据在内容和形式上呈现出多样化的特点,但并没有形成成熟的关系型数据库。为了满足人们的需求,基于NoSQL框架的数据查询技术由此产生。本文评估了NoSQL数据库的底层技术,考虑到它们对特定需求的适用性。通过数据模型、查询可能性、并发控制、分区和复制机会来比较这些系统。 展开更多
关键词 大数据时代 nosql数据库 查询技术 应用研究
在线阅读 下载PDF
基于NoSQL的特色数据库系统研究 被引量:5
10
作者 赵永强 《图书馆工作与研究》 CSSCI 北大核心 2018年第S1期97-99,124,共4页
目前大多数高校采用的关系型特色数据库系统面对大数据时出现了瓶颈。本文通过分析关系型特色数据库系统瓶颈,研究了基于NoSQL的特色数据库系统,阐述了其优势,指出该系统能够满足大数据对特色数据库系统的要求。
关键词 特色数据库 大数据 nosql MONGODB
原文传递
SQL与NoSQL数据库间的数据查询转换方法研究 被引量:5
11
作者 张冰冰 《电子科技》 2017年第8期109-112,116,共5页
针对现有系统希望扩展其服务从而支持数据的快速增长的问题,提出了一种数据适配器系统来支持包括关系数据库(RDB)和NoSQL数据库的混合数据库架构。在所提出的数据适配器系统中提供了阻塞转换模式(BT模式)、阻塞转储模式(BD模式)和直接... 针对现有系统希望扩展其服务从而支持数据的快速增长的问题,提出了一种数据适配器系统来支持包括关系数据库(RDB)和NoSQL数据库的混合数据库架构。在所提出的数据适配器系统中提供了阻塞转换模式(BT模式)、阻塞转储模式(BD模式)和直接访问模式(DA模式)共3种查询模式。在所述的3种查询模式下,通过实验研究分析了不同的数据库大小、不同的表大小和应用程序类型对于数据适配器中应用程序性能的影响。结果表明,在BT模式下,应用程序性能受到最大的影响,且BT模式下的应用程序等待时间最长。 展开更多
关键词 nosql 数据适配器 大数据 数据库服务
在线阅读 下载PDF
新工科背景下NoSQL数据库技术课程建设探索与实践 被引量:8
12
作者 袁燕妮 吴斌 王柏 《软件导刊》 2022年第7期21-26,共6页
针对新工科新兴的数据科学与大数据技术专业中NoSQL数据库技术课程目前缺乏成熟教学大纲指引问题,面向学生大数据存储技术能力培养,基于OBE理念与时俱进地确定课程目标,并提出一个以图类、文档类、键值类、列族类NoSQL数据库技术为核心... 针对新工科新兴的数据科学与大数据技术专业中NoSQL数据库技术课程目前缺乏成熟教学大纲指引问题,面向学生大数据存储技术能力培养,基于OBE理念与时俱进地确定课程目标,并提出一个以图类、文档类、键值类、列族类NoSQL数据库技术为核心构成的8个知识模块学习路径,采用理论与实践相结合的教学模式,综合应用问题驱动教学方法、SPOC混合式教学方法、纠错优化学习方法、自主选题分组研讨学习方法及能力递进式实践教学方法达成课程培养目标。经过两年的混合式创新教学探索与实践,教学评价结果表明,该课程建设方案可适应当今的社会人才培养需求,能够有效提升学生的专业能力,为进一步培养学生的复杂系统开发能力打好基础。 展开更多
关键词 新工科 数据科学与大数据技术 nosql数据库技术 教学改革
在线阅读 下载PDF
基于分布式NoSQL数据库的档案大数据存储与检索方案研究 被引量:26
13
作者 施晓峰 《计算机应用与软件》 北大核心 2019年第5期15-20,共6页
随着数字档案资源体系建设的不断加快,档案数据的种类日趋丰富,数量迅猛增长,呈现出大数据的特征。传统关系型数据库与集中式存储在档案大数据处理方面存在着适应性、可靠性和扩展性不足的问题。针对当前遇到的问题,通过分析传统档案数... 随着数字档案资源体系建设的不断加快,档案数据的种类日趋丰富,数量迅猛增长,呈现出大数据的特征。传统关系型数据库与集中式存储在档案大数据处理方面存在着适应性、可靠性和扩展性不足的问题。针对当前遇到的问题,通过分析传统档案数据存储模式的局限性,将分布式NoSQL数据库、分布式文件系统、分布式搜索引擎应用于档案大数据的管理。设计一套基于分布式NoSQL数据库的档案大数据存储与检索方案,并开发原型系统进行验证。 展开更多
关键词 档案 大数据 nosql 分布式数据库
在线阅读 下载PDF
一种以NoSQL数据库为核心的工业历史数据存储方案 被引量:3
14
作者 冯德伦 《自动化与仪器仪表》 2018年第8期60-63,共4页
近年来,随着工业数据类型及数据量大幅增加,以及分析型工业应用更广泛的使用,对工业历史数据的存储提出了新的需求,例如非结构化数据存储、分析型应用所需的高速读取、分布式部署等。传统的工业历史数据库已经不能满足这一要求。针对新... 近年来,随着工业数据类型及数据量大幅增加,以及分析型工业应用更广泛的使用,对工业历史数据的存储提出了新的需求,例如非结构化数据存储、分析型应用所需的高速读取、分布式部署等。传统的工业历史数据库已经不能满足这一要求。针对新的存储要求,提出了一种以No SQL数据库的合理组合进行数据存储,以OPC UA为数据集成及建模方法的工业历史数据存储方案。通过实际应用,验证了该方案的有效性。 展开更多
关键词 nosql数据库 工业历史数据库 OPC UA 工业大数据
原文传递
大数据时代传统关系数据库与NoSQL数据库的对比与分析 被引量:7
15
作者 段晨辉 张小女 《信息与电脑》 2021年第15期172-174,共3页
传统关系数据库能够很好地支持结构化数据的存储和管理,且具有完备的数学理论、完善的事务管理机制和高效的查询处理引擎,因此得到了广泛应用。但随着大数据时代的到来,传统关系数据库无法满足各种类型的非结构化数据的大规模存储和高... 传统关系数据库能够很好地支持结构化数据的存储和管理,且具有完备的数学理论、完善的事务管理机制和高效的查询处理引擎,因此得到了广泛应用。但随着大数据时代的到来,传统关系数据库无法满足各种类型的非结构化数据的大规模存储和高效处理需求,因此出现了NoSQL(Not only SQL)数据库。本文首先对二者进行了介绍,然后又从多个方面进行了比较和分析。 展开更多
关键词 传统关系数据库 大数据时代 nosql数据库
在线阅读 下载PDF
Big data storage technologies: a survey 被引量:20
16
作者 Aisha SIDDIQA Ahmad KARIM Abdullah GANI 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2017年第8期1040-1070,共31页
There is a great thrust in industry toward the development of more feasible and viable tools for storing fast-growing volume, velocity, and diversity of data, termed 'big data'. The structural shift of the storage m... There is a great thrust in industry toward the development of more feasible and viable tools for storing fast-growing volume, velocity, and diversity of data, termed 'big data'. The structural shift of the storage mechanism from traditional data management systems to NoSQL technology is due to the intention of fulfilling big data storage requirements. However, the available big data storage technologies are inefficient to provide consistent, scalable, and available solutions for continuously growing heterogeneous data. Storage is the preliminary process of big data analytics for real-world applications such as scientific experiments, healthcare, social networks, and e-business. So far, Amazon, Google, and Apache are some of the industry standards in providing big data storage solutions, yet the literature does not report an in-depth survey of storage technologies available for big data, investigating the performance and magnitude gains of these technologies. The primary objective of this paper is to conduct a comprehensive investigation of state-of-the-art storage technologies available for big data. A well-defined taxonomy of big data storage technologies is presented to assist data analysts and researchers in understanding and selecting a storage mecha- nism that better fits their needs. To evaluate the performance of different storage architectures, we compare and analyze the ex- isling approaches using Brewer's CAP theorem. The significance and applications of storage technologies and support to other categories are discussed. Several future research challenges are highlighted with the intention to expedite the deployment of a reliable and scalable storage system. 展开更多
关键词 big data big data storage nosql databases Distributed databases CAP theorem SCALABILITY Consistency-partition resilience Availability-partition resilience
原文传递
高等职业教育人工智能应用场景框架构建及调查分析
17
作者 魏顺平 卢雨婷 +2 位作者 刘欣怡 梁振辉 江凤娟 《中国职业技术教育》 北大核心 2025年第23期34-46,共13页
当前,我国各级各类教育加快推进教育数字化,探索“人工智能+教育”应用场景新范式。采用扎根理论,聚焦高等职业教育领域,构建人工智能教育应用场景框架,进而利用大数据调查法,面向全国1 526所高职院校调查人工智能应用场景分布现状。研... 当前,我国各级各类教育加快推进教育数字化,探索“人工智能+教育”应用场景新范式。采用扎根理论,聚焦高等职业教育领域,构建人工智能教育应用场景框架,进而利用大数据调查法,面向全国1 526所高职院校调查人工智能应用场景分布现状。研究发现:高职人工智能应用场景呈现“基础场景占主导、高阶场景萌芽”的分布特征;区域分化与技术短板并存,高职人工智能应用呈现三级阶梯式落差;“双高”院校示范性需加强,虽在智能助管领域表现突出,但智能助评与教育环境赋能薄弱。为此,提出高职院校需均衡智能场景分布、统筹区域协同发展、强化“双高”示范效应、构建动态诊断体系等建议。 展开更多
关键词 高职教育 人工智能 扎根理论 开源大数据调查法 应用场景
原文传递
司法裁判数据开放时代的判例——在司法裁判开放数据的时代重新解读卡赫博尼耶关于判例的论述 被引量:1
18
作者 吴沣桦(译) 《河北法学》 北大核心 2025年第8期140-163,共24页
卡赫博尼耶从判例与习惯的经典对照中总结出判例形成的三要素,即物质要素、心理要素和公开性要素,并对这些术语作了限制性的解释。法国进入“数字共和国”时代后,随着司法裁判数据开放的推进,司法数字化进程迈入了一个新阶段。与此同时... 卡赫博尼耶从判例与习惯的经典对照中总结出判例形成的三要素,即物质要素、心理要素和公开性要素,并对这些术语作了限制性的解释。法国进入“数字共和国”时代后,随着司法裁判数据开放的推进,司法数字化进程迈入了一个新阶段。与此同时,司法裁判数据开放也引发了判例概念的改变,大规模的裁判线上发布开放了对事实审法院裁判的访问,这使得除最高司法法院的判决之外,事实审法院的裁判也可能成为判例。面对司法裁判数据开放带来的巨大影响,既要避免在判例的概念上采取任何僵化的立场,也要避免判例性质的改变可能带来的司法裁判平均化和法律推理贫困化。司法裁判数据开放也最终否定了判例与习惯的对照,判例比以往任何时候都更不能被视为“法官的习惯”。经过六十多年,卡赫博尼耶对判例构成的三要素所表达的保留意见依然适用。 展开更多
关键词 开放数据 司法大数据 判例 判决公开 法律渊源
原文传递
基于Python语言的网络舆情大数据传播特征挖掘研究
19
作者 胡贵恒 张震 陈翠红 《陇东学院学报》 2025年第2期21-26,共6页
为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据... 为解决网络舆情大数据传播特征挖掘存在读入延迟等问题,提出基于Python语言的网络舆情大数据传播特征挖掘研究。通过Python语言设计基于scrapy开源结构的改进爬虫算法,爬取网络中的舆情大数据;构建舆情大数据文本空间向量模型,提取数据内的文本特征;采用时间序列模型消除文本特征延时性,通过基于特征词向量的短文本聚类算法,计算短文本之间语义关联性,依据该关联性并通过层次聚类算法挖掘网络舆情大数据传播特征。经实验验证,该方法具有较低的读入延迟,能够挖掘得到舆情大数据的网络关注度、发帖数量以及转发时间频率等传播特征。 展开更多
关键词 PYTHON语言 网络舆情 大数据 传播特征挖掘 scrapy开源结构 网络爬虫
在线阅读 下载PDF
数据管理技术的新格局 被引量:110
20
作者 覃雄派 王会举 +5 位作者 李芙蓉 李翠平 陈红 周烜 杜小勇 王珊 《软件学报》 EI CSCD 北大核心 2013年第2期175-197,共23页
数据获取技术的革命性进步、存储器价格的显著下降以及人们希望从数据中获得知识的客观需要等,催生了大数据.数据管理技术迎来了大数据时代.关系数据库技术经历了20世纪70年代以来40年的发展,目前遇到了系统扩展性不足、支持数据类型单... 数据获取技术的革命性进步、存储器价格的显著下降以及人们希望从数据中获得知识的客观需要等,催生了大数据.数据管理技术迎来了大数据时代.关系数据库技术经历了20世纪70年代以来40年的发展,目前遇到了系统扩展性不足、支持数据类型单一等困难.近年来,noSQL技术异军突起,对多种类型的数据进行有效的管理、处理和分析;通过并行处理技术获得良好的系统性能;并以其高度的扩展性,满足不断增长的数据量的处理要求.试图沿着数据库技术进步的历史脉络,从应用维度(操作型与分析型应用)入手,为读者展开当今数据管理技术的新格局,讨论具有挑战性的重要问题,并介绍作者自己的研究工作. 展开更多
关键词 关系数据库 nosql 大数据 操作型 分析型 新格局
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部