期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Hadoop和Mahout的分布式推荐引擎的设计 被引量:1
1
作者 郭双宙 《科技情报开发与经济》 2014年第7期119-121,共3页
推荐方法研究是信息检索、数据挖掘和机器学习等智能信息处理领域的研究热点。分数据存储层、产生推荐层和应用层3个层次,介绍了基于Hadoop和Mahout的分布式推荐引擎的设计方案。
关键词 分布式推荐引擎 架构设计 hadoo Mahout 用户相似度 协同过滤
在线阅读 下载PDF
基于MapReduce和矩阵的频繁项集挖掘算法 被引量:7
2
作者 周国军 龚榆桐 《微电子学与计算机》 CSCD 北大核心 2016年第5期119-123,共5页
为了能高效地从大数据集中挖掘所有频繁项集,提出了一种基于MapReduce和矩阵的频繁项集挖掘算法.该算法将事务数据库转化为矩阵,按照垂直划分方法将矩阵分解成多个规模相同的子矩阵,根据MapReduce模型将子矩阵分配给计算机集群的节点,... 为了能高效地从大数据集中挖掘所有频繁项集,提出了一种基于MapReduce和矩阵的频繁项集挖掘算法.该算法将事务数据库转化为矩阵,按照垂直划分方法将矩阵分解成多个规模相同的子矩阵,根据MapReduce模型将子矩阵分配给计算机集群的节点,各节点并行对子矩阵计算候选项集的支持度.该算法在执行过程中产生的通信量较少,实现了节点计算任务的负载平衡.在Hadoop平台上测试了算法的性能,实验结果表明该算法具有较好的加速比和可扩展性,适合对大数据集挖掘频繁项集. 展开更多
关键词 MAPREDUCE hadooP平台 矩阵 频繁项集 关联规则
在线阅读 下载PDF
基于MapReduce的大数据时代数据处理技术研究 被引量:1
3
作者 杜艳绥 《电脑知识与技术》 2015年第4期1-2,4,共3页
最近几年,随着互联网技术和云计算技术的极大普及和广泛应用,网络中的数据正在以前所未有的迅猛速度增长和积累,根据Facebook的统计,每天将近产生500TB的数据,可见大数据时代已经开始走入了我们的生活之中,那么如何能够更好的对... 最近几年,随着互联网技术和云计算技术的极大普及和广泛应用,网络中的数据正在以前所未有的迅猛速度增长和积累,根据Facebook的统计,每天将近产生500TB的数据,可见大数据时代已经开始走入了我们的生活之中,那么如何能够更好的对这些隐藏的数据进行分析和挖掘有价值的数据便显得尤为重要,在这样的大数据环境之下,传统的数据库很难解决和处理如此庞大的数据,因此,基于MnpReduce的数据处理方式变成为主流技术致意。大数据时代的到来,让我们感受着信息的便捷、获取着巨大的利益,同时,也为我们带来了从未有过的挑战。 展开更多
关键词 MAPREDUCE hadoo 大数据时代 数据挖掘
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部