
大数据
文章平均质量分 87
my_acm
这个作者很懒,什么都没留下…
展开
-
Hadoop权威指南学习笔记二
MapReduce简介声明:本文是本人基于Hadoop权威指南学习的一些个人理解和笔记,仅供学习参考,有什么不到之处还望指出,一起学习一起进步。 转载请注明:http://blog.csdn.net/my_acm上一篇介绍了什么是Hadoop,Hadoop的作用等。本篇同样基于Hadoop权威指南,结合迪伦的Hadoop的视频教程对MapReduce做一个介绍。 1、Map原创 2014-12-17 14:09:36 · 1066 阅读 · 0 评论 -
Hadoop权威指南学习笔记一
Hadoop权威指南学习笔记一声明:本文是本人基于Hadoop权威指南学习的一些个人理解和笔记,仅供学习参考,有什么不到之处还望指出,一起学习一起进步。 转载请注明:http://blog.csdn.net/my_acm1、数据的增长远远超过了磁盘的读取速度,传统的数据存储方式和分析方式变得不再适用于大数据的处理。Hadoop分为两大核心技术,HDFS(HadoopDistri原创 2014-12-16 11:20:43 · 1295 阅读 · 0 评论 -
Hadoop权威指南学习笔记三
HDFS简介Hadoop说白了就是一个提供了处理分析大数据的文件集群,其中最重要的无疑是HDFS(Hadoop Distributed File System)即Hadoop分布式文件系统。 1、 HDFS是一种以流式数据访问模式(一次写入多次读取的模式)存储超大文件的系统。其不需要的高端的硬件系统,普通市面上的硬件就能满足要求。 目前不适合应用原创 2014-12-23 16:26:29 · 968 阅读 · 0 评论 -
Apriori算法及其代码
Apriori算法是一个容易理解,逻辑简单,代码容易编写的一个大数据频繁项集查找的算法。设最小支持度计数为3 即个数要大于等于3的才是频繁项如图1--原始数据库 计数得到图2--每个东西的个数 则得到图3的频繁一项原创 2014-12-10 20:09:05 · 3845 阅读 · 1 评论 -
ubuntu下hbase的伪分布式安装与配置
转载自:http://www.cnblogs.com/linjiqin/archive/2013/03/06/2946212.html1.hadoop版本:hadoop-1.1.1,HBase版本:hbase-0.94.32.到官方网站下载好hbase-0.94.3.tar.gz,解压hbase安装包到一个可用目录如(/home/hadoop/hbase-0.94.3/)roo转载 2015-06-28 22:05:55 · 1034 阅读 · 0 评论