- 博客(4)
- 收藏
- 关注
转载 spark 概述
Spark:一个高效的分布式计算系统 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS
2014-08-19 14:41:52
369
转载 Apache Hadoop 2.x的改进概述
Apache Hadoop 2.x的改进概述 Apache Hadoop 2.xconsists of significant improvements over the previous stable release(hadoop-1.x). 相对于Hadoop 1.x的稳定版本,Hadoop 2.x提供了如下重大改进。 Here is a shortoverview
2014-03-06 11:18:08
471
转载 Hadoop 2.2.0正式版特性分析
Apache官网的说明: 15 October, 2013: Release 2.2.0 available Apache Hadoop2.2.0 is the GA release of Apache Hadoop 2.x. Users areencouraged to immediately move to 2.2.0 since this release is signif
2014-03-06 11:17:44
385
转载 hadoop简介
Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。 对于Hadoop的集群来讲,可以分成两大类角色:Master和Salve。一个HDFS集群
2014-03-06 11:16:55
377
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人