
安装
晟翊zzZ
这个作者很懒,什么都没留下…
展开
-
Bigdata_Kafka(一)
Kafka是什么在流式计算中,Kafka一般用来缓存数据,Storm通过消费Kafka的数据进行计算。1)Apache Kafka是一个开源消息系统,由Scala写成。是由Apache软件基金会开发的一个开源消息系统项目。2)Kafka最初是由LinkedIn公司开发,并于2011年初开源。2012年10月从Apache Incubator毕业。该项目的目标是为处理实时数据提供一个统一、高通...原创 2019-12-02 22:13:20 · 218 阅读 · 0 评论 -
大数据之Spark(一)
什么是Spark?官网:http://spark.apache.org我的翻译:Spark是一个针对大规模数据处理的快速通用引擎Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache顶级项目。目前,Spark生态系统已经发展成为一个包含多个子项目的集合,其中包...原创 2019-11-10 22:34:15 · 386 阅读 · 0 评论 -
大数据之CDH 集群部署
Cloudera Managercloudera manager的概念简单来说,Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能的一个工具(软件),使得安装集群从几天的时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大的提高集群管理的效率。cloudera manager的功能1.管理:对集群进行管理,如添加、删除节点等操作。2.监控:监控...原创 2019-10-19 21:43:28 · 734 阅读 · 0 评论 -
Zookeeper的概述和安装
Zookeeper概述Zookkeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目,Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护,域名服务,分布式同步,组服务等。特点 Zookeeper:一个领导者(leader),多个跟随者(follower)组成的集群。 Leader : 负责进行投票投票的发起和决议,...原创 2019-09-03 20:15:41 · 204 阅读 · 1 评论 -
Flume 部署及相关案例
一、Flume 简介1.Flume 提供了一个分布式的,可靠的,对大量数据的日志高效收集,聚集,移动的服务,Flume 只能在 Unix 环境下运行。2.Flume 基于流式架构,容错性强,也结构简单。3.Flume,Kafka 用来实时数据收集,Spark,Flume 用来实时处理数据,impala 用来实时查询。二、Flume 角色1.source用于采集数据,source 是产...原创 2019-09-07 15:26:33 · 190 阅读 · 0 评论 -
Hive ,MySQL安装与部署
Hive基本概念1.什么是HiveHive:是由Facebook 开源用于解决海量结构化日志的数据统计。Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据映射为一张表,并提供类 SQL 查询功能。本质是:将 HQL/SQL 转化为 MapReduce 程序。Hive 处理的数据储存在 HDFS。Hive 分析数据的底层实现是 MapReduce。执行程序运行在 y...原创 2019-09-10 20:51:10 · 568 阅读 · 0 评论 -
大数据之Azkaban 安装 与 应用
概述为什么需要工作流调度系统一个完整的数据分析系统通常都是由大量任务单元组成:shell脚本程序,java程序,mapreduce程序、hive脚本等各任务单元之间存在时间先后及前后依赖关系为了很好地组织起这样的复杂执行计划,需要一个工作流调度系统来调度执行;例如,我们可能有这样一个需求,某个业务系统每天产生20G原始数据,我们每天都要对其进行处理,处理步骤如下所示:(1) 通过Ha...原创 2019-09-25 19:52:52 · 273 阅读 · 0 评论 -
HBaes 部署
HBaes介绍HBase简介HBase是一个分布式的、面向列的开源数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。大:上亿行、百万列面向列:面向列(簇)的存储和权限控制,列(簇)独立检索稀疏:对于为空(null)的列,并不占用存储空间,因此,表的设计的非常的稀疏HBase的角色HMaster功能:(1) 监控RegionServ...原创 2019-09-27 17:43:47 · 299 阅读 · 0 评论