【大数据入门核心技术】学习导读列表--建议收藏

本文档为大数据入门核心技术的学习指南,涵盖大数据基础知识、Zookeeper、Hadoop、Hive、Hbase等重要组件,从基本概念到实战应用,详细讲解各个组件的工作原理和操作方法,适合初学者系统学习。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本专栏内容持续更新中,敬请收藏~~~

本专栏内容持续更新中,敬请收藏~~~

本专栏内容持续更新中,敬请收藏~~~

本专栏内容持续更新中,敬请收藏~~~

一、大数据基础知识

【大数据入门核心技术-基本概念】(一)大数据相关基本概念

【大数据入门核心技术-基本概念】(二)大数据行业生态

【大数据入门核心技术-基本概念】(三)大数据应用领域和行业

二、Zookeeper

【大数据入门核心技术-Zookeeper】(一)Zookeeper基本原理

【大数据入门核心技术-Zookeeper】(二)ZAB协议介绍

【大数据入门核心技术-Zookeeper】(三)Zookeeper的选举机制和流程

【大数据入门核心技术-Zookeeper】(四)Zookeeper的应用场景

【大数据入门核心技术-Zookeeper】(五)ZooKeeper集群搭建

【大数据入门核心技术-Zookeeper】(六)ZooKeeper基本Shell操作

【大数据入门核心技术-Zookeeper】(七)ZooKeeper JavaAPI 操作

【大数据入门核心技术-Zookeeper】(八)ZooKeeper Python API 操作

【大数据入门核心技术-Zookeeper】(九)图形化的客户端工具(ZooInspector)

二、Hadoop

【大数据入门核心技术-Hadoop】(一)Hadoop简介

【大数据入门核心技术-Hadoop】(二)Hadoop基础概念之HDFS

【大数据入门核心技术-Hadoop】(三)Hadoop基础概念之MapReduce

【大数据入门核心技术-Hadoop】(四)Hadoop基础概念之YARN

【大数据入门核心技术-Hadoop】(五)Hadoop3.2.1非高可用集群搭建

【大数据入门核心技术-Hadoop】(六)Hadoop3.2.1高可用集群搭建

【大数据入门核心技术-Hadoop】(七)Hadoop基本Shell命令行

【大数据入门核心技术-Hadoop】(八)Hadoop基本管理命令行

【大数据入门核心技术-Hadoop】(十)Hadoop数据迁移distcp详解

【大数据入门核心技术-Hadoop】(十一)Hadoop快照Snapshot详解

【大数据入门核心技术-Hadoop】(十二)Hadoop归档Har详解

【大数据入门核心技术-Hadoop】(十三)Hadoop JavaAPI 操作

【大数据入门核心技术-Hadoop】(十四)Hadoop MapReduce代码实战

【大数据入门核心技术-Hadoop】(十五)Hadoop底层数据文件存储

三、Hive

【大数据入门核心技术-Hive】(一)Hive简介

【大数据入门核心技术-Hive】(二)MySQL5.7安装

【大数据入门核心技术-Hive】(三)Hive3.1.2非高可用集群搭建

【大数据入门核心技术-Hive】(四)Hive3.1.2高可用集群搭建

【大数据入门核心技术-Hive】(五)Hive基本Shell命令行

【大数据入门核心技术-Hive】(六)Hive的数据存储格式

【大数据入门核心技术-Hive】(七)HiveSQL数据定义

【大数据入门核心技术-Hive】(八)Hive 时间转换

【大数据入门核心技术-Hive】(九)HiveSQL数据查询

【大数据入门核心技术-Hive】(十)内置函数

【大数据入门核心技术-Hive】(十一)HiveSQL数据分区

【大数据入门核心技术-Hive】(十二)Hive调优

【大数据入门核心技术-Hive】(十三)Hive JavaAPI 操作

【大数据入门核心技术-Hive】(十四)Hive PythonAPI 操作

【大数据入门核心技术-Hive】(十五)Hive的Hcatalog详解

【大数据入门核心技术-Hive】(十六)hive表加载csv格式数据或者json格式数据

【大数据入门核心技术-Hive】(十七)常用hive shell命令汇总

【大数据入门核心技术-Hive】(十八)Hive的ACID事务支持

【大数据入门核心技术-Hive】(十九)Hive的UDF、UDTF、UDAF

【大数据入门核心技术-Hive】(二十)Hive哪些操作会触发MR

【大数据入门核心技术-Hive】(二十一)Hive中double和decimal的区别

【大数据入门核心技术-Hive】(二十一)Hive日志中如何查看完整的sql

四、Hbase

【大数据入门核心技术-Hbase】(一)HBase简介

【大数据入门核心技术-Hbase】(二)HBase数据模型

【大数据入门核心技术-HBase】(三)HBase2.2.2非高可用环境搭建

【大数据入门核心技术-HBase】(四)HBase2.2.2高可用集群搭建

【大数据入门核心技术-HBase】(五)HBase基本Shell操作

【大数据入门核心技术-HBase】(六)HBase JavaAPI 操作

【大数据入门核心技术-HBase】(七)HBase Python API 操作

【大数据入门核心技术-HBase】(八)Phoenix简介

【大数据入门核心技术-HBase】(九)Phoenix的安装部署

【大数据入门核心技术-HBase】(十)Hbase结合Phoenix的使用

【大数据入门核心技术-HBase】(十一)HBase手动清除表相关信息

【大数据入门核心技术-HBase】(十二)Hbase快照Snapshot详解

【大数据入门核心技术-HBase】(十三)Hbase参数调优

【大数据入门核心技术-HBase】(十五)Hbase Replication操作

【大数据入门核心技术-HBase】(十六)Hive和Hbase的整合

五、Sqoop

【大数据入门核心技术-Sqoop】(一)Sqoop简介

【大数据入门核心技术-Sqoop】(二)Sqoop安装

【大数据入门核心技术-Sqoop】(三)Sqoop基本Shell命令行

【大数据入门核心技术-Sqoop】(四)使用Sqoop将MySQL数据导入到HDFS

六、Impala

【大数据入门核心技术-Impala】(一)Impala简介

【大数据入门核心技术-Impala】(二)Impala核心组件和架构

【大数据入门核心技术-Impala】(三)Impala安装

【大数据入门核心技术-Impala】(四)Impala基本Shell命令行

七、Kafka

【大数据入门核心技术-Kafka】(一)Kafka简介

【大数据入门核心技术-Kafka】(二)Kafka非高可用集群部署

【大数据入门核心技术-Kafka】(三)Kafka高可用集群部署

【大数据入门核心技术-Kafka】(四)Kafka常用shell命令

【大数据入门核心技术-Kafka】(五)Kafka JavaAPI 操作

【大数据入门核心技术-Kafka】(六)Kafka Python API 操作

【大数据入门核心技术-Kafka】(七)Kafka扩容broker和数据迁移

八、Flume

【大数据入门核心技术-Flume】(一)Flume简介

【大数据入门核心技术-Flume】(二)Flume安装部署

【大数据入门核心技术-Flume】(三)使用Flume采集数据到HDFS

【大数据入门核心技术-Flume】(四)使用Flume采集数据到Hive

【大数据入门核心技术-Flume】(五)使用Flume采集数据到Hbase

九、Spark

【大数据入门核心技术-Spark】(一)Spark介绍

【大数据入门核心技术-Spark】(二)Spark核心模块

【大数据入门核心技术-Spark】(三)Spark 本地模式安装

【大数据入门核心技术-Spark】(四)Spark Standlone模式安装

【大数据入门核心技术-Spark】(五)Spark On Yarn模式安装

【大数据入门核心技术-Spark】(六)Spark Standlone HA模式安装

【大数据入门核心技术-Spark】(七)执行Spark任务的两种方式:spark-submit和spark-shell

【大数据入门核心技术-Spark】(八)Spark Core的RDD详解

【大数据入门核心技术-Spark】(九)Spark Core的RDD创建

【大数据入门核心技术-Spark】(十)Spark Core的RDD操作

【大数据入门核心技术-Spark】(十一)Spark Core实战实例(一)

【大数据入门核心技术-Spark】(十二)Spark Core实战实例(二)

【大数据入门核心技术-Spark】(十三)Spark Streaming简介

【大数据入门核心技术-Spark】(十四)Spark Streaming数据抽象DStream_spark streaming的数据抽象

【大数据入门核心技术-Spark】(十五)Spark Streaming实战案例-WordCount

【大数据入门核心技术-Spark】(十六)Spark Streaming实战案例2-WordCount

【大数据入门核心技术-Spark】(十七)Spark Streaming整合 Kafka

【大数据入门核心技术-Spark】(十八)Spark SQL介绍

【大数据入门核心技术-Spark】(十九)Spark SQL数据抽象

十、Flink

【大数据入门核心技术-Flink】(一)Flink介绍

【大数据入门核心技术-Flink】(二)Flink安装部署-本地模式

【大数据入门核心技术-Flink】(三)Flink安装部署-独立集群模式

【大数据入门核心技术-Flink】(四)Flink安装部署-Flink On Yarn模式

【大数据入门核心技术-Flink】(五)Flink版本WordCount-Java版本

【大数据入门核心技术-Flink】(六)Flink版本WordCount-Scala版本

【大数据入门核心技术-Flink】(七)Flink读取数据的6种方式(集合、文件、Kafka、MySQL、Socket、自定义数据源)-Java版本

【大数据入门核心技术-Flink】(八)Flink读取数据的6种方式(集合、文件、Kafka、MySQL、Socket、自定义数据源)-Scala版本

十一、Tez

【大数据入门核心技术-Tez】(一)Tez介绍

【大数据入门核心技术-Tez】(二)Tez安装

【大数据入门核心技术-Tez】(三)Tez与Hive整合

【大数据入门核心技术-Tez】(四)Tez与Hdfs整合

十二、Ambari

【大数据入门核心技术-Ambari】(一)Ambari介绍

【大数据入门核心技术-Ambari】(二)Ambari架构原理

【大数据入门核心技术-Ambari】(三)Ambari安装部署

十三、Kylin

【大数据入门核心技术-Kylin】(一)Kylin简介

【大数据入门核心技术-Kylin】(二)Kylin集群安装

【大数据入门核心技术-Kylin】(三)Kylin快速入门之离线任务构建

【大数据入门核心技术-Kylin】(四)Kylin快速入门之Kafka Streaming实时流任务构建

十四、Hue

【大数据入门核心技术-Hue】(一)Hue介绍

【大数据入门核心技术-Hue】(二)Hue安装部署

 十四、DolphinScheduler

【大数据入门核心技术-DolphinScheduler】(一)DolphinScheduler简介

【大数据入门核心技术-DolphinScheduler】(二)DolphinScheduler安装部署

 十五、Doris

【大数据入门核心技术-Doris】(一)Doris简介

【大数据入门核心技术-Doris】(二)Doris安装部署

【大数据入门核心技术-Doris】(三)Doris基本Shell和数据模型

【大数据入门核心技术-Doris】(四)数据存储模型之Unique数据存储模型

【大数据入门核心技术-Doris】(五)分区和分桶

【大数据入门核心技术-Doris】(六)数据导入

【大数据入门核心技术-Doris】(七)Docker安装Doris

十六、Kudu

【大数据入门核心技术-Kudu】(一)Kudu简介

【大数据入门核心技术-Kudu】(二)Kudu安装部署

【大数据入门核心技术-Kudu】(三)Kudu基本Shell命令行

十七、Trino

【大数据入门核心技术-Trino】(一)Trino简介

【大数据入门核心技术-Trino】(二)Trino安装部署

 十八、ClickHouse

【大数据入门核心技术-Clickhouse】(一)Clickhouse介绍

【大数据入门核心技术-Clickhouse】(二)Clickhouse安装部署

十九、Iceberg

【大数据入门核心技术-Iceberg】(一)Iceberg介绍

【大数据入门核心技术-Iceberg】(二)Iceberg与Hive整合

【大数据入门核心技术-Iceberg】(三)Iceberg与Hive基本Shell操作

【大数据入门核心技术-Iceberg】(四)Iceberg与Spark整合

【大数据入门核心技术-Iceberg】(五)Iceberg与Spark基本Shell操作

【大数据入门核心技术-Iceberg】(六)Iceberg与Spark DataFrame操作

【大数据入门核心技术-Iceberg】(七)Iceberg与Flink整合

【大数据入门核心技术-Iceberg】(八)Iceberg与Flink基本Shell操作

【大数据入门核心技术-Iceberg】( 九)Iceberg与与 Flink DataStream 集成

二十、常见问题处理

【大数据问题处理】HiveSQL自动根据hdfs目录添加和删除分区-CSDN博客

目录 第一部分 Spark学习 ....................................................................................................................... 6 第1章 Spark介绍 ................................................................................................................... 7 1.1 Spark简介与发展 ...................................................................................................... 7 1.2 Spark特点 .................................................................................................................. 7 1.3 Spark与Hadoop集成 ................................................................................................ 7 1.4 Spark组件 .................................................................................................................. 8 第2章 Spark弹性分布数据集 ............................................................................................... 9 2.1 弹性分布式数据集 .................................................................................................... 9 2.2 MapReduce数据分享效率低..................................................................................... 9 2.3 MapReduce进行迭代操作 ........................................................................................ 9 2.4 MapReduce进行交互操作 ...................................................................................... 10 2.5 Spark RDD数据分享 ............................................................................................... 10 2.6 Spark RDD 迭代操作 .............................................................................................. 10 2.7 Spark RDD交互操作 ............................................................................................... 10 第3章 Spark安装 ................................................................................................................. 11 第4章 Spark CORE编程 ....................................................................................................... 13 4.1 Spark Shell ........................................................
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

forest_long

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值