文章目录
一、配置Hadoop集群
Hadoop的配置文件都在
$HADOOP_HOME/etc/hadoop
目录里
配置文件 | 功能描述 |
---|---|
hadoop-env.sh | 配置Hadoop运行所需的环境变量 |
yarn-env.sh | 配置Yarn运行所需的环境变量 |
core-site.xml | Hadoop核心全局配置文件,可在其他配置文件中引用 |
hdfs-site.xml | HDFS配置文件,继承core-site.xml配置文件 |
mapred-site.xml | MapReduce配置文件,继承core-site.xml配置文件 |
yarn-site.xml | Yarn配置文件,继承core-site.xml配置文件 |
workers | 配置从节点文件 |
1、在master虚拟机上配置hadoop
(1)编辑Hadoop环境配置文件 - hadoop-env.sh
-
执行命令:
cd $HADOOP_HOME/etc/hadoop
,进入hadoop配置目录
-
执行命令:
vim hadoop-env.sh
,添加三条环境变量配置(其实只需要添加第三条,因为前两条已经在/etc/profile
里配置过了)
export JAVA_HOME=/usr/local/jdk1.8.0_231
export HADOOP_HOME=/usr/local/hadoop-3.3.4
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
-
存盘退出后,执行命令
source hadoop-env.sh
,让配置生效
-
查看三个配置的三个环境变量
(2)编辑Hadoop核心配置文件 - core-site.xml
- 执行命令:
vim core-site.xml
<configuration>
<!--用来指定hdfs的老大-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<!--用来指定hadoop运行时产生文件的存放目录-->
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-3.3.4/tmp</value>
</property>
</configuration>
- 由于配置了IP地址主机名映射,因此配置HDFS老大节点可用
hdfs://master:9000
,否则必须用IP地址hdfs://192.168.1.101:9000
(3)编辑HDFS配置文件 - hdfs-site.xml
-
执行命令:
vim hdfs-site.xml
-
可以不用设置名称节点的目录、数据节点的目录以及辅助名称节点
<configuration