cdh5.3.pdf

preview
需积分: 0 0 下载量 154 浏览量 更新于2018-12-16 收藏 2.69MB PDF 举报
根据提供的文件信息,本文主要介绍了如何搭建CDH5.3集群的过程。这涉及到了一系列的基础系统配置、服务安装与管理等内容。以下是对该文档中提到的关键步骤和技术知识点的详细解析。 ### 一、Apache服务器的安装与配置 文档中提到了通过`yum install httpd`命令来安装Apache服务器。`httpd`是Apache HTTP Server的简称,是一种广泛使用的Web服务器软件,它能够提供静态网页服务,也是搭建CDH集群过程中用于分发安装包的重要工具之一。 #### 开启Apache服务器 文档中使用了两种方式来启动Apache服务: - `service httpd start`:立即启动Apache服务。 - `service httpd restart`:重启Apache服务。如果服务尚未启动,则此命令的效果等同于`start`命令。 #### 设置Apache服务开机自启动 - 使用`chkconfig httpd on`命令来设置Apache服务开机启动。这一步骤确保了每次系统启动时,Apache服务都能自动启动,从而保证了CDH安装包能够始终被访问。 - 验证开机启动状态:`chkconfig --list httpd`命令用来检查Apache服务是否已经被正确地设置为开机启动状态。 ### 二、创建目录及下载安装包 文档提到,在Apache服务器的web根目录`/var/www/html`下创建了一个名为`cdh`的目录,然后通过`wget`命令下载了两个必要的安装包到该目录中: - `CDH-5.3.0-1.cdh5.3.0.p0.30-el6.parcel`:CDH 5.3.0的安装包。 - `CDH-5.3.0-1.cdh5.3.0.p0.30-el6.parcel.sha1`:该安装包的SHA-1校验码文件,用于验证下载的安装包是否完整无误。 ### 三、系统基础配置 #### 修改DNS设置 文档中提到,通过编辑`/etc/hosts`文件来添加主机名映射。这对于多节点集群环境来说是非常重要的,确保各节点之间可以通过指定的主机名进行通信。 #### 时间同步 为了保证集群内各节点的时间一致性,文档中介绍了如何使用`ntpdate`和`ntpd`服务来进行时间同步。时间同步对于集群的稳定运行至关重要,尤其是在进行日志分析和数据一致性验证时。 #### 禁用SELinux 由于SELinux的安全策略可能会对CDH集群的某些操作造成限制,文档建议通过编辑`/etc/selinux/config`文件将SELinux设置为`disabled`状态。需要注意的是,虽然这有利于简化安装过程,但在生产环境中应谨慎考虑安全因素。 #### 关闭防火墙 文档中提供了几种关闭防火墙的方法,包括临时关闭和永久关闭。这是因为防火墙可能会影响到节点间的网络通信,特别是在安装和配置集群的过程中。 #### 升级OpenSSL版本 文档中还提到了升级OpenSSL版本的操作。这是因为Cloudera Distribution Including Hadoop (CDH) 需要较新的OpenSSL版本来支持其安全特性。 #### 安装JDK 文档中提到通过下载Oracle JDK 7u71版本作为CDH集群的Java运行环境。JDK是Java开发工具包,对于运行基于Java的应用程序(如Hadoop)至关重要。 通过以上详细的解析,我们可以看出文档中涵盖了搭建CDH5.3集群所需的基础环境准备和服务配置的关键步骤。这些知识点不仅适用于CDH5.3版本,也为后续版本的集群搭建提供了重要的参考依据。
身份认证 购VIP最低享 7 折!
30元优惠券