Hadoop入门之Hadoop伪分布式环境搭建

在配置Hadoop环境前,应该在Linux环境中先配置JAVA环境变量,SSH免密登录。如果没有SSH免密登录,在分布式环境下,就会重复很多次输入密码的动作。
1.在Hadoop包根目录下,编辑文件 etc/hadoop/hadoop-env.sh,更改:
export JAVA_HOME=/usr/java/latest 
2.然后使用 bin/hadoop 测试hadoop命令是否可用​
3.配置HDFS
(1)配置NameNode
    在文件etc/hadoop/core-site.xml中
    
(2)配置DataNodes
在文件etc/hadoop/slaves中
hadoop-senior.ibeifeng.com
(3)配置SecondaryNode
4.接下来进行测试
(1)格式化文件系统
bin/hdfs namenode -format
(2)启动NN节点和DN节点的进程
sbin/start-dfs.sh
(3)创建执行MapReduce任务的文件目录
bin/hdfs dfs -mkdir /user
bin/hdfs dfs -mkdir /user/<username>
(4)将输入文件复制到分布式文件系统中
bin/hdfs dfs -put etc/hadoop input
(5)执行一个测试用例
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jar grep input output 'dfs[a-z.]+'























评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值