Hadoop 四大组件总结

本文详细介绍了Hadoop的四大组件:common包含Hadoop常用的工具类,如Configuration、FileSystem等;HDFS是分布式文件系统,由NameNode和DataNode组成,提供数据存储;MapReduce是并行处理模型,用于大数据计算;YARN作为资源管理框架,负责集群资源的调度和分配。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Hadoop 的四大组件:common、HDFS、MapReduce、YARN

common(工具类):

包括 Hadoop 常用的工具类,由原来的 Hadoopcore 部分更名而来。主要包括系统配置工具 Configuration、远程过程调用 RPC、序列化机制和 Hadoop 抽象文件系统 FileSystem 等。它们为在通用硬件上搭建云计算环境提供基本的服务,并为运行在该平台上的软件开发提供了所需的 API。

  1. org.apache.hadoop.conf,配置相关类。
  2. org.apache.hadoop.fs,Hadoop文件系统。
  3. org.apache.hadoop.io,Hadoop I/O系统。
  4. org.apache.hadoop.ipc,Hadoop远程过程。
  5. 其他包,org.apache.hadoop.log,日志。org.apache.hadoop.metrics,用于度量统计和分析的。org.apache.hadoop.http和org.apache.hadoop.net,Hadoop对网络层次相关的封装。org.apache.hadoop.util,Common中的公共方法类,checkSum校验和的验证方法就包含于此。
     

Hadoop Distributed File System(HDFS):

Hadoop 实现了一个分布式的文件系统,HDFS 为海量的数据提供了存储。HDFS 是基于节点的形式进行构建的,里面有一个父节点 NameNode,他在机器内部提

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值