Hadoop调度算法详解：FIFO与公平调度

5星 · 超过95%的资源 | 下载需积分: 9 | DOCX格式 | 167KB | 更新于2024-09-14 | 112 浏览量 | 举报

3 收藏

"本文介绍了Hadoop中的几种调度算法，包括FIFO调度、公平调度算法、计算能力调度算法，以及两种学习参数型的调度算法——基于朴素贝叶斯分类和基于优先权的自适应调度算法。" 在分布式计算环境中，Hadoop扮演着核心角色，其调度器是决定系统效率和资源利用率的关键组件。以下是各调度算法的详细说明： 1. FIFO（先进先出）调度算法： FIFO是最简单的调度策略，所有用户作业按照提交的顺序排队等待执行。JobTracker会优先分配资源给最早提交的作业，直到该作业完成，然后再处理下一个作业。这种方法简单明了，但在多用户环境中，可能会导致长时间运行的作业占用过多资源，而新提交的短作业则需等待较长时间。 2. 公平调度算法（Fair Scheduler）：公平调度器的目标是保证所有作业都能平均分配到系统资源，使得每个作业都有平等的机会获取计算资源。当系统中只有一个作业时，它独占全部资源。随着更多作业的提交，资源会被动态调整，以保证每个作业都能得到相等的份额。公平调度器通过作业池的概念实现更灵活的资源配置，用户可以设置不同的作业池，每个池有不同的资源分配比例和最小共享资源保障，以满足不同作业的需求。 3. 计算能力调度算法：这种算法考虑到了作业的计算需求，通常与作业的复杂性和资源消耗相关。它根据作业的预计执行时间来分配资源，旨在减少总体的作业完成时间。这种策略对于那些计算密集型的作业尤其有利，可以更快地完成计算任务。 4. 基于朴素贝叶斯分类的调度算法：这是一种学习参数型的调度策略，利用朴素贝叶斯模型预测作业的执行时间，从而更有效地调度作业。通过对历史数据的学习，调度器可以预估新作业的执行特性，优化资源分配。 5. 基于优先权的自适应调度算法：这种算法根据作业的优先级和自适应学习机制动态调整资源分配。优先级高的作业会优先获得资源，同时算法会根据作业的执行情况动态调整其优先级，使得资源分配更加高效和灵活。这些调度算法的选择取决于Hadoop集群的具体需求，如作业类型、用户需求、系统负载等。理解并正确配置调度算法是优化Hadoop集群性能的关键，可以有效提高整体系统的吞吐量和用户满意度。

Hadoop 调度算法

本文档主要内容：

系统固定参数型： FIFO、公平调度算法、计算能力调度算法；

学习参数型：基于朴素贝叶斯分类的作业调度算法、基于优

先权的自适应调度算法

1、基本思想：

所有的用户作业都被提交到一个队列中，然后由 JobTracker 按照作业的优先级（比如

提交时间的先后顺序）选择将被执行的作业。

2、具体做法：

当一个 TaskTracker 有空闲，希望得到新的任务时，JobQueueTaskScheduler 会按照各个

作业的优先级，从最高优先级开始，进行分配，并且还会保留一些作业余量，以备不时之

需。

3、例如：

队列中有三个作业，优先级依次为 3，2，1；一个 tasktracker 能够承受 3 个任务的执行，

JobQueneTaskScheduler 会从优先级 3 的作业中选取一个任务，再留出一个 1 任务的余量。

此时，系统只能再将优先级 2 作业的任务分配给此服务器，而不能分配优先级 1 的任务。

其基本思想是：不仅要优先保证优先级高的作业，而且还要为之保留一个备用资源。

二、公平调度算法（Fair Scheduler）

1、基本思想：

尽可能保证所有的作业都能够获得等量的资源份额。当系统中只有一个作业执行时，

它将独占整个集群并使用所有的计算资源。而一旦有其他的作业被提交，就会有

TaskTracker 被释放并分配给新提交的作业。保证所有的作业都能够获得大体相同的计算资

源量。这使得短作业能够在合理的时间内完成，同时又不会使长作业长期处于饥饿状态。

2、具体做法：

在公平算法中，用户提交的作业被进一步组织为能够公平共享资源的作业池。在实际

使用中，不同类型的作业池赋予不同的比例的资源额度，不是绝对的公平分配。它使用系

统可以根据任务的重要程度等各种素合理地为不同用户的不同作业合理的分配系统资源。

2.1、在作业池级别上：

公平算法允许赋给作业池保证最小共享资源，此特性用于确保特定用户、群组或者生

产应用程序总能获取足够的资源。当一个作业池包含作业时，它至少能获取到它的最小共

下载后可阅读完整内容，剩余6页未读，立即下载

kmguo

粉丝: 7

Hadoop调度算法详解：FIFO与公平调度

基于Hadoop个性化推荐算法设计与实现

Hadoop调优之调度算法详解一

基于粒子群优化算法的Hadoop调度算法研究.pdf

基于粒子群优化算法的Hadoop调度算法研究 (2015年)

交通信息分布式处理中的Hadoop调度算法优化.pdf

一种异构环境下的Hadoop调度算法 (2012年)

优化的Hadoop调度算法提升负载均衡与效率

hadoop公平调度算法解析

Hadoop 调度

基于Hadoop的调度算法研究与实现.docx

最新资源