Spark启动流程

本文介绍了Spark通过Spark-submit提交Application后,在Yarn运行模式下的启动流程。从Driver生成SparkContext,到DAGScheduler和TaskScheduler的创建,再到资源调度算法的运用,详细解析了Executor的启动以及Task的执行过程。当遇到action操作时,Spark会生成job,DAGScheduler划分stage,并由TaskScheduler将Task发送给Executor执行,最终完成任务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

  1. Spark-submit 提交 Application
  2. Spark on Yarn运行模式 ,产生Driver
  3. Driver 会生成一个SparkContext 对象sc , sc 会创建两个对象 分别为DAGScheduler 对象和 TaskScheduler 对象
  4. sc 去向ClusterManager 进行注册 , 并申请资源
  5. CM 向Worker 分配资源 【资源调度算法】
  6. Worker 启动了executor , executor 中有线程池
  7. executor 向 Driver 反向注册 ,等待task任务提交
  8. sc 初始化完成 ,执行接下来的代码遇到一个action , 就会产生一个job 任务
  9. DAGScheduler 会根据RDD 的宽窄依赖关系 ,划分stage ,给TaskScheduler 发送TaskSet (包含多个task)
  10. TaskScheduler 将Task 序列化后发送给executor
  11. executor 反序列化Task 对象 ,然后线程池启动Task 任务
  12. 执行完成后,sc注销资源
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

科学的N次方

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值