首页手记 Spark内核分析之Scheduler资源调度机制

Spark内核分析之Scheduler资源调度机制

标签：

Spark

上一篇我们阐述了Driver，Application，Worker的注册实现原理，本篇我们来接着聊聊Driver，Application在注册之后是如何实现调度的。废话不多说，直接上源码进行分析（本篇所述内容比较重要，请耐心看完）。

Driver调度机制图

我们来分析一下上面这段代码：

1.首先过滤出所有的worker进行过滤操作，获得所有正常工作的worker，然后将其进行shuffle操作；
2.遍历等待调度的Driver，判断当前的Driver是否可以被启动并且是否有可用的worker；
3.如果满足当前的worker的内存大于等于要启动的driver的内存并且该worker的CPU和核数大于等于要启动driver需要的CPU核数，调用launchDriver在worker上启动Driver；
4.launchDriver方法会向worker发送一个启动Driver的信号，然后将driver的状态置为RUNNING；

spreadOutApps策略启动

非spreadOutApps策略

分析完Driver的scheduler机制后，我们来看看Application适合调度的，Application的调度有两种方式，如上图所示，其实说白了就是一种是平均分配策略和非平均分配策略，现在来分析一下源码是如何实现的；

基于平均分配算法：

1.遍历需要调度的Application，且该Application还需要被分配CPU；
2.遍历拿到所有可用的worker，然后获得每个worker已经分配的CPU核数；
3.获得可以分配的CPU的核数，循环遍历每个worker，并为其分配一个CPU；
4.循环启动每个worker上的executor；

基于非平均分配算法与平均分配算法的区别：

区别在于：基于非平均分配算法，在遍历所有可用的worker，为每个worker尽量分配多的CPU，然后在每个分配了CPU的worker上创建一个Executor并通知worker启动executor。

总结：本节课主要介绍了一下资源调度的实现，虽然内容比较短，但是非常重要，在后期关于spark调优会起到很大的帮助。下篇文章会接着我们本篇的内容，来分析我们的相关应用到底是如何进行启动的；欢迎关注。

如需转载，请注明：

上一篇：Spark内核分析之Spark的HA源码分析

本篇：Spark内核分析之Scheduler资源调度机制

作者：z小赵
链接：https://www.jianshu.com/p/3acc9c5af712

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕侠2389804

手记
篇

粉丝

57

获赞与收藏

163

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 33056 373

网络编程入门教程

20个小节 13748 258

Pandas 入门教程

25个小节 20430 392

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

Spark内核分析之Scheduler资源调度机制

阅读免费教程