转载

发表于 2015年01月19日
浏览 (771)
评论 (0)

spark内核揭秘-06-TaskSceduler启动源码解析初体验

TaskScheduler实例对象启动源代码如下所示：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

从上面代码可以看出来，taskScheduler的启动是在SparkContext

spark内核揭秘-06-TaskSceduler启动源码解析初体验

找到TaskSchedulerImpl实现类中的start方法实现：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

1、从上代码看到，先启动CoarseGrainedSchedulerBackend，

spark内核揭秘-06-TaskSceduler启动源码解析初体验

从上面CoarseGrainedSchedulerBackend类的代码，可以看出spark启动了DriverActor,名称为CoarseGrainedScheduler，这是一个akka消息通信类，会先运行preStart()方法

spark内核揭秘-06-TaskSceduler启动源码解析初体验

从上面代码可以看到，初始化了akka客户端监听，还有最重要的是调用了系统的scheduler调度，参数函数是立即执行调度，间隔1000毫秒，运行ReviveOffers方法

spark内核揭秘-06-TaskSceduler启动源码解析初体验

进入makeOffers()方法：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

运行launchTask方法:

spark内核揭秘-06-TaskSceduler启动源码解析初体验

spark内核揭秘-06-TaskSceduler启动源码解析初体验

这段代码是spark序列号任务大小超过akkaFrameSize - AkkaUtils.reservedSizeBytes大小，那就报错为”

Serialized task %s:%d was %d bytes, which exceeds max allowed: " +

"spark.akka.frameSize (%d bytes) - reserved (%d bytes). Consider increasing " +

"spark.akka.frameSize or using broadcast variables for large values.

“ ，此刻会将该任务终止，并将任务从任务列表中移除，这样推荐使用broadcast广播方式

否则，将获取执行任务数据，并减少空闲cpu数，发送消息执行 LaunchTask(new SerializableBuffer(serializedTask))方法，即CoarsedGrainedExecutorBackend类的LaunchTask方法：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

上面代码会运行executor 的launchTask方法：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

TaskRunner就是一个多线程：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

spark内核揭秘-06-TaskSceduler启动源码解析初体验

spark内核揭秘-06-TaskSceduler启动源码解析初体验

代码太多，我就不截图了，其实实际就是根据机器状况，运行task任务

2、然后我们回到TaskSchedulerImpl实现类中的start方法

spark内核揭秘-06-TaskSceduler启动源码解析初体验

如果isLocal=false and spark.speculation=true，不是local模式，那就要dispatcher分发任务了，默认是100毫秒后立即启动，并间隔100毫秒循环运行，

spark内核揭秘-06-TaskSceduler启动源码解析初体验

CoarseGrainedSchedulerBackend的reviveOffers：

spark内核揭秘-06-TaskSceduler启动源码解析初体验

正文到此结束

所属分类：编程技术

本文标签： UI value 线程实例 tar 解析 CTO 源码代码多线程 IDE 参数数据 REST
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,998) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,264) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,064) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,966) 评论(0)
Decorators in ES7

浏览(16,585) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,554) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(13,000) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,915) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,059) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,212) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG