spark2.0的sparkContext初始化过程

1,driver启动以后会先构建SparkContext，基于常用的standealone创建taskscheduler

2，TaskSchedulerImpl

* 底层通过操作一个schedulerBackend，针对不同种类的cluster(standalone,yarn,mesos)，调度task

* 他也可以使用一个localBackend,并将isLocal参数设为true,来在本地模式下工作

* 它负责处理一些通用的逻辑，比如多个job的调度

* 客户端首先调用他的initialize()方法和start()方法，然后通过runTasks()方法提交taskSets

start方法会创建一个client对象负责application与spark集群通信

3，然后创建了DAGscheduler，然后划分stage，提交job

最后编辑于：2017.12.08 05:04:19

spark internal - 作业调度
spark internal - 作业调度作者：刘旭晖 Raymond 转载请注明出处Email：coloran...
当幸福来敲门我阅读 4,406评论 0赞 0
3.2 Spark调度机制
3.2 Spark调度机制 Spark调度机制是保证Spark应用高效执行的关键。本节从Application、j...
Albert陈凯阅读 5,569评论 0赞 0
Hadoop生态中各个组件、进程的作用
1、hadoop的各种进程及其作用 NameNode：是hdfs的主服务器，管理文件系统的目录树以及对集群中存储文...
蠟筆小噺没有烦恼阅读 13,361评论 0赞 8
Spark Scheduler模块详解-DAGScheduler实现
整体架构 DAGScheduler：负责分析用户提交的应用，并根据计算任务的依赖关系建立DAG，且将DAG划分为不...
木戎阅读 13,179评论 0赞 2
yarn应用场景基本架构和资源调度
YarnYarn产生背景：Yarn直接来自于MR1.0MR1.0 问题：采用的是master slave结构，ma...
时待吾阅读 11,160评论 2赞 23

1赞2赞

赞赏

手机看全文