1.為應(yīng)用構(gòu)建基本運行環(huán)境,Driver 創(chuàng)建SparkContext進行資源的申請言秸,任務(wù)的分配软能,監(jiān)控。
2.ClusterManager為Executor分配資源井仰,并且啟動Executor。
3.SparkContext根據(jù)Rdd的依賴關(guān)系構(gòu)建DAG圖破加,DAG圖提交給DAGScheduler解析為Stage俱恶,然后把TaskSet提交給TaskScheduler解析。Executor向SparkContext申請Task范舀,TaskScheduler將Task發(fā)送給Executor運行并提供應(yīng)用程序代碼合是。
4.Task在Executor上運行,將計算結(jié)果發(fā)送給TaskScheduler然后锭环,然后發(fā)送給DAGScheduler,運行完畢之后寫入數(shù)據(jù)并釋放所有資源聪全。
image