24
10
2
4137
12
3
Shuffle分類 一個作業(yè)經(jīng)過spark的DAGSchedule調(diào)度器劃分為多個stage,同時有些下游的stage依賴上游的stage狈谊,這樣...
RDD是什么 RDD(Resilient Distributed Datasets)可擴展的彈性分布式數(shù)據(jù)集乾翔,rdd是spark最基本的數(shù)據(jù)抽象...