2. 通過案例對透徹理解三板斧之二:解密SparkStreaming運(yùn)行機(jī)制和架構(gòu)進(jìn)階之運(yùn)行機(jī)制和架構(gòu)

Spark core上面有4個流行的框架:SparkSQL、流計(jì)算宾毒、機(jī)器學(xué)習(xí)殿遂、圖計(jì)算。從框架入手可以更清晰地了解Spark Core的內(nèi)容墨礁。

Spark Streaming工作原理:

Spark Sreaming接收實(shí)時輸入數(shù)據(jù)流并將它們按批次劃分恩静,然后交給Spark引擎處理生成按照批次劃分的結(jié)果流蹲坷。

DStream Graph是RDD DAG 的模板邑飒,DStream是邏輯級別的,而RDD是物理級別的县匠。DStream是隨著時間的流動內(nèi)部將集合封裝RDD撒轮。

DStream就是對RDD操作封裝的集合,對DStream操作的transform的操作就會作用于內(nèi)部封裝的集合的每一個RDD兰粉,所以對RDD的操作就產(chǎn)生了RDD之間的依賴關(guān)系就構(gòu)成了DAG的依賴關(guān)系顶瞳。

為什么會對RDD進(jìn)行操作?這個是對DStream操作的業(yè)務(wù)邏輯浊仆,也就是空間維度決定的抡柿,這空間維度作用于DStream這樣一個集合,隨著時間的流逝每個Batch Interval形成了具體的數(shù)據(jù)集產(chǎn)生了RDD洲劣,

對RDD進(jìn)行transform操作囱稽,進(jìn)而形成了RDD的依賴關(guān)系RDD DAG,形成job战惊。然后jobScheduler根據(jù)時間調(diào)度媒熊,基于RDD的依賴關(guān)系谨湘,把作業(yè)發(fā)布到Spark Cluster上去運(yùn)行各拷,不斷的產(chǎn)生Spark作業(yè)烤黍。

基于Spark Core的都是基于RDD編程傻盟,而基于Spark Streaming的則是基于DStream編程嫂丙。DStream就是在RDD的基礎(chǔ)上,加上了時間維度筝闹。

Spark Steaming精妙之處在于Job的劃分只依賴于時間腥光,這最大程度的解耦合糊秆。

Spark Steaming具體的Job運(yùn)行在Spark Cluster之上,系統(tǒng)容錯至關(guān)重要捉片。單個Job的容錯機(jī)制和RDD的容錯機(jī)制相同汞舱,此外還有自己框架的容錯機(jī)制,如可以動態(tài)調(diào)整CPU莹规、線程等資源泌神。

事物處理的關(guān)鍵在于系統(tǒng)崩潰的情況下仍然能保持語意的一致性。

那DStream Graph是根據(jù)什么生成的呢欢际?DStream(離散流)的依賴關(guān)系损趋。

DStream的具體實(shí)現(xiàn)子類

資料來源于:

DT_大數(shù)據(jù)夢工廠(Spark發(fā)行版本定制)微信公眾號:DT_Spark

新浪微博:http://www.weibo.com/ilovepains

如果您對大數(shù)據(jù)Spark感興趣,可以免費(fèi)聽由王家林老師每天晚上20:00開設(shè)的Spark永久免費(fèi)公開課蒋失,地址YY房間號:68917580

微信公眾號
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末高镐,一起剝皮案震驚了整個濱河市畸冲,隨后出現(xiàn)的幾起案子观腊,更是在濱河造成了極大的恐慌算行,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件儡陨,死亡現(xiàn)場離奇詭異量淌,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)胚股,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進(jìn)店門琅拌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來摘刑,“玉大人,你說我怎么就攤上這事枷恕。” “怎么了隶校?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵蛹锰,是天一觀的道長铜犬。 經(jīng)常有香客問我,道長癣猾,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任夸盟,我火速辦了婚禮像捶,結(jié)果婚禮上桩砰,老公的妹妹穿的比我還像新娘释簿。我一直安慰自己,他們只是感情好煮纵,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布行疏。 她就那樣靜靜地躺著套像,像睡著了一般。 火紅的嫁衣襯著肌膚如雪凉夯。 梳的紋絲不亂的頭發(fā)上采幌,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天休傍,我揣著相機(jī)與錄音,去河邊找鬼磨取。 笑死忙厌,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的逢净。 我是一名探鬼主播,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼甥雕,長吁一口氣:“原來是場噩夢啊……” “哼胀茵!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起峭弟,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎拒炎,沒想到半個月后挨务,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡丁侄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年鸿摇,在試婚紗的時候發(fā)現(xiàn)自己被綠了劈猿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡筷黔,死狀恐怖仗颈,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情挨决,我是刑警寧澤,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站撒犀,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏或舞。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧抒和,春花似錦彤蔽、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至揩悄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間亏娜,已是汗流浹背蹬挺。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人群发。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓熟妓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親起愈。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容