Spark生態(tài)圈小貼士

學(xué)習(xí)Spark的基本組件会烙,主要由SparkSql、SparkStreaming等構(gòu)成韭赘,簡(jiǎn)單理解其基本原理缩滨,構(gòu)建Spark生態(tài)的全貌。

一泉瞻、Spark Sql常識(shí)

Spark Sql提供了對(duì)于結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的快速操作脉漏,主要具備以下三種功能,

(1)從多種結(jié)構(gòu)化數(shù)據(jù)源(json袖牙、parquet和hive)中讀取數(shù)據(jù)

(2)支持Spark應(yīng)用程序內(nèi)部調(diào)用和外部工具通過(guò)標(biāo)準(zhǔn)連接器連接Spark Sql進(jìn)行查詢

(3)Spark Sql中sql與Java/Python/Scala代碼高度整合

二侧巨、Spark Streaming常識(shí)

(1)Spark Streaming中使用離散化流作抽象表示并稱為DStream,其由RDD組成的隊(duì)列

(2)Spark Streaming支持兩種操作鞭达,轉(zhuǎn)化操作和輸出操作司忱,轉(zhuǎn)化操作輸出為新的DStream皇忿,輸出操作將結(jié)果輸出到硬盤上。轉(zhuǎn)化操作包括無(wú)狀態(tài)和有狀態(tài)坦仍,重點(diǎn)關(guān)注有狀態(tài)的轉(zhuǎn)化操作鳍烁。

(3)有狀態(tài)的操作主要是兩種類型,一種以時(shí)間階段為滑動(dòng)窗口進(jìn)行操作繁扎,一種用來(lái)跟蹤每個(gè)鍵的狀態(tài)變化幔荒。基于窗口的操作需要兩個(gè)參數(shù)锻离,分別為窗口時(shí)長(zhǎng)和滑動(dòng)步長(zhǎng)铺峭,兩者都必須是SparkContext設(shè)置的批次間隔的整數(shù)倍,前者控制每次計(jì)算最近的多少個(gè)批次的數(shù)據(jù)汽纠,后者用來(lái)控制對(duì)新的DStream進(jìn)行計(jì)算的間隔卫键,如圖所示,

1-基于窗口的轉(zhuǎn)化操作

當(dāng)需要在DStream跨批次維護(hù)狀態(tài)時(shí)虱朵,使用updateStateByKey()為我們提供對(duì)一個(gè)狀態(tài)變量的訪問(wèn)莉炉,用于鍵值對(duì)形式的DStream,比如跟蹤用戶訪問(wèn)網(wǎng)站的會(huì)話碴犬。

Spark體系

大數(shù)據(jù)時(shí)代

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末絮宁,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子服协,更是在濱河造成了極大的恐慌绍昂,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,451評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件偿荷,死亡現(xiàn)場(chǎng)離奇詭異窘游,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)跳纳,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,172評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門忍饰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人寺庄,你說(shuō)我怎么就攤上這事艾蓝。” “怎么了斗塘?”我有些...
    開(kāi)封第一講書人閱讀 164,782評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵赢织,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我馍盟,道長(zhǎng)于置,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 58,709評(píng)論 1 294
  • 正文 為了忘掉前任朽合,我火速辦了婚禮俱两,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘曹步。我一直安慰自己宪彩,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,733評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布讲婚。 她就那樣靜靜地躺著尿孔,像睡著了一般。 火紅的嫁衣襯著肌膚如雪筹麸。 梳的紋絲不亂的頭發(fā)上活合,一...
    開(kāi)封第一講書人閱讀 51,578評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音物赶,去河邊找鬼白指。 笑死,一個(gè)胖子當(dāng)著我的面吹牛酵紫,可吹牛的內(nèi)容都是我干的告嘲。 我是一名探鬼主播,決...
    沈念sama閱讀 40,320評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼奖地,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼橄唬!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起参歹,我...
    開(kāi)封第一講書人閱讀 39,241評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤仰楚,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后犬庇,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體僧界,經(jīng)...
    沈念sama閱讀 45,686評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,878評(píng)論 3 336
  • 正文 我和宋清朗相戀三年械筛,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了捎泻。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,992評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡埋哟,死狀恐怖笆豁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情赤赊,我是刑警寧澤闯狱,帶...
    沈念sama閱讀 35,715評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站抛计,受9級(jí)特大地震影響哄孤,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜吹截,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,336評(píng)論 3 330
  • 文/蒙蒙 一瘦陈、第九天 我趴在偏房一處隱蔽的房頂上張望凝危。 院中可真熱鬧,春花似錦晨逝、人聲如沸蛾默。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,912評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)支鸡。三九已至,卻和暖如春趁窃,著一層夾襖步出監(jiān)牢的瞬間牧挣,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,040評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工醒陆, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留瀑构,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,173評(píng)論 3 370
  • 正文 我出身青樓刨摩,卻偏偏與公主長(zhǎng)得像检碗,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子码邻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,947評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容