法拉利的外觀(guān)（Spark）

如果說(shuō) MapReduce 是批處理的馬自達(dá)西壮，那 Spark 一定是批處理的法拉利

原因之一就是它將數(shù)據(jù)優(yōu)先放在內(nèi)存厂画，內(nèi)存讀取速度遠(yuǎn)高于 MapReduce 的磁盤(pán) IO 速度踊挠，如果需要多次 Map 處理腰奋，就像馬自達(dá)和法拉利比賽跑遠(yuǎn)距離，之間的差距成指數(shù)級(jí)擴(kuò)大

SparkCore 是法拉利的核心引擎

RDD（彈性分布式數(shù)據(jù)集）之剧、DataFrame跺嗽、DataSet战授，Spark 任務(wù)處理的基本單元。所有 Operations（中文稱(chēng)為算子）都是作用在上這些數(shù)據(jù)集上桨嫁。

SparkCore 定義了 RDD植兰、DataFrame、DataSet璃吧。

除此之外楣导，SparkCore 還提供了 Spark 很多核心功能，包括但不限于:

SparkContext: spark 任務(wù)入口畜挨，在提交 Spark 任務(wù)之前需要先初始化 SparkContext筒繁，用來(lái)配置 Application 名噩凹、運(yùn)行方式等等

SparkContext 也可以被用來(lái)創(chuàng)建 RDD，DataFrame 等
存儲(chǔ)體系: 定義待處理數(shù)據(jù)集優(yōu)先存儲(chǔ)于各個(gè) NodeManager （運(yùn)行節(jié)點(diǎn)）的內(nèi)存毡咏，它是法拉利的發(fā)動(dòng)機(jī)驮宴，飛起跑的可靠保證

transforms 算子很懶

處理 Spark 數(shù)據(jù)集（如 RDD）的 Operations 有兩種：

Transforms 算子
Actions 算子

transforms 算子處理對(duì)象是 RDD，返回的也是 RDD呕缭，正如其名堵泽，transforms 只是對(duì) RDD 做了轉(zhuǎn)換:

如調(diào)用filterMap()過(guò)濾數(shù)據(jù)，Map()對(duì)基本單元數(shù)據(jù)進(jìn)行轉(zhuǎn)換恢总。

actions 算子則是返回最后結(jié)果或者寫(xiě)入存儲(chǔ)的操作（返回的不是RDD）:

如take(), collect()返回并輸出 RDD 中真實(shí)的數(shù)據(jù)迎罗，saveAsTextFile()把 RDD 內(nèi)容保存成文本文件。

當(dāng)程序運(yùn)行到 Transforms 算子的時(shí)間离熏，該 Transforms 操作并不會(huì)第一時(shí)間被觸發(fā)并且執(zhí)行佳谦，該操作只會(huì)被記錄;

當(dāng)執(zhí)行到Actions 時(shí)，前面記錄的 Transforms 算子才會(huì)真正執(zhí)行滋戳。

惰性機(jī)制提高了內(nèi)存的利用率钻蔑。

Spark 高配

Spark SQL：提供類(lèi) SQL 語(yǔ)句解析，將 SQL 解析成 Spark 任務(wù)

Spark Streaming：提供微批處理服務(wù)奸鸯，可以看成秒級(jí)別的流處理計(jì)算框架

GraphX：分布式圖處理計(jì)算框架咪笑，不了解。娄涩。窗怒。

MLlib：spark 的機(jī)器學(xué)習(xí)框架

本集粗略介紹 Spark，下集從技術(shù)細(xì)節(jié)入手繼續(xù)討論^ ^

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末蓄拣，一起剝皮案震驚了整個(gè)濱河市扬虚，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌球恤，老刑警劉巖辜昵，帶你破解...
沈念sama閱讀 216,919評(píng)論 6贊 502
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異咽斧，居然都是意外死亡堪置，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,567評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)张惹，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)舀锨，“玉大人，你說(shuō)我怎么就攤上這事宛逗】材洌” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 163,316評(píng)論 0贊 353
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀(guān)的道長(zhǎng)碑诉。經(jīng)常有香客問(wèn)我彪腔，道長(zhǎng)，這世上最難降的妖魔是什么进栽？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,294評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任德挣，我火速辦了婚禮，結(jié)果婚禮上快毛，老公的妹妹穿的比我還像新娘格嗅。我一直安慰自己，他們只是感情好唠帝，可當(dāng)我...
茶點(diǎn)故事閱讀 67,318評(píng)論 6贊 390
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布屯掖。她就那樣靜靜地躺著，像睡著了一般襟衰。火紅的嫁衣襯著肌膚如雪贴铜。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 51,245評(píng)論 1贊 299
城市分裂傳說(shuō)
那天瀑晒，我揣著相機(jī)與錄音绍坝，去河邊找鬼。笑死苔悦，一個(gè)胖子當(dāng)著我的面吹牛轩褐，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播玖详，決...
沈念sama閱讀 40,120評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼把介，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了蟋座？” 一聲冷哼從身側(cè)響起拗踢，我...
開(kāi)封第一講書(shū)人閱讀 38,964評(píng)論 0贊 275
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎向臀，沒(méi)想到半個(gè)月后秒拔，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,376評(píng)論 1贊 313
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡飒硅，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,592評(píng)論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了作谚。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片三娩。...
茶點(diǎn)故事閱讀 39,764評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖妹懒，靈堂內(nèi)的尸體忽然破棺而出雀监，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 35,460評(píng)論 5贊 344
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布会前，位于F島的核電站好乐，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏瓦宜。R本人自食惡果不足惜蔚万，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,070評(píng)論 3贊 327
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望临庇。院中可真熱鬧反璃，春花似錦、人聲如沸假夺。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,697評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)已卷。三九已至梧田，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間侧蘸，已是汗流浹背裁眯。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,846評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留闺魏，地道東北人未状。一個(gè)月前我還...
沈念sama閱讀 47,819評(píng)論 2贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像析桥，于是被迫代替她去往敵國(guó)和親司草。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,665評(píng)論 2贊 354