第一章 Spark數(shù)據(jù)分析導(dǎo)論

1.1 Spark 是什么

Spark是一個用來實現(xiàn)快速(通用)集群計算平臺落恼。擴展了MapReduce計算模型,高效支持更多的計算模型绸硕,包含交互式查詢和流處理钠署。Spark可以在內(nèi)存上進行運算勾怒,所以速度很快婆排,即使在磁盤中運算声旺,也比MapReduce 快。通過在一個統(tǒng)一法人框架下支持不同的分布式計算段只,Spark使我們可以簡單而低耗地把各種處理流程整合在一起腮猖。

1.2 一個大一統(tǒng)的軟件棧

Spark的核心是一個對由很多計算任務(wù)組成的、運行在多個工作機器或者一個計算集群上的應(yīng)用進行調(diào)度赞枕、分發(fā)以及監(jiān)控的計算引擎澈缺。

各組件密切結(jié)合的設(shè)計原理優(yōu)點:1)軟件棧中所有程序庫和高級組件都可以從下層的改進中獲益;2)運行整個軟件棧的代價變锌簧簟姐赡;3)可以無縫整合不同處理模型的應(yīng)用。

Spark 軟件棧

1.2.1 Spark Core

Spark Core實現(xiàn)了Spark的基本功能柠掂,包含任務(wù)調(diào)度项滑、內(nèi)存管理、錯誤恢復(fù)涯贞、與存儲系統(tǒng)交互等模塊枪狂。

RDD(彈性分布式數(shù)據(jù)集)表示分布在多個計算節(jié)點上可以并行操作的元素集合。

1.2.2 Spark SQL

SparkSQL是Spark用來操作結(jié)構(gòu)化數(shù)據(jù)的程序包宋渔。SparkSQL還支持開發(fā)者將SQL和傳統(tǒng)的RDD編程的數(shù)據(jù)操作方式相結(jié)合州疾。

1.2.3 Spark Streaming

Spark Streaming是spark提供對實時數(shù)據(jù)進行流式計算的組件。Spark Streaming提供用來操作數(shù)據(jù)流的API皇拣,并且與Spark Core中RDD API高度對應(yīng)严蓖。從底層設(shè)計來看,Spark Streaming支持與Spark Core同級別的容錯性氧急、吞吐量一級可伸縮性谈飒。

1.2.4 MLlib

MLlib提供很多種機器學(xué)習算法,包括分類态蒂、回歸、聚類费什、協(xié)同過濾等钾恢,還包括模型評估、數(shù)據(jù)導(dǎo)入等額外的支持功能鸳址。

1.2.5 GraphX

專門用來操作圖的程序庫瘩蚪,可以對圖進行并行計算及其他的各種操作。

1.2.6 集群管理器

Spark支持在各種集群管理器上運行稿黍,包括Hadoop YARN疹瘦、Apache Mesos,以及Spark自帶的一個簡易調(diào)度器(獨立調(diào)度器)

1.3? Spark的用戶和用途(略)

1.4? Spark簡史(略)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末巡球,一起剝皮案震驚了整個濱河市言沐,隨后出現(xiàn)的幾起案子邓嘹,更是在濱河造成了極大的恐慌,老刑警劉巖险胰,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件汹押,死亡現(xiàn)場離奇詭異,居然都是意外死亡起便,警方通過查閱死者的電腦和手機棚贾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來榆综,“玉大人妙痹,你說我怎么就攤上這事”谴” “怎么了怯伊?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長陋守。 經(jīng)常有香客問我震贵,道長,這世上最難降的妖魔是什么水评? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任猩系,我火速辦了婚禮,結(jié)果婚禮上中燥,老公的妹妹穿的比我還像新娘寇甸。我一直安慰自己,他們只是感情好疗涉,可當我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布拿霉。 她就那樣靜靜地躺著,像睡著了一般咱扣。 火紅的嫁衣襯著肌膚如雪绽淘。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天闹伪,我揣著相機與錄音沪铭,去河邊找鬼。 笑死偏瓤,一個胖子當著我的面吹牛杀怠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播厅克,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼赔退,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起硕旗,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤窗骑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后卵渴,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體慧域,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年浪读,在試婚紗的時候發(fā)現(xiàn)自己被綠了昔榴。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡碘橘,死狀恐怖互订,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情痘拆,我是刑警寧澤仰禽,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站纺蛆,受9級特大地震影響吐葵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜桥氏,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一温峭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧字支,春花似錦凤藏、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至欠雌,卻和暖如春蹄梢,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背富俄。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工禁炒, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蛙酪。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像翘盖,于是被迫代替她去往敵國和親桂塞。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,092評論 2 355

推薦閱讀更多精彩內(nèi)容