登錄注冊寫文章

Spark 筆記

Spark 筆記

Spark

Spark是什么

Spark是一個用來實現(xiàn)快速而通用的集群計算的平臺点额。

Spark軟件架構(gòu)

image.png

Spark Core

SparkCore實現(xiàn)了Spark的基本功能赚楚，包括任務(wù)調(diào)度指郁，內(nèi)存管理诀豁，錯誤恢復(fù)驮审，與存儲系統(tǒng)的交互
Spark Core包含了對RDD（resilient distributed dataset）的定義棕洋，表示分布在多個計算節(jié)點上可以并行操作的元素集合，這是Spark主要的編程對象

SparkSQL

是Spark用來操作結(jié)構(gòu)化數(shù)據(jù)的程序包

Spark Streaming

是Spark提供對實時數(shù)據(jù)進行流式計算的組件

MLlib

Spark的機器學(xué)習(xí)的程序庫逗扒，提供算法與模型

GraphX

用來操作圖的程序庫古戴，可以進行并行的圖計算

集群管理器（cluster manager）

Spark可以在一個節(jié)點到上千個節(jié)點之間的伸縮計算，支持在各種集群管理器上運行矩肩，如Hadoop YARN现恼，Apache Mesos肃续，Spark自帶的獨立調(diào)度器

存儲

Spark可以訪問存儲在HDFS，Hbase叉袍，Cassandra始锚，Amazon S3，本地文件系統(tǒng)等等的數(shù)據(jù)喳逛，支持文本文件瞧捌，序列文件以及任何Hadoop的InputFormat

核心概念 RDD

Spark 中的 RDD 就是一個不可變的分布式對象集合。每個 RDD 都被分為多個分區(qū)润文，這些
分區(qū)運行在集群中的不同節(jié)點上姐呐。 RDD 可以包含 Python、 Java典蝌、 Scala 中任意類型的對象曙砂，
甚至可以包含用戶自定義的對象。

RDD 支持兩種操作：轉(zhuǎn)化操作和行動操作骏掀。 RDD 的轉(zhuǎn)化操作是返回一
個新的 RDD 的操作鸠澈，比如 map() 和 filter()，而行動操作則是向驅(qū)動器程序返回結(jié)果或
把結(jié)果寫入外部系統(tǒng)的操作截驮，會觸發(fā)實際的計算笑陈，比如 count() 和 first()。

Spark運行時架構(gòu)

image.png

在分布式環(huán)境下葵袭， Spark 集群采用的是主 / 從結(jié)構(gòu)涵妥。在一個 Spark 集群中，有一個節(jié)點負
責(zé)中央?yún)f(xié)調(diào)眶熬，調(diào)度各個分布式工作節(jié)點妹笆。這個中央?yún)f(xié)調(diào)節(jié)點被稱為驅(qū)動器（ Driver）節(jié)點，
與之對應(yīng)的工作節(jié)點被稱為執(zhí)行器（ executor）節(jié)點娜氏。驅(qū)動器節(jié)點可以和大量的執(zhí)行器節(jié)
點進行通信拳缠，它們也都作為獨立的 Java 進程運行。驅(qū)動器節(jié)點和所有的執(zhí)行器節(jié)點一起被
稱為一個 Spark 應(yīng)用（ application）贸弥。

最后編輯于：2017.12.08 17:54:34

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末窟坐，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子绵疲，更是在濱河造成了極大的恐慌哲鸳，老刑警劉巖，帶你破解...
沈念sama閱讀 221,273評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件盔憨，死亡現(xiàn)場離奇詭異徙菠，居然都是意外死亡，警方通過查閱死者的電腦和手機郁岩，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,349評論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門婿奔，熙熙樓的掌柜王于貴愁眉苦臉地迎上來缺狠，“玉大人，你說我怎么就攤上這事萍摊〖非眩” “怎么了？”我有些...
開封第一講書人閱讀 167,709評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵冰木，是天一觀的道長穷劈。經(jīng)常有香客問我，道長踊沸，這世上最難降的妖魔是什么歇终？我笑而不...
開封第一講書人閱讀 59,520評論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮雕沿，結(jié)果婚禮上练湿，老公的妹妹穿的比我還像新娘猴仑。我一直安慰自己审轮，他們只是感情好，可當(dāng)我...
茶點故事閱讀 68,515評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布辽俗。她就那樣靜靜地躺著疾渣，像睡著了一般。火紅的嫁衣襯著肌膚如雪崖飘。梳的紋絲不亂的頭發(fā)上榴捡，一...
開封第一講書人閱讀 52,158評論 1贊 308
城市分裂傳說
那天，我揣著相機與錄音朱浴，去河邊找鬼吊圾。笑死，一個胖子當(dāng)著我的面吹牛翰蠢，可吹牛的內(nèi)容都是我干的项乒。我是一名探鬼主播，決...
沈念sama閱讀 40,755評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼梁沧，長吁一口氣：“原來是場噩夢啊……” “哼檀何！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起廷支，我...
開封第一講書人閱讀 39,660評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤频鉴，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后恋拍，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體垛孔，經(jīng)...
沈念sama閱讀 46,203評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,287評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年施敢，在試婚紗的時候發(fā)現(xiàn)自己被綠了周荐。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辛萍。...
茶點故事閱讀 40,427評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖羡藐，靈堂內(nèi)的尸體忽然破棺而出贩毕，到底是詐尸還是另有隱情，我是刑警寧澤仆嗦，帶...
沈念sama閱讀 36,122評論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布辉阶，位于F島的核電站，受9級特大地震影響瘩扼，放射性物質(zhì)發(fā)生泄漏谆甜。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,801評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一集绰、第九天我趴在偏房一處隱蔽的房頂上張望规辱。院中可真熱鬧，春花似錦栽燕、人聲如沸罕袋。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,272評論 0贊 23
一樁弒父案碍岔，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽浴讯。三九已至，卻和暖如春蔼啦，著一層夾襖步出監(jiān)牢的瞬間榆纽，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,393評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工捏肢，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留奈籽，地道東北人。一個月前我還...
沈念sama閱讀 48,808評論 3贊 376
代替公主和親
正文我出身青樓鸵赫，卻偏偏與公主長得像衣屏，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子奉瘤，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,440評論 2贊 359

推薦閱讀更多精彩內(nèi)容

Apache Spark 2.2.0 中文文檔 - Spark Streaming 編程指南 ...
Spark Streaming 編程指南概述一個入門示例基礎(chǔ)概念依賴初始化 StreamingConte...
Joyyx閱讀 5,321評論 0贊 26
Apache Spark 2.2.0 中文文檔 - Spark Streaming 編程指南 ...
Spark Streaming 編程指南概述一個入門示例基礎(chǔ)概念依賴初始化 StreamingConte...
草里有只羊閱讀 4,205評論 0贊 11
《spark快速大數(shù)據(jù)分析》學(xué)習(xí)筆記
學(xué)習(xí)筆記時間：2017年2月7日使用工具：1. 在辦公電腦上安裝的Ubuntu虛擬機編程語言：scala v...
485b1aca799e閱讀 5,826評論 0贊 15
RDD:基于內(nèi)存集群計算的容錯抽象
該論文來自Berkeley實驗室勾拉，英文標題為：Resilient Distributed Datasets: A ...
九七學(xué)姐閱讀 1,785評論 0贊 3
spark筆記總結(jié)
RDD基礎(chǔ)： transformation操作：由一個RDD生成新的RDD，轉(zhuǎn)化操作是惰性的 action操作：...
pangchao閱讀 674評論 0贊 0

贊1贊

贊賞

手機看全文

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品