Spark學(xué)習(xí)筆記01-基礎(chǔ)

本文基于 Spark 2.4.1 進(jìn)行演示鳄梅，相關(guān)代碼可以在我的Github上看到甚疟。

簡(jiǎn)介

Spark是一個(gè)分布式集群計(jì)算系統(tǒng)屯远，類似Hadoop提供了強(qiáng)大的分布式計(jì)算能力暖眼，相比過去的批量處理系統(tǒng)哩至，提供了處理更大規(guī)模數(shù)據(jù)的能力躏嚎。Spark提供了Java、Python菩貌、Scala卢佣、R接口。除常見的MapReduce運(yùn)算外箭阶，還支持圖虚茶、機(jī)器學(xué)習(xí)戈鲁、SparkSQL等計(jì)算方式。

特性

高效 Speed嘹叫，因?yàn)楹芏鄶?shù)據(jù)都在內(nèi)存中婆殿，相比Hadoop，其處理更為高效罩扇。
易用 Usability婆芦，Spark提供了80多個(gè)高級(jí)運(yùn)算符。
通用 Generality喂饥，提供了大量的庫(kù)消约，包括SQL、DataFrames仰泻、MLib荆陆、GraphX、Spark Streaming集侯。
兼容 Runs everywhere被啼，基于jvm能夠兼容不同類型的操作系統(tǒng)。

Spark運(yùn)行模式

local : 主要用于開發(fā)調(diào)試Spark應(yīng)用程序
Standlone : 利用Spark自帶的資源管理與調(diào)度器運(yùn)行Spark集群棠枉，采用Master/Slave結(jié)構(gòu)浓体，為解決單點(diǎn)故障，可以采用Xookeeper實(shí)現(xiàn)高可靠(High Availability, HA)
Apache Mesos : 運(yùn)行在著名的Mesos資源管理框架基礎(chǔ)之上辈讶，該集群運(yùn)行模式將資源管理管理交給Mesos,Spark只負(fù)責(zé)運(yùn)行任務(wù)調(diào)度和計(jì)算
Hadoop YARN : 集群運(yùn)行在Yarn資源管理器上命浴，資源管理交給YARN，Spark只負(fù)責(zé)進(jìn)行任務(wù)調(diào)度和計(jì)算

Mac本地安裝

首先從Spark官方網(wǎng)站下載合適的版本贱除，解壓到安裝目錄生闲，本文使用的是 2.4.1。

配置環(huán)境變量 ~/.bash_profile

export SPARK_HOME=/Users/shiqiang/Projects/tools/spark-2.4.1-bin-hadoop2.7
export PATH=${PATH}:${SPARK_HOME}/bin

本機(jī)的安裝目錄
~/Project/tools

在Mac系統(tǒng)管理中打開Mac遠(yuǎn)程登錄設(shè)置月幌，允許安裝用戶遠(yuǎn)程登錄碍讯。

啟動(dòng)命令

$ ./sbin/start-all.sh
$ jps
21731 Jps
21717 Worker
21515 Master

使用JPS命令可以看到Master和Worker已經(jīng)啟動(dòng)。也可以單獨(dú)啟動(dòng)master./sbin/start-master.sh扯躺，單獨(dú)啟動(dòng)Worker
./bin/spark-class org.apache.spark.deploy.worker.Worker spark://localhost:7077

停止服務(wù)的方式也非常簡(jiǎn)單

$ ./sbin/stop-all.sh

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末捉兴，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子录语，更是在濱河造成了極大的恐慌倍啥，老刑警劉巖，帶你破解...
沈念sama閱讀 221,273評(píng)論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件澎埠，死亡現(xiàn)場(chǎng)離奇詭異虽缕，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)失暂，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,349評(píng)論 3贊 398
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門彼宠，熙熙樓的掌柜王于貴愁眉苦臉地迎上來鳄虱，“玉大人，你說我怎么就攤上這事凭峡∽疽眩” “怎么了？”我有些...
開封第一講書人閱讀 167,709評(píng)論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵摧冀，是天一觀的道長(zhǎng)倍踪。經(jīng)常有香客問我，道長(zhǎng)索昂，這世上最難降的妖魔是什么建车？我笑而不...
開封第一講書人閱讀 59,520評(píng)論 1贊 296
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮椒惨，結(jié)果婚禮上缤至，老公的妹妹穿的比我還像新娘。我一直安慰自己康谆，他們只是感情好领斥，可當(dāng)我...
茶點(diǎn)故事閱讀 68,515評(píng)論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著沃暗，像睡著了一般月洛。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上孽锥，一...
開封第一講書人閱讀 52,158評(píng)論 1贊 308
城市分裂傳說
那天嚼黔，我揣著相機(jī)與錄音，去河邊找鬼惜辑。笑死唬涧，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的盛撑。我是一名探鬼主播爵卒，決...
沈念sama閱讀 40,755評(píng)論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼撵彻！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起实牡，我...
開封第一講書人閱讀 39,660評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤陌僵，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后创坞，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體碗短，經(jīng)...
沈念sama閱讀 46,203評(píng)論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,287評(píng)論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年题涨，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了偎谁。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片总滩。...
茶點(diǎn)故事閱讀 40,427評(píng)論 1贊 352
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖巡雨，靈堂內(nèi)的尸體忽然破棺而出闰渔，到底是詐尸還是另有隱情，我是刑警寧澤铐望，帶...
沈念sama閱讀 36,122評(píng)論 5贊 349
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布冈涧，位于F島的核電站，受9級(jí)特大地震影響正蛙，放射性物質(zhì)發(fā)生泄漏督弓。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,801評(píng)論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一乒验、第九天我趴在偏房一處隱蔽的房頂上張望愚隧。院中可真熱鬧，春花似錦锻全、人聲如沸狂塘。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,272評(píng)論 0贊 23
一樁弒父案虱痕，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽睹耐。三九已至，卻和暖如春部翘，著一層夾襖步出監(jiān)牢的瞬間硝训，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,393評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來泰國(guó)打工新思，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留窖梁，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,808評(píng)論 3贊 376
代替公主和親
正文我出身青樓夹囚，卻偏偏與公主長(zhǎng)得像纵刘，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子荸哟，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,440評(píng)論 2贊 359

Spark學(xué)習(xí)筆記01-基礎(chǔ)

簡(jiǎn)介

特性

Spark運(yùn)行模式

Mac本地安裝

推薦閱讀更多精彩內(nèi)容