1-Spark概述

1 大數(shù)據(jù)技術(shù)棧

image.png

2 spark是什么

快如閃電般的分布式計(jì)算框架：Lightning-fast cluster

3 MapReduce框架局限性

image.png

4 Hadoop生態(tài)圈中的各種框架

image.png

5 Spark的優(yōu)勢(shì)

image.png

6 SPARK 2新特性

image.png

7 Windows開(kāi)發(fā)環(huán)境

image.png

8 下載anacoda(略）

9 下載安裝hadoop2.7

hadoop-2.7.6下載地址：https://archive.apache.org/dist/hadoop/common/hadoop-2.7.6/
進(jìn)入下載地址后竞川，選擇紅框里的內(nèi)容尺铣，則會(huì)開(kāi)始自動(dòng)下載了。

image.png

10 下載安裝jdk1.8

jdk1.8下載地址：http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
選擇Accept License Agreement，然后下載和自己電腦配置相同的版本，我的是windows64位的，如下圖：

image.png

11 下載安裝spark

spark-2.3.1-bin-hadoop2.7.tgz下載地址：http://spark.apache.org/downloads.html
選擇版本，點(diǎn)擊下載

image.png

12 安裝py4j

進(jìn)入cmd命令框，輸入：pip install py4j多柑，即開(kāi)始下載

13 安裝pyspark的擴(kuò)展包

將D:\spark-2.3.1-bin-hadoop2.7\python(spark\python目錄）粘貼到anacoda目錄下D:\anaconda3\Lib\site-packages，新建pyspark.pth的文本里

14 配置環(huán)境變量

將hadoop2.7楣责、spark竣灌、jdk這三個(gè)的安裝目錄添加到環(huán)境變量中，分別為
HADOOP_HOME:hadoop安裝路徑

image.png

SPARK_HOME:spark安裝路徑

image.png

JAVA_HOME:jdk安裝路徑

image.png

在Path路徑中也要加上剛才添加的三個(gè)安裝路徑

image.png

15 啟動(dòng)pyspark

在cmd命令框中輸入：pyspark秆麸，進(jìn)入pyspark編輯界面

image.png

16 測(cè)試wordcount

1帐偎、在D盤(pán)新建一個(gè)測(cè)試文件：app.log(隨便輸入幾個(gè)word,用空格分割)
2、運(yùn)行下面命令

sc = spark.sparkContext
doc = sc.textFile('file:///d:/app.log')
words = doc.flatMap(lambda x:x.split(" ")).map(lambda x:(x,1)).reduceByKey(lambda x,y:x+y).collect()”

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末蛔屹，一起剝皮案震驚了整個(gè)濱河市削樊，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌兔毒，老刑警劉巖漫贞，帶你破解...
沈念sama閱讀 210,978評(píng)論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異育叁，居然都是意外死亡迅脐，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 89,954評(píng)論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)豪嗽，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)谴蔑，“玉大人豌骏，你說(shuō)我怎么就攤上這事∫В” “怎么了窃躲？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,623評(píng)論 0贊 345
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)钦睡。經(jīng)常有香客問(wèn)我蒂窒，道長(zhǎng)，這世上最難降的妖魔是什么荞怒？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,324評(píng)論 1贊 282
?港島之戀（遺憾婚禮）
正文為了忘掉前任洒琢，我火速辦了婚禮，結(jié)果婚禮上褐桌，老公的妹妹穿的比我還像新娘衰抑。我一直安慰自己，他們只是感情好荧嵌，可當(dāng)我...
茶點(diǎn)故事閱讀 65,390評(píng)論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布呛踊。她就那樣靜靜地躺著，像睡著了一般完丽。火紅的嫁衣襯著肌膚如雪恋技。梳的紋絲不亂的頭發(fā)上拇舀，一...
開(kāi)封第一講書(shū)人閱讀 49,741評(píng)論 1贊 289
城市分裂傳說(shuō)
那天逻族，我揣著相機(jī)與錄音，去河邊找鬼骄崩。笑死聘鳞，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的要拂。我是一名探鬼主播抠璃，決...
沈念sama閱讀 38,892評(píng)論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼脱惰！你這毒婦竟也來(lái)了搏嗡？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 37,655評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤拉一，失蹤者是張志新（化名）和其女友劉穎采盒，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蔚润，經(jīng)...
沈念sama閱讀 44,104評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡磅氨，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,451評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了嫡纠。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片烦租。...
茶點(diǎn)故事閱讀 38,569評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡延赌，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出叉橱，到底是詐尸還是另有隱情挫以，我是刑警寧澤，帶...
沈念sama閱讀 34,254評(píng)論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布赏迟，位于F島的核電站屡贺，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏锌杀。R本人自食惡果不足惜甩栈，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,834評(píng)論 3贊 312
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望糕再。院中可真熱鬧量没，春花似錦、人聲如沸突想。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,725評(píng)論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)猾担。三九已至袭灯，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間绑嘹，已是汗流浹背稽荧。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,950評(píng)論 1贊 264
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留工腋，地道東北人姨丈。一個(gè)月前我還...
沈念sama閱讀 46,260評(píng)論 2贊 360
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像擅腰，于是被迫代替她去往敵國(guó)和親蟋恬。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,446評(píng)論 2贊 348

1-Spark概述

1 大數(shù)據(jù)技術(shù)棧

2 spark是什么

3 MapReduce框架局限性

4 Hadoop生態(tài)圈中的各種框架

5 Spark的優(yōu)勢(shì)

6 SPARK 2新特性

7 Windows開(kāi)發(fā)環(huán)境

8 下載anacoda(略）

9 下載安裝hadoop2.7

10 下載安裝jdk1.8

11 下載安裝spark

12 安裝py4j

13 安裝pyspark的擴(kuò)展包

14 配置環(huán)境變量

15 啟動(dòng)pyspark

16 測(cè)試wordcount

推薦閱讀更多精彩內(nèi)容