1-Spark概述

1 大數(shù)據(jù)技術(shù)棧

image.png

2 spark是什么

快如閃電般的分布式計(jì)算框架:Lightning-fast cluster

3 MapReduce框架局限性

image.png

4 Hadoop生態(tài)圈中的各種框架

image.png

5 Spark的優(yōu)勢(shì)

image.png

image.png

6 SPARK 2新特性

image.png

7 Windows開(kāi)發(fā)環(huán)境

image.png

8 下載anacoda(略)

9 下載安裝hadoop2.7

hadoop-2.7.6下載地址:https://archive.apache.org/dist/hadoop/common/hadoop-2.7.6/
進(jìn)入下載地址后竞川,選擇紅框里的內(nèi)容尺铣,則會(huì)開(kāi)始自動(dòng)下載了。

image.png

10 下載安裝jdk1.8

jdk1.8下載地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
選擇Accept License Agreement,然后下載和自己電腦配置相同的版本,我的是windows64位的,如下圖:

image.png

11 下載安裝spark

spark-2.3.1-bin-hadoop2.7.tgz下載地址:http://spark.apache.org/downloads.html
選擇版本,點(diǎn)擊下載

image.png

12 安裝py4j

進(jìn)入cmd命令框,輸入:pip install py4j多柑,即開(kāi)始下載

13 安裝pyspark的擴(kuò)展包

將D:\spark-2.3.1-bin-hadoop2.7\python(spark\python目錄)粘貼到anacoda目錄下D:\anaconda3\Lib\site-packages,新建pyspark.pth的文本里

14 配置環(huán)境變量

將hadoop2.7楣责、spark竣灌、jdk這三個(gè)的安裝目錄添加到環(huán)境變量中,分別為
HADOOP_HOME:hadoop安裝路徑


image.png

SPARK_HOME:spark安裝路徑


image.png

JAVA_HOME:jdk安裝路徑
image.png

在Path路徑中也要加上剛才添加的三個(gè)安裝路徑
image.png

15 啟動(dòng)pyspark

在cmd命令框中輸入:pyspark秆麸,進(jìn)入pyspark編輯界面


image.png

16 測(cè)試wordcount

1帐偎、在D盤(pán)新建一個(gè)測(cè)試文件:app.log(隨便輸入幾個(gè)word,用空格分割)
2、運(yùn)行下面命令

sc = spark.sparkContext
doc = sc.textFile('file:///d:/app.log')
words = doc.flatMap(lambda x:x.split(" ")).map(lambda x:(x,1)).reduceByKey(lambda x,y:x+y).collect()”

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蛔屹,一起剝皮案震驚了整個(gè)濱河市削樊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌兔毒,老刑警劉巖漫贞,帶你破解...
    沈念sama閱讀 210,978評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異育叁,居然都是意外死亡迅脐,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門(mén)豪嗽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)谴蔑,“玉大人豌骏,你說(shuō)我怎么就攤上這事∫В” “怎么了窃躲?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,623評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)钦睡。 經(jīng)常有香客問(wèn)我蒂窒,道長(zhǎng),這世上最難降的妖魔是什么荞怒? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,324評(píng)論 1 282
  • 正文 為了忘掉前任洒琢,我火速辦了婚禮,結(jié)果婚禮上褐桌,老公的妹妹穿的比我還像新娘衰抑。我一直安慰自己,他們只是感情好荧嵌,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,390評(píng)論 5 384
  • 文/花漫 我一把揭開(kāi)白布呛踊。 她就那樣靜靜地躺著,像睡著了一般完丽。 火紅的嫁衣襯著肌膚如雪恋技。 梳的紋絲不亂的頭發(fā)上拇舀,一...
    開(kāi)封第一講書(shū)人閱讀 49,741評(píng)論 1 289
  • 那天逻族,我揣著相機(jī)與錄音,去河邊找鬼骄崩。 笑死聘鳞,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的要拂。 我是一名探鬼主播抠璃,決...
    沈念sama閱讀 38,892評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼脱惰!你這毒婦竟也來(lái)了搏嗡?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,655評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤拉一,失蹤者是張志新(化名)和其女友劉穎采盒,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體蔚润,經(jīng)...
    沈念sama閱讀 44,104評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡磅氨,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了嫡纠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片烦租。...
    茶點(diǎn)故事閱讀 38,569評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡延赌,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出叉橱,到底是詐尸還是另有隱情挫以,我是刑警寧澤,帶...
    沈念sama閱讀 34,254評(píng)論 4 328
  • 正文 年R本政府宣布赏迟,位于F島的核電站屡贺,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏锌杀。R本人自食惡果不足惜甩栈,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,834評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望糕再。 院中可真熱鬧量没,春花似錦、人聲如沸突想。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,725評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)猾担。三九已至袭灯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間绑嘹,已是汗流浹背稽荧。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,950評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留工腋,地道東北人姨丈。 一個(gè)月前我還...
    沈念sama閱讀 46,260評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像擅腰,于是被迫代替她去往敵國(guó)和親蟋恬。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,446評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容