在Window上安裝PySpark

在Windows安裝配置PySpakr開發(fā)環(huán)境操作視屏如下锅移。更多視頻可查看騰訊課堂地址:個人大數(shù)據(jù)平臺的搭建與學習實踐-學習視頻教程-騰訊課堂 (qq.com)



1-windows上安裝配置PySpark

安裝Python

可以選擇安裝官方版本的Python腊嗡,或是Anaconda,對應的地址如下担巩,下載地址為:

Python:https://www.python.org/

Anaconda: https://www.anaconda.com/download/#windows

MiniConda:https://docs.conda.io/en/latest/miniconda.html


安裝Java運行環(huán)境

安裝Java運行環(huán)境,下載地址為

在線安裝包: https://www.java.com/en/download/

離線安裝包:https://www.java.com/zh-CN/download/windows_offline.jsp


下載Spark和winutils工具

由于Hadoop開發(fā)是針對類Unix系統(tǒng)的,所以在Windows平臺中沒有原生的Hadoop安裝包兼吓,但可以通過winutils工具作為替代烦绳。

* spark下載地址: http://spark.apache.org/downloads.html

* winutils下載地址: https://github.com/steveloughran/winutils

解壓spark卿捎,將winutils拷貝到解壓目錄的bin目錄下


配置環(huán)境變量

* 添加環(huán)境變量 HADOOP_HOME 變量值是安裝Spark的目錄,如 E:\spark\spark-3.1.2-bin-hadoop2.7\

* 添加環(huán)境變量SPARK_HOME 變量值是安裝Spark的目錄爵嗅,如 E:\spark\spark-3.1.2-bin-hadoop2.7\

* 將Spark安裝目錄添加環(huán)境變量中 將Spark安裝目錄bin文件夾添加到path變量中 E:\spark\spark-3.1.2-bin-hadoop2.7\bin


使用spark-shell

安裝配置完畢后娇澎,對Spark Shell使用,以驗證成功的安裝睹晒。

* 打開spark-shell2.cmd趟庄,輸入以下的scala命令括细。

打開一個Power Shell,然后輸入命令:spark-shell2.cmd

scala> 1 + 1

scala> println("Hello World!")

var myVar : String = "hello"


使用pyspark-shell

* 打開 pyspark2.cmd戚啥,輸入以下Python命令奋单。

打開一個Power Shell,然后輸入命令:pyspark2.cmd

from datetime import datetime, date

import pandas as pd

from pyspark.sql import Row

df = spark.createDataFrame([

? ? Row(a=1, b=2., c='string1', d=date(2000, 1, 1), e=datetime(2000, 1, 1, 12, 0)),

? ? Row(a=2, b=3., c='string2', d=date(2000, 2, 1), e=datetime(2000, 1, 2, 12, 0)),

? ? Row(a=4, b=5., c='string3', d=date(2000, 3, 1), e=datetime(2000, 1, 3, 12, 0))

])

df.printSchema()

使用sparkR-shell

* 打開 sparkR2.cmd猫十,輸入以下R語言命令览濒。

打開一個Power Shell,然后輸入命令:sparkR2.cmd

emp.data <- data.frame(

? emp_id = c (1:5),

? emp_name = c("Rick","Dan","Michelle","Ryan","Gary"),

? salary = c(623.3,515.2,611.0,729.0,843.25),

? start_date = as.Date(c("2012-01-01", "2013-09-23", "2014-11-15", "2014-05-11","2015-03-27")),

? stringsAsFactors = FALSE

)

df <- createDataFrame(emp.data)

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末拖云,一起剝皮案震驚了整個濱河市贷笛,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宙项,老刑警劉巖乏苦,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異尤筐,居然都是意外死亡汇荐,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門盆繁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來掀淘,“玉大人,你說我怎么就攤上這事油昂「锫Γ” “怎么了?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵秕狰,是天一觀的道長稠腊。 經(jīng)常有香客問我,道長鸣哀,這世上最難降的妖魔是什么架忌? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮我衬,結果婚禮上叹放,老公的妹妹穿的比我還像新娘。我一直安慰自己挠羔,他們只是感情好井仰,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著破加,像睡著了一般俱恶。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天合是,我揣著相機與錄音了罪,去河邊找鬼。 笑死聪全,一個胖子當著我的面吹牛泊藕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播难礼,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼娃圆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蛾茉?” 一聲冷哼從身側響起讼呢,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎谦炬,沒想到半個月后吝岭,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡吧寺,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了散劫。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片稚机。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖获搏,靈堂內(nèi)的尸體忽然破棺而出赖条,到底是詐尸還是另有隱情,我是刑警寧澤常熙,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布纬乍,位于F島的核電站,受9級特大地震影響裸卫,放射性物質(zhì)發(fā)生泄漏仿贬。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一墓贿、第九天 我趴在偏房一處隱蔽的房頂上張望茧泪。 院中可真熱鬧,春花似錦聋袋、人聲如沸队伟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嗜侮。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間锈颗,已是汗流浹背顷霹。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留宜猜,地道東北人泼返。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像姨拥,于是被迫代替她去往敵國和親绅喉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容