Spark實(shí)例-DataFrame加載和保存數(shù)據(jù)

  • Spark加載不同格式文件時(shí),調(diào)用sqlContext.read.format("").load方法
val peopleDF=sqlContext.read.format("json").load("E:\\spark\\src\\main\\resources\\people.json")
  • Spark將DataFrame寫入到文件中時(shí)扁凛,調(diào)用DF.write.format("").save方法
peopleDF.select("name")
   .write.format("parquet")
   //.mode(SaveMode.ErrorIfExists)
     .mode(SaveMode.Append)
   .save("E:\\spark\\src\\main\\resources\\people")
  • 代碼示例
package com.spark.sql

import org.apache.spark.sql.{SQLContext, SaveMode}
import org.apache.spark.{SparkConf, SparkContext}

/**
  * Created by Administrator on 2017/3/12.
  * 通用加載數(shù)據(jù)和保存數(shù)據(jù)
  * 文件保存模式
  * 1.SaveMode.ErrorIfExists
  * parquet文件的有點(diǎn)【列式存儲】
  * 1.可以跳過不符合條件的數(shù)據(jù),只讀取需要的數(shù)據(jù),降低IO量
  * 2.壓縮編碼可以降低磁盤的存儲空間摩桶,由于同一類的數(shù)據(jù)類型是相同的,可以使用更高效的壓縮編碼帽揪,進(jìn)一步節(jié)約存儲空間
  * 3.只讀取需要的列硝清,支持向量運(yùn)算,能夠獲得更好的掃描性能
  */
object GenericLoadAndSave extends App{
 val conf = new SparkConf()
    .setMaster("local")
    .setAppName("GenericLoadAndSave")
  val sc = new SparkContext(conf)
  val sqlContext= new SQLContext(sc)
  //加載數(shù)據(jù)
  val peopleDF=sqlContext.read.format("json").load("E:\\spark\\src\\main\\resources\\people.json")
  //保存到目錄
  peopleDF.select("name")
    .write.format("parquet")
    //.mode(SaveMode.ErrorIfExists)
      .mode(SaveMode.Append)
    .save("E:\\spark\\src\\main\\resources\\people")
}

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末转晰,一起剝皮案震驚了整個濱河市芦拿,隨后出現(xiàn)的幾起案子砾肺,更是在濱河造成了極大的恐慌,老刑警劉巖防嗡,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異侠坎,居然都是意外死亡蚁趁,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門实胸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來他嫡,“玉大人,你說我怎么就攤上這事庐完「质簦” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵门躯,是天一觀的道長淆党。 經(jīng)常有香客問我,道長讶凉,這世上最難降的妖魔是什么染乌? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮懂讯,結(jié)果婚禮上荷憋,老公的妹妹穿的比我還像新娘。我一直安慰自己褐望,他們只是感情好勒庄,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著瘫里,像睡著了一般实蔽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上减宣,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天盐须,我揣著相機(jī)與錄音,去河邊找鬼漆腌。 笑死贼邓,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的闷尿。 我是一名探鬼主播塑径,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼填具!你這毒婦竟也來了统舀?” 一聲冷哼從身側(cè)響起匆骗,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎誉简,沒想到半個月后碉就,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡闷串,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年瓮钥,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片烹吵。...
    茶點(diǎn)故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡碉熄,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出肋拔,到底是詐尸還是另有隱情锈津,我是刑警寧澤,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布凉蜂,位于F島的核電站琼梆,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏跃惫。R本人自食惡果不足惜叮叹,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望爆存。 院中可真熱鬧蛉顽,春花似錦、人聲如沸先较。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽闲勺。三九已至曾棕,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間菜循,已是汗流浹背翘地。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留癌幕,地道東北人衙耕。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像勺远,于是被迫代替她去往敵國和親橙喘。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容