spark算子flapMap和Map的區(qū)別

為了弄明白flatMap和map的區(qū)別了芝加,查了很多資料,始終不解其意射窒。今天為了實(shí)現(xiàn)一個(gè)小需求藏杖,要求統(tǒng)計(jì)上季度不同商品銷售數(shù)量,用spark寫了個(gè)wordcount脉顿,統(tǒng)計(jì)完成蝌麸。

但是在看到flatMap和map算子時(shí),一時(shí)不知道用哪個(gè)艾疟,猶豫不決来吩。最終,自己決定用數(shù)據(jù)直觀驗(yàn)證他們兩者的區(qū)別蔽莱。

數(shù)據(jù)格式
10001#music#120180101#singer1
10002#music2#20180301#singer2

使用flatMap算子處理數(shù)據(jù)

lines.flatMap(_.split("#")).foreach(println)

輸出結(jié)果:
10002
music2
20180301
singer2
10001
music1
20180101
singer1

返回的直接是一個(gè)RDD[String]

使用Map算子處理數(shù)據(jù)

lines.map(_.split("#")).foreach(println)

輸出結(jié)果:
[Ljava.lang.String;@4e7cb15d
[Ljava.lang.String;@4b78c965

返回的是RDD[Array[String]]

繼續(xù)對(duì)數(shù)據(jù)處理

lines.map(_.split("\t")).map(data=>{
      (data(0),data(1),data(2),data(3))
    }).foreach(println)

輸出結(jié)果:
(10002,music2,20180301,singer2)
(10001,music1,20180101,singer1)

返回的是RDD[String,String,String,String]

再次對(duì)數(shù)據(jù)處理等到的結(jié)果和flatMap一致

lines.map(_.split("\t")).map(data=>{
      (data(0),data(1),data(2),data(3))
    }).foreach(dataf=>{
      println(dataf._1)
      println(dataf._2)
      println(dataf._3)
      println(dataf._4)
    })

輸出結(jié)果:
10002
music2
20180301
singer2
10001
music1
20180101
singer1

總結(jié)弟疆,通過上面可以發(fā)現(xiàn),flatMap直接一步把一行數(shù)據(jù)切割成一份份輸出碾褂;而map需要一系列操作才能把一行數(shù)據(jù)切割成一份份輸出兽间。flatMap把一個(gè)整體切割成單獨(dú)的數(shù)據(jù);map只是把一個(gè)整體切分開正塌,但是還在同一行

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object CountMusic {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local[*]").setAppName("countmusic")
    val sc = new SparkContext(conf)
    val lines: RDD[String] = sc.textFile("D:\\JNBY\\20200401\\music1")
    //flatMap算子操作數(shù)據(jù)
//    lines.flatMap(_.split("#")).foreach(println)
    //map算子操作數(shù)據(jù)
   /** lines.map(_.split("#")).map(data=>{
      (data(0),data(1),data(2),data(3))
    }).foreach(ff=>{
      println(ff._1)
      println(ff._2)
      println(ff._3)
      println(ff._4)
    })*/

    //spark版wordcount
    val value: RDD[(String, Int)] = lines.flatMap(_.split("#")).map((_,1)).reduceByKey(_+_)
    println(value)
  }
}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末嘀略,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子乓诽,更是在濱河造成了極大的恐慌帜羊,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,723評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鸠天,死亡現(xiàn)場(chǎng)離奇詭異讼育,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)稠集,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門奶段,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人剥纷,你說我怎么就攤上這事痹籍。” “怎么了晦鞋?”我有些...
    開封第一講書人閱讀 152,998評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵蹲缠,是天一觀的道長(zhǎng)棺克。 經(jīng)常有香客問我,道長(zhǎng)线定,這世上最難降的妖魔是什么娜谊? 我笑而不...
    開封第一講書人閱讀 55,323評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮斤讥,結(jié)果婚禮上纱皆,老公的妹妹穿的比我還像新娘。我一直安慰自己芭商,他們只是感情好抹剩,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,355評(píng)論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著蓉坎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪胡嘿。 梳的紋絲不亂的頭發(fā)上蛉艾,一...
    開封第一講書人閱讀 49,079評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音衷敌,去河邊找鬼勿侯。 笑死,一個(gè)胖子當(dāng)著我的面吹牛缴罗,可吹牛的內(nèi)容都是我干的助琐。 我是一名探鬼主播,決...
    沈念sama閱讀 38,389評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼面氓,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼兵钮!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起舌界,我...
    開封第一講書人閱讀 37,019評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤掘譬,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后呻拌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體葱轩,經(jīng)...
    沈念sama閱讀 43,519評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,971評(píng)論 2 325
  • 正文 我和宋清朗相戀三年藐握,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了靴拱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,100評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡猾普,死狀恐怖袜炕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情抬闷,我是刑警寧澤妇蛀,帶...
    沈念sama閱讀 33,738評(píng)論 4 324
  • 正文 年R本政府宣布耕突,位于F島的核電站,受9級(jí)特大地震影響评架,放射性物質(zhì)發(fā)生泄漏眷茁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,293評(píng)論 3 307
  • 文/蒙蒙 一纵诞、第九天 我趴在偏房一處隱蔽的房頂上張望上祈。 院中可真熱鬧,春花似錦浙芙、人聲如沸登刺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)纸俭。三九已至,卻和暖如春南窗,著一層夾襖步出監(jiān)牢的瞬間揍很,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工万伤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留窒悔,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,547評(píng)論 2 354
  • 正文 我出身青樓敌买,卻偏偏與公主長(zhǎng)得像简珠,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子虹钮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,834評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容