Spark經(jīng)典案例之求平均值

1铅忿、需求分析
對輸入文件中數(shù)據(jù)進(jìn)行就算學(xué)生平均成績。輸入文件中的每行內(nèi)容均為一個學(xué)生的姓名和他相應(yīng)的成績,如果有多門學(xué)科胆数,則每門學(xué)科為一個文件。
要求在輸出中每行有兩個間隔的數(shù)據(jù)互墓,其中必尼,第一個代表學(xué)生的姓名,第二個代表其平均成績轰豆。

2胰伍、原始數(shù)據(jù)
1)math:
張三,88
李四,99
王五,66
趙六,77

2)china:
張三,78
李四,89
王五,96
趙六,67

3)english:
張三,80
李四,82
王五,84
趙六,86

樣本輸出:
張三,82
李四,90
王五,82
趙六,76

package ClassicCase

import org.apache.spark.{SparkConf, SparkContext}

/**
  * 業(yè)務(wù)場景:求平局值
  * Created by YJ on 2017/2/8.
  */


object case4 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local").setAppName("reduce")
    val sc = new SparkContext(conf)
    sc.setLogLevel("ERROR")
    val four = sc.textFile("hdfs://192.168.109.130:8020//user/flume/ClassicCase/case4/*", 3)

    val a = four.filter(_.trim.length > 0) //數(shù)據(jù)過濾
      .map(line => //數(shù)據(jù)整理
      (line.trim().split(",")(0), line.trim.split(",")(1).toInt)
    )
      .groupByKey() //按key分組 (張三,CompactBuffer(78, 80, 88))
      .map(x => {
      var num = 0.0
      var sum = 0
      for (i <- x._2) {
        //遍歷該值
        sum = sum + i
        num = num + 1
      }
      val avg = sum / num
      val fm = f"$avg%1.2f"   //1.2->取后面兩位小數(shù),格式化數(shù)據(jù)
      println("fm:"+fm)
      (x._1, fm)
    }
    ).collect.foreach(x => println(x._1+"\t"+x._2))

    //資源學(xué)習(xí)
    var floatVar = 12.456
    var intVar = 2000
    var stringVar = "資源學(xué)習(xí)!"
    var fs = printf(
      "浮點型變量為 " + "%1.2f, " +
        "整型變量為  " + "%d,"+
        "字符串為 " + " %s", floatVar, intVar, stringVar)
    println(fs)


  }

}

輸出結(jié)果
fm:90.00
fm:82.00
fm:82.00
fm:76.67
李四 90.00
王五 82.00
張三 82.00
趙六 76.67
浮點型變量為 12.46, 整型變量為 2000,字符串為 資源學(xué)習(xí)!()

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末齿诞,一起剝皮案震驚了整個濱河市酸休,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌祷杈,老刑警劉巖斑司,帶你破解...
    沈念sama閱讀 222,378評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡宿刮,警方通過查閱死者的電腦和手機互站,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,970評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來僵缺,“玉大人胡桃,你說我怎么就攤上這事】某保” “怎么了翠胰?”我有些...
    開封第一講書人閱讀 168,983評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長自脯。 經(jīng)常有香客問我之景,道長,這世上最難降的妖魔是什么膏潮? 我笑而不...
    開封第一講書人閱讀 59,938評論 1 299
  • 正文 為了忘掉前任锻狗,我火速辦了婚禮,結(jié)果婚禮上焕参,老公的妹妹穿的比我還像新娘轻纪。我一直安慰自己,他們只是感情好叠纷,可當(dāng)我...
    茶點故事閱讀 68,955評論 6 398
  • 文/花漫 我一把揭開白布桐磁。 她就那樣靜靜地躺著,像睡著了一般讲岁。 火紅的嫁衣襯著肌膚如雪我擂。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,549評論 1 312
  • 那天缓艳,我揣著相機與錄音校摩,去河邊找鬼。 笑死阶淘,一個胖子當(dāng)著我的面吹牛衙吩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播溪窒,決...
    沈念sama閱讀 41,063評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼坤塞,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了澈蚌?” 一聲冷哼從身側(cè)響起摹芙,我...
    開封第一講書人閱讀 39,991評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎宛瞄,沒想到半個月后浮禾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,522評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,604評論 3 342
  • 正文 我和宋清朗相戀三年盈电,在試婚紗的時候發(fā)現(xiàn)自己被綠了蝴簇。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,742評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡匆帚,死狀恐怖熬词,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情吸重,我是刑警寧澤荡澎,帶...
    沈念sama閱讀 36,413評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站晤锹,受9級特大地震影響摩幔,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜鞭铆,卻給世界環(huán)境...
    茶點故事閱讀 42,094評論 3 335
  • 文/蒙蒙 一或衡、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧车遂,春花似錦封断、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至衣陶,卻和暖如春柄瑰,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背剪况。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評論 1 274
  • 我被黑心中介騙來泰國打工教沾, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人译断。 一個月前我還...
    沈念sama閱讀 49,159評論 3 378
  • 正文 我出身青樓授翻,卻偏偏與公主長得像,于是被迫代替她去往敵國和親孙咪。 傳聞我的和親對象是個殘疾皇子堪唐,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,747評論 2 361

推薦閱讀更多精彩內(nèi)容