Spark SQL UDF函數(shù)的兩種注冊方式

SparkSQL中可以創(chuàng)建自定義函數(shù)UDF對dataframe進(jìn)行操作篮赢,UDF是一對一的關(guān)系,用于給dataframe增加一列數(shù)據(jù)的場景示辈。 每次傳入一行數(shù)據(jù)矾麻,該行數(shù)據(jù)可以是一列,也可以是多列胰耗,進(jìn)行一頓操作后柴灯,最終只能輸出該新增列的一個值。

UDF函數(shù)有兩種注冊方式:
- spark.udf.register()  // spark是SparkSession對象  
- udf()  // 需要import org.apache.spark.sql.functions._

詳細(xì)見示例代碼如下:

import com.longi.bigdata.spark.utils.SparkSessionCreate
import org.apache.spark.sql.functions._

/**
  * Author: whn
  * Date: 2019-12-19 18:12
  * Version: 1.0
  * Function:  
  */
object TwoWaysOfUsingUDF {

  case class Person(name: String, age: Int)

  def main(args: Array[String]): Unit = {
    val spark = SparkSessionCreate.getSparkSession("TwoWaysOfUsingUDF", "local")
    import spark.implicits._
    //people.txt數(shù)據(jù)如下
    //Michael, 10
    //Andy, 60
    //Justin, 40
    val inputDF = spark.sparkContext
      .textFile("file:\\E:\\ideaProjects\\sparketl\\people.txt")
      .map(_.split(","))
      .map((attributes: Array[String]) => Person(attributes(0), attributes(1).trim.toInt)) // 將Array[String]轉(zhuǎn)換為自定義的Person類型
      .toDF("name", "age") // rdd轉(zhuǎn)換為DF,并為每個字段命名冬三,字段順序與case class對應(yīng)

    // TODO 方式1. spark.udf.register方式注冊udf用于sql語法中
    spark.udf.register("age_judge", ageJudge _)
    // selectExpr是Dataframe的方法,屬于DSL編程窝爪,但是該方法可以解析sql語句
    val res1 = inputDF.selectExpr("name", "age", "age_judge(age) AS age_divide")
    res1.show()

    inputDF.createOrReplaceTempView("temp")
    val res2 = spark.sql(
      """
        |SELECT name, age, age_judge(age) AS age_divide
        |FROM temp
      """.stripMargin)
    res2.show()

    // TODO 方式2. udf()注冊udf用于withColumn方法中
    val ageJudgeUDF = udf(ageJudge _)
    val res3 = inputDF.withColumn("age_divide", ageJudgeUDF(inputDF("age")))
    res3.show()
    spark.stop()
  }

  def ageJudge(age: Int): String = {
    age match {
      case ages =>
        if (ages >= 1 && ages <= 3) "嬰兒"
        else if (ages >= 4 && ages <= 18) "少年"
        else if (ages >= 19 && ages <= 45) "青年"
        else if (ages >= 46 && ages <= 60) "中年"
        else if (ages >= 61 && ages <= 130) "老年"
        else "數(shù)據(jù)異常"
      case _ => "數(shù)據(jù)異常"
    }
  }
}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末邀杏,一起剝皮案震驚了整個濱河市双妨,隨后出現(xiàn)的幾起案子淮阐,更是在濱河造成了極大的恐慌,老刑警劉巖刁品,帶你破解...
    沈念sama閱讀 218,546評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件泣特,死亡現(xiàn)場離奇詭異,居然都是意外死亡挑随,警方通過查閱死者的電腦和手機(jī)状您,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來兜挨,“玉大人膏孟,你說我怎么就攤上這事“杌悖” “怎么了柒桑?”我有些...
    開封第一講書人閱讀 164,911評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長噪舀。 經(jīng)常有香客問我魁淳,道長,這世上最難降的妖魔是什么与倡? 我笑而不...
    開封第一講書人閱讀 58,737評論 1 294
  • 正文 為了忘掉前任界逛,我火速辦了婚禮,結(jié)果婚禮上纺座,老公的妹妹穿的比我還像新娘息拜。我一直安慰自己,他們只是感情好净响,可當(dāng)我...
    茶點故事閱讀 67,753評論 6 392
  • 文/花漫 我一把揭開白布少欺。 她就那樣靜靜地躺著,像睡著了一般馋贤。 火紅的嫁衣襯著肌膚如雪狈茉。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,598評論 1 305
  • 那天掸掸,我揣著相機(jī)與錄音氯庆,去河邊找鬼。 笑死扰付,一個胖子當(dāng)著我的面吹牛堤撵,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播羽莺,決...
    沈念sama閱讀 40,338評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼实昨,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了盐固?” 一聲冷哼從身側(cè)響起荒给,我...
    開封第一講書人閱讀 39,249評論 0 276
  • 序言:老撾萬榮一對情侶失蹤丈挟,失蹤者是張志新(化名)和其女友劉穎徙缴,沒想到半個月后院崇,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,696評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡涤浇,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,888評論 3 336
  • 正文 我和宋清朗相戀三年挑辆,在試婚紗的時候發(fā)現(xiàn)自己被綠了例朱。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,013評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡鱼蝉,死狀恐怖洒嗤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情魁亦,我是刑警寧澤渔隶,帶...
    沈念sama閱讀 35,731評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站洁奈,受9級特大地震影響派撕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜睬魂,卻給世界環(huán)境...
    茶點故事閱讀 41,348評論 3 330
  • 文/蒙蒙 一终吼、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧氯哮,春花似錦际跪、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,929評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至肠虽,卻和暖如春幔戏,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背税课。 一陣腳步聲響...
    開封第一講書人閱讀 33,048評論 1 270
  • 我被黑心中介騙來泰國打工闲延, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人韩玩。 一個月前我還...
    沈念sama閱讀 48,203評論 3 370
  • 正文 我出身青樓垒玲,卻偏偏與公主長得像,于是被迫代替她去往敵國和親找颓。 傳聞我的和親對象是個殘疾皇子合愈,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,960評論 2 355

推薦閱讀更多精彩內(nèi)容