Spark SQL UDF函數(shù)的兩種注冊方式

SparkSQL中可以創(chuàng)建自定義函數(shù)UDF對dataframe進(jìn)行操作篮赢，UDF是一對一的關(guān)系，用于給dataframe增加一列數(shù)據(jù)的場景示辈。每次傳入一行數(shù)據(jù)矾麻，該行數(shù)據(jù)可以是一列，也可以是多列胰耗，進(jìn)行一頓操作后柴灯，最終只能輸出該新增列的一個值。

UDF函數(shù)有兩種注冊方式:
- spark.udf.register()  // spark是SparkSession對象  
- udf()  // 需要import org.apache.spark.sql.functions._

詳細(xì)見示例代碼如下:

import com.longi.bigdata.spark.utils.SparkSessionCreate
import org.apache.spark.sql.functions._

/**
  * Author: whn
  * Date: 2019-12-19 18:12
  * Version: 1.0
  * Function:  
  */
object TwoWaysOfUsingUDF {

  case class Person(name: String, age: Int)

  def main(args: Array[String]): Unit = {
    val spark = SparkSessionCreate.getSparkSession("TwoWaysOfUsingUDF", "local")
    import spark.implicits._
    //people.txt數(shù)據(jù)如下
    //Michael, 10
    //Andy, 60
    //Justin, 40
    val inputDF = spark.sparkContext
      .textFile("file:\\E:\\ideaProjects\\sparketl\\people.txt")
      .map(_.split(","))
      .map((attributes: Array[String]) => Person(attributes(0), attributes(1).trim.toInt)) // 將Array[String]轉(zhuǎn)換為自定義的Person類型
      .toDF("name", "age") // rdd轉(zhuǎn)換為DF，并為每個字段命名冬三，字段順序與case class對應(yīng)

    // TODO 方式1. spark.udf.register方式注冊udf用于sql語法中
    spark.udf.register("age_judge", ageJudge _)
    // selectExpr是Dataframe的方法，屬于DSL編程窝爪，但是該方法可以解析sql語句
    val res1 = inputDF.selectExpr("name", "age", "age_judge(age) AS age_divide")
    res1.show()

    inputDF.createOrReplaceTempView("temp")
    val res2 = spark.sql(
      """
        |SELECT name, age, age_judge(age) AS age_divide
        |FROM temp
      """.stripMargin)
    res2.show()

    // TODO 方式2. udf()注冊udf用于withColumn方法中
    val ageJudgeUDF = udf(ageJudge _)
    val res3 = inputDF.withColumn("age_divide", ageJudgeUDF(inputDF("age")))
    res3.show()
    spark.stop()
  }

  def ageJudge(age: Int): String = {
    age match {
      case ages =>
        if (ages >= 1 && ages <= 3) "嬰兒"
        else if (ages >= 4 && ages <= 18) "少年"
        else if (ages >= 19 && ages <= 45) "青年"
        else if (ages >= 46 && ages <= 60) "中年"
        else if (ages >= 61 && ages <= 130) "老年"
        else "數(shù)據(jù)異常"
      case _ => "數(shù)據(jù)異常"
    }
  }
}

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末邀杏，一起剝皮案震驚了整個濱河市双妨，隨后出現(xiàn)的幾起案子淮阐，更是在濱河造成了極大的恐慌，老刑警劉巖刁品，帶你破解...
沈念sama閱讀 218,546評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件泣特，死亡現(xiàn)場離奇詭異，居然都是意外死亡挑随，警方通過查閱死者的電腦和手機(jī)状您，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,224評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來兜挨，“玉大人膏孟，你說我怎么就攤上這事“杌悖” “怎么了柒桑？”我有些...
開封第一講書人閱讀 164,911評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長噪舀。經(jīng)常有香客問我魁淳，道長，這世上最難降的妖魔是什么与倡？我笑而不...
開封第一講書人閱讀 58,737評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任界逛，我火速辦了婚禮，結(jié)果婚禮上纺座，老公的妹妹穿的比我還像新娘息拜。我一直安慰自己，他們只是感情好净响，可當(dāng)我...
茶點故事閱讀 67,753評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布少欺。她就那樣靜靜地躺著，像睡著了一般馋贤。火紅的嫁衣襯著肌膚如雪狈茉。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,598評論 1贊 305
城市分裂傳說
那天掸掸，我揣著相機(jī)與錄音氯庆，去河邊找鬼。笑死扰付，一個胖子當(dāng)著我的面吹牛堤撵，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播羽莺，決...
沈念sama閱讀 40,338評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼实昨，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了盐固？” 一聲冷哼從身側(cè)響起荒给，我...
開封第一講書人閱讀 39,249評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤丈挟，失蹤者是張志新（化名）和其女友劉穎徙缴，沒想到半個月后院崇，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,696評論 1贊 314
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡涤浇，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,888評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年挑辆，在試婚紗的時候發(fā)現(xiàn)自己被綠了例朱。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,013評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡鱼蝉，死狀恐怖洒嗤，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情魁亦，我是刑警寧澤渔隶，帶...
沈念sama閱讀 35,731評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站洁奈，受9級特大地震影響派撕，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜睬魂，卻給世界環(huán)境...
茶點故事閱讀 41,348評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一终吼、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧氯哮，春花似錦际跪、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,929評論 0贊 22
一樁弒父案姆打，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至肠虽，卻和暖如春幔戏，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背税课。一陣腳步聲響...
開封第一講書人閱讀 33,048評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工闲延，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人韩玩。一個月前我還...
沈念sama閱讀 48,203評論 3贊 370
代替公主和親
正文我出身青樓垒玲，卻偏偏與公主長得像，于是被迫代替她去往敵國和親找颓。傳聞我的和親對象是個殘疾皇子合愈，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,960評論 2贊 355

Spark SQL UDF函數(shù)的兩種注冊方式

推薦閱讀更多精彩內(nèi)容