Spark之讀取MySQL數(shù)據(jù)的五種方式

本文介紹了使用Spark連接Mysql的五種方式宠默。

主要內(nèi)容:

  1. 不指定查詢條件
  2. 指定數(shù)據(jù)庫字段的范圍
  3. 根據(jù)任意字段進行分區(qū)
  4. 通過load獲取,和方式二類似
  5. 加載條件查詢后的數(shù)據(jù)

1.不指定查詢條件

def main(args: Array[String]): Unit = {

  val spark =
  SparkSession.builder()
  .appName("MysqlSupport")
  .master("local[2]")
  .getOrCreate()

  method1(spark)
  //method2(spark)
  //method3(spark)
  //method4(spark)
  //method5(spark)
}

/**
  * 方式一:不指定查詢條件
  * 所有的數(shù)據(jù)由RDD的一個分區(qū)處理灵巧,如果你這個表很大搀矫,很可能會出現(xiàn)OOM
  *
  * @param spark
  */
def method1(spark: SparkSession): Unit = {
  val url = "jdbc:mysql://127.0.0.1:3306/test?user=root&password=root"
  val prop = new Properties()
  val df = spark.read.jdbc(url, "t_score", prop)

  println(df.count())
  println(df.rdd.partitions.size)
  df.createOrReplaceTempView("t_score")
  import spark.sql
  sql("select * from t_score where score=98").show()
}

2.指定數(shù)據(jù)庫字段的范圍

/**
  * 方式二:指定數(shù)據(jù)庫字段的范圍
  * 通過lowerBound和upperBound 指定分區(qū)的范圍
  * 通過columnName 指定分區(qū)的列(只支持整形)
  * 通過numPartitions 指定分區(qū)數(shù)量 (不宜過大)
  *
  * @param spark
  */
def method2(spark: SparkSession): Unit = {
  val lowerBound = 1
  val upperBound = 100000
  val numPartitions = 5
  val url = "jdbc:mysql://127.0.0.1:3306/test?user=root&password=root"
  val prop = new Properties()
  val df = spark.read.jdbc(url, "t_score", "id", lowerBound, upperBound, numPartitions, prop)

  println(df.count())
  println(df.rdd.partitions.size)
}

3.根據(jù)任意字段進行分區(qū)

/**
    * 方式三:根據(jù)任意字段進行分區(qū)
    * 通過predicates將數(shù)據(jù)根據(jù)score分為2個區(qū)
    *
    * @param spark
    */
def method3(spark: SparkSession): Unit = {
  val predicates = Array[String]("score <= 97", "score > 97 and score <= 100")
  val url = "jdbc:mysql://127.0.0.1:3306/test?user=root&password=root"
  val prop = new Properties()
  val df = spark.read.jdbc(url, "t_score", predicates, prop)

  println(df.count())
  println(df.rdd.partitions.size)
  import spark.sql
  df.createOrReplaceTempView("t_score")
  sql("select * from t_score").show()
}

4.通過load獲取,和方式二類似

/**
  * 方式四:通過load獲取刻肄,和方式二類似
  * @param spark
  */
def method4(spark: SparkSession): Unit = {
  val url = "jdbc:mysql://127.0.0.1:3306/test?user=root&password=root"
  val df = spark.read.format("jdbc").options(Map("url" -> url, "dbtable" -> "t_score")).load()

  println(df.count())
  println(df.rdd.partitions.size)
  import spark.sql
  df.createOrReplaceTempView("t_score")
  sql("select * from t_score").show()
}

5.加載條件查詢后的數(shù)據(jù)

/**
  * 方式五:加載條件查詢后的數(shù)據(jù)
  * @param spark
  */
def method5(spark: SparkSession): Unit = {
  val url = "jdbc:mysql://127.0.0.1:3306/test?user=root&password=root"
  val df = spark.read.format("jdbc").options(Map("url" -> url, "dbtable" -> "(SELECT s.*,u.name FROM t_score s JOIN t_user u ON s.id=u.score_id) t_score")).load()

  println(df.count())
  println(df.rdd.partitions.size)
  import spark.sql
  df.createOrReplaceTempView("t_score")
  sql("select * from t_score").show()

  Thread.sleep(60 * 1000)
}

參考:
# Spark讀取數(shù)據(jù)庫(Mysql)的四種方式講解

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末瓤球,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子敏弃,更是在濱河造成了極大的恐慌卦羡,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,816評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件麦到,死亡現(xiàn)場離奇詭異绿饵,居然都是意外死亡,警方通過查閱死者的電腦和手機瓶颠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評論 3 385
  • 文/潘曉璐 我一進店門拟赊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人粹淋,你說我怎么就攤上這事吸祟。” “怎么了廓啊?”我有些...
    開封第一講書人閱讀 158,300評論 0 348
  • 文/不壞的土叔 我叫張陵欢搜,是天一觀的道長。 經(jīng)常有香客問我谴轮,道長炒瘟,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,780評論 1 285
  • 正文 為了忘掉前任第步,我火速辦了婚禮疮装,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘粘都。我一直安慰自己廓推,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,890評論 6 385
  • 文/花漫 我一把揭開白布翩隧。 她就那樣靜靜地躺著樊展,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上专缠,一...
    開封第一講書人閱讀 50,084評論 1 291
  • 那天雷酪,我揣著相機與錄音,去河邊找鬼涝婉。 笑死哥力,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的墩弯。 我是一名探鬼主播吩跋,決...
    沈念sama閱讀 39,151評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼渔工!你這毒婦竟也來了锌钮?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,912評論 0 268
  • 序言:老撾萬榮一對情侶失蹤涨缚,失蹤者是張志新(化名)和其女友劉穎轧粟,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體脓魏,經(jīng)...
    沈念sama閱讀 44,355評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡兰吟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,666評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了茂翔。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片混蔼。...
    茶點故事閱讀 38,809評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖珊燎,靈堂內(nèi)的尸體忽然破棺而出惭嚣,到底是詐尸還是另有隱情,我是刑警寧澤悔政,帶...
    沈念sama閱讀 34,504評論 4 334
  • 正文 年R本政府宣布晚吞,位于F島的核電站,受9級特大地震影響谋国,放射性物質(zhì)發(fā)生泄漏槽地。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,150評論 3 317
  • 文/蒙蒙 一芦瘾、第九天 我趴在偏房一處隱蔽的房頂上張望捌蚊。 院中可真熱鬧,春花似錦近弟、人聲如沸缅糟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,882評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽窗宦。三九已至赦颇,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間赴涵,已是汗流浹背沐扳。 一陣腳步聲響...
    開封第一講書人閱讀 32,121評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留句占,地道東北人。 一個月前我還...
    沈念sama閱讀 46,628評論 2 362
  • 正文 我出身青樓躯嫉,卻偏偏與公主長得像纱烘,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子祈餐,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,724評論 2 351

推薦閱讀更多精彩內(nèi)容