Spark Dataframe 自增ID (Java版)

背景

用Spark作數(shù)據(jù)計算框架厦画,將計算結(jié)果寫入傳統(tǒng)關(guān)系數(shù)據(jù)庫疮茄,例如MySQL,供業(yè)務(wù)查詢根暑,這是工作中經(jīng)常使用的模式力试。

在寫入MySQL時,經(jīng)常要加個自增的ID字段排嫌。

第一種方案畸裳,可以手動創(chuàng)建數(shù)據(jù)表,定義自增ID字段躏率,Spark寫入時用追加模式躯畴,ID設(shè)為空即可民鼓。

第二種方案,Spark寫之前就生成好自增ID蓬抄,直接覆蓋寫入MySQL丰嘉。

實際中,我們使用更多的是覆蓋寫入(自動創(chuàng)建表)嚷缭,所以本文介紹一下方案二的實現(xiàn)饮亏。

實現(xiàn)

  1. Schema添加一列:ID
DataFrame df = ...
StructType schema = df.schema().add(DataTypes.createStructField("id", DataTypes.LongType, false));
  1. 使用RDD的zipWithIndex得到索引,作為ID值:
JavaRDD<Row> rdd = df
    .javaRDD() // 轉(zhuǎn)為JavaRDD
    .zipWithIndex() // 添加索引阅爽,結(jié)果為JavaPairRDD<Row, Long>路幸,即行數(shù)據(jù)和對應(yīng)的索引
    .map(new Function<Tuple2<Row, Long>, Row>() {
            @Override
            public Row call(Tuple2<Row, Long> v1) throws Exception {
                Object[] objects = new Object[v1._1.size() + 1];
                for (int i = 0; i < v1._1.size(); i++) {
                    objects[i] = v1._1.get(i);
                }
                objects[objects.length - 1] = v1._2;
                return RowFactory.create(objects);
            }
    }); // 把索引值作為ID字段值,構(gòu)造新的行數(shù)據(jù)
  1. 將RDD再轉(zhuǎn)回DataFrame
df = sqlContext.createDataFrame(rdd, schema);
  1. 使用Overwrite模式寫入MySQL
Properties props = new Properties();
props.setProperty("user", "user");
props.setProperty("password", "password");
props.setProperty("driver", "com.mysql.jdbc.Driver"));
df
    .write()
    .mode(SaveMode.Overwrite) // 覆蓋模式付翁,自動創(chuàng)建表
    .jdbc("jdbcUrl", "tableName", props);
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末简肴,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子百侧,更是在濱河造成了極大的恐慌砰识,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,817評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件佣渴,死亡現(xiàn)場離奇詭異辫狼,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)辛润,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評論 3 385
  • 文/潘曉璐 我一進(jìn)店門膨处,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人砂竖,你說我怎么就攤上這事真椿。” “怎么了乎澄?”我有些...
    開封第一講書人閱讀 157,354評論 0 348
  • 文/不壞的土叔 我叫張陵瀑粥,是天一觀的道長。 經(jīng)常有香客問我三圆,道長,這世上最難降的妖魔是什么避咆? 我笑而不...
    開封第一講書人閱讀 56,498評論 1 284
  • 正文 為了忘掉前任舟肉,我火速辦了婚禮,結(jié)果婚禮上查库,老公的妹妹穿的比我還像新娘路媚。我一直安慰自己,他們只是感情好樊销,可當(dāng)我...
    茶點故事閱讀 65,600評論 6 386
  • 文/花漫 我一把揭開白布整慎。 她就那樣靜靜地躺著脏款,像睡著了一般。 火紅的嫁衣襯著肌膚如雪裤园。 梳的紋絲不亂的頭發(fā)上撤师,一...
    開封第一講書人閱讀 49,829評論 1 290
  • 那天,我揣著相機(jī)與錄音拧揽,去河邊找鬼剃盾。 笑死,一個胖子當(dāng)著我的面吹牛淤袜,可吹牛的內(nèi)容都是我干的痒谴。 我是一名探鬼主播,決...
    沈念sama閱讀 38,979評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼铡羡,長吁一口氣:“原來是場噩夢啊……” “哼积蔚!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起烦周,我...
    開封第一講書人閱讀 37,722評論 0 266
  • 序言:老撾萬榮一對情侶失蹤尽爆,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后论矾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體教翩,經(jīng)...
    沈念sama閱讀 44,189評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,519評論 2 327
  • 正文 我和宋清朗相戀三年贪壳,在試婚紗的時候發(fā)現(xiàn)自己被綠了饱亿。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,654評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡闰靴,死狀恐怖彪笼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蚂且,我是刑警寧澤配猫,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站杏死,受9級特大地震影響泵肄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜淑翼,卻給世界環(huán)境...
    茶點故事閱讀 39,940評論 3 313
  • 文/蒙蒙 一腐巢、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧玄括,春花似錦冯丙、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽泞莉。三九已至,卻和暖如春船殉,著一層夾襖步出監(jiān)牢的瞬間鲫趁,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評論 1 266
  • 我被黑心中介騙來泰國打工捺弦, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留饮寞,地道東北人。 一個月前我還...
    沈念sama閱讀 46,382評論 2 360
  • 正文 我出身青樓列吼,卻偏偏與公主長得像幽崩,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子寞钥,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,543評論 2 349

推薦閱讀更多精彩內(nèi)容