數(shù)據(jù)倉庫中如何做增量處理

  1. 為什么做增量
    數(shù)據(jù)量大,只需要增量最新被更改的數(shù)據(jù)盆昙。

  2. 如何做增量
    (1)insert into
    比如行為數(shù)據(jù)羽历,發(fā)生一條記錄就插入一條,數(shù)據(jù)不會被update淡喜。
    嚴(yán)格T+1秕磷,初始化時候限定created_at的時間。否則凌晨之后的數(shù)據(jù)會被重復(fù)插入炼团。
    (2)insert overwrite
    初始化的時候不限定時間澎嚣。
    增量的時候where to_date(a.updated_at) >= '%s'
    (選擇updated_at 做為增量字段,接近凌晨創(chuàng)建的數(shù)據(jù)2016-12-20 23:59:58的更新時間是T日瘟芝,此數(shù)據(jù)不會被增量進易桃,接近嚴(yán)格T+1 。以updated_at做為初始化時候時間的限制字段模狭,會將T日凌晨之后更新創(chuàng)建于幾日前的數(shù)據(jù)剔除颈抚,此為bug。)

增量的方法步驟如下:
1)建表
use default;
create table if not exists loan_f_order_info
(
ord_no string comment "訂單號",
uid string comment "用戶ID",
crt_tim timestamp comment "創(chuàng)建時間",
upd_tim timestamp comment "更新時間"
)
COMMENT "test表";

2)初始化
insert overwrite table loan_f_order_info
select order_no as ord_no,
uid as uid,
created_at as crt_tim,
updated_at as upd_tim
from ods_loan.ods_loan_dsloan_loan_stage_order

3)增量
a)insert into table default.loan_f_order_info
select order_no as ord_no,
uid as uid,
created_at as crt_tim,
updated_at as upd_tim
from ods_loan.ods_loan_dsloan_loan_stage_order
where to_date(updated_at) >= date_sub(from_unixtime(unix_timestamp(),'yyyy-MM-dd'),1)

b)insert overwrite table default.loan_f_order_info
select ord_no,
uid,
crt_tim,
upd_tim
from (
select *,
row_number() over(partition by uid, ord_no order by upd_tim desc) as row_num
from default.loan_f_order_info
) za
where row_num = '1'

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嚼鹉,一起剝皮案震驚了整個濱河市贩汉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌锚赤,老刑警劉巖匹舞,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異线脚,居然都是意外死亡赐稽,警方通過查閱死者的電腦和手機叫榕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來姊舵,“玉大人晰绎,你說我怎么就攤上這事±ǘ。” “怎么了荞下?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長史飞。 經(jīng)常有香客問我尖昏,道長,這世上最難降的妖魔是什么构资? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任抽诉,我火速辦了婚禮,結(jié)果婚禮上吐绵,老公的妹妹穿的比我還像新娘迹淌。我一直安慰自己,他們只是感情好拦赠,可當(dāng)我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布巍沙。 她就那樣靜靜地躺著,像睡著了一般荷鼠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上榔幸,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天允乐,我揣著相機與錄音,去河邊找鬼削咆。 笑死牍疏,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的拨齐。 我是一名探鬼主播鳞陨,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼瞻惋!你這毒婦竟也來了厦滤?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤歼狼,失蹤者是張志新(化名)和其女友劉穎掏导,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體羽峰,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡趟咆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年添瓷,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片值纱。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡鳞贷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出虐唠,到底是詐尸還是另有隱情搀愧,我是刑警寧澤,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布凿滤,位于F島的核電站妈橄,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏翁脆。R本人自食惡果不足惜眷蚓,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望反番。 院中可真熱鬧沙热,春花似錦、人聲如沸罢缸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽枫疆。三九已至爵川,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間息楔,已是汗流浹背寝贡。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留值依,地道東北人圃泡。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像愿险,于是被迫代替她去往敵國和親颇蜡。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容

  • PLEASE READ THE FOLLOWING APPLE DEVELOPER PROGRAM LICENSE...
    念念不忘的閱讀 13,478評論 5 6
  • 終于辆亏,為期幾天的閱卷工作結(jié)束了风秤,可以說是一種煎熬啊褒链!每天晚上睡不著唁情,白天又坐在電腦前一坐就是八九個小時,活生生的被...
    浩_fe46閱讀 419評論 0 0
  • 1.數(shù)據(jù)庫連接與數(shù)據(jù)讀取 連接數(shù)據(jù)庫甫匹,創(chuàng)建表等: 讀取zip數(shù)據(jù) 2.選擇與定位 3甸鸟、新增與變更 參考pandas...
    chrispher2012閱讀 496評論 0 1
  • 舉目望空孤雁單惦费,迎風(fēng)展翅向南方。 休歇枯樹心安在抢韭,不畏迢迢去故鄉(xiāng)薪贫。
    徐一村閱讀 305評論 0 6