編寫遷移數(shù)據(jù)程序的幾點(diǎn)反思

最近有個項(xiàng)目需要遷移舊系統(tǒng)的數(shù)據(jù)受神,原來以為確定好數(shù)據(jù)口徑剖膳,寫個程序跑一遍就完事了魏颓。程序邏輯也比較簡單,讀舊庫遍歷需要的數(shù)據(jù)吱晒,寫入新庫甸饱,加上并發(fā)執(zhí)行的邏輯。然而現(xiàn)實(shí)卻是問題多多仑濒,頻頻返工修改程序叹话。最終還被扣了分哎。反思了整個過程墩瞳,總結(jié)了以下幾點(diǎn)驼壶,避免以后犯同樣的問題。

1. 捋清數(shù)據(jù)遷移的口徑

此次項(xiàng)目我初次接手矗烛,業(yè)務(wù)邏輯不熟悉辅柴,由另外一個同事提供遷移數(shù)據(jù)的口徑,原始問題也源于此:同事告知的數(shù)據(jù)的口徑有誤瞭吃,遷移完后才發(fā)現(xiàn)缺少一部分?jǐn)?shù)據(jù)碌嘀。雖然很無奈但也沒辦法,接著修改下程序又再跑一遍歪架。這都算了股冗,最離譜是上線后,又被告知遷移的數(shù)據(jù)仍有缺漏和蚪,上司又告訴我以另一個口徑全量跑一遍止状,真是崩潰。

事后我琢磨著從自身角度如何能盡量避免這個事發(fā)生攒霹,可能能夠去做的就是在確定數(shù)據(jù)口徑時怯疤,應(yīng)該首先跟熟悉業(yè)務(wù)的同事確定好,隨后在小組群里@上司同步一下結(jié)論催束,進(jìn)行二次確認(rèn)集峦。這樣的話無論結(jié)果如何,此環(huán)節(jié)也已盡到了工具人的責(zé)任了。(┓( ′?` )┏ )

2. 注意讀取舊數(shù)據(jù)的性能

發(fā)現(xiàn)第一步的問題后塔淤,立即修改讀取數(shù)據(jù)的SQL語句摘昌,改著改著語句條件出現(xiàn)了慢查詢的問題,導(dǎo)致跑起來的時候影響到數(shù)據(jù)庫性能高蜂。

這個問題屬于低級錯誤聪黎,修改程序時應(yīng)該時刻注意著讀取語句的性能問題。出現(xiàn)問題备恤,不但影響原業(yè)務(wù)稿饰,也會導(dǎo)致遷移程序的效率低下。

3. 腳本執(zhí)行可斷點(diǎn)續(xù)跑

執(zhí)行程序過程中烘跺,由于各種原因(比如:并發(fā)太高湘纵,數(shù)據(jù)庫壓力過大)脂崔,導(dǎo)致程序被迫停止滤淳。但程序被迫停止以后,重新執(zhí)行又要從頭開始執(zhí)行砌左。

回想處理線上問題時脖咐,情緒比較緊張,總是很急于快點(diǎn)改好程序汇歹,就開始執(zhí)行屁擅,也由于最初設(shè)計(jì)腳本時,遷移數(shù)據(jù)口徑清晰产弹,并沒有考慮要反復(fù)去跑的可能派歌,所以設(shè)計(jì)上沒有加入可以斷點(diǎn)續(xù)跑。如果程序需要執(zhí)行數(shù)小時痰哨,這一點(diǎn)很關(guān)鍵胶果,多花一些時間去支持它,你就會在意外中斷發(fā)生時斤斧,保持從容早抠。

4. 腳本執(zhí)行的冪等性

由于遷移設(shè)計(jì)沒有考慮斷點(diǎn)續(xù)跑,程序被迫中斷以后撬讽,不得不重頭開始跑蕊连,所以程序上要支持重復(fù)執(zhí)行的冪等性∮沃纾基本做法就是寫入之前判斷是否已經(jīng)寫入過啦甘苍,這一點(diǎn)非常重要,萬一重復(fù)寫入了烘豌,很有可能引發(fā)其他的數(shù)據(jù)問題载庭。

5. 腳本執(zhí)行進(jìn)度可監(jiān)測

從發(fā)現(xiàn)問題到遷移程序執(zhí)行完畢,整個過程都要時不時回復(fù)業(yè)務(wù)方或者上司的靈魂拷問:「跑完了嗎?跑了多少昧捷?進(jìn)度如何闲昭?」。由于這次實(shí)現(xiàn)的程序只記錄了插入信息的日志靡挥,而且數(shù)據(jù)源是分表分庫多實(shí)例的架構(gòu)序矩,無法通過SQL語句來查詢對比分析出遷移進(jìn)度,每次的問都沒法準(zhǔn)確回復(fù)跋破,讓我越發(fā)焦躁簸淀。

因此在程序真正開始跑之前,需要考慮記錄哪些關(guān)鍵信息毒返,其實(shí)統(tǒng)計(jì)進(jìn)度的維度不一定要細(xì)到記錄的粒度租幕,也可按照表的粒度來統(tǒng)計(jì),粗略估算出整體進(jìn)度即可拧簸。

當(dāng)然劲绪,數(shù)據(jù)量如果不大,自己預(yù)計(jì)能在幾十分鐘能執(zhí)行完的可不用考慮這一點(diǎn)盆赤。但如果預(yù)計(jì)要跑數(shù)小時的話贾富,建議要考慮整體進(jìn)度的監(jiān)測,這樣不用每次被問到都只能支支吾吾地回復(fù):還在跑牺六,沒那么快颤枪。

6. 選擇合適的腳本語言

這一次用了Python實(shí)現(xiàn)遷移程序,整體數(shù)據(jù)量預(yù)估有接近10億淑际,在跑數(shù)據(jù)時也懷疑過是不是用go寫這個程序可以跑的快一點(diǎn)畏纲。但仔細(xì)分析瓶頸其實(shí)在于數(shù)據(jù)庫,不能把并發(fā)提到太高春缕,所以選擇合適的語言時盗胀,語言性能不是最重要的,更重要是:個人熟悉程度淡溯、友好的并發(fā)支持读整。

7. 總結(jié)

上面描述過程的問題,可能有些情緒咱娶,畢竟背鍋了米间,但自覺不是全部是個人的問題。也不想回頭調(diào)整文字了膘侮,就這樣吧屈糊。自己整體做的也不是很好,核心問題是對遷移數(shù)據(jù)的事情經(jīng)驗(yàn)不足琼了,遇事不夠冷靜逻锐。不怪別人夫晌,下次爭取做的更好吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末昧诱,一起剝皮案震驚了整個濱河市晓淀,隨后出現(xiàn)的幾起案子窃蹋,更是在濱河造成了極大的恐慌坚芜,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件寄摆,死亡現(xiàn)場離奇詭異蜈亩,居然都是意外死亡懦窘,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進(jìn)店門稚配,熙熙樓的掌柜王于貴愁眉苦臉地迎上來畅涂,“玉大人,你說我怎么就攤上這事道川∥缢ィ” “怎么了?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵愤惰,是天一觀的道長苇经。 經(jīng)常有香客問我,道長宦言,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任商模,我火速辦了婚禮奠旺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘施流。我一直安慰自己响疚,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布瞪醋。 她就那樣靜靜地躺著忿晕,像睡著了一般。 火紅的嫁衣襯著肌膚如雪银受。 梳的紋絲不亂的頭發(fā)上践盼,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天,我揣著相機(jī)與錄音宾巍,去河邊找鬼咕幻。 笑死,一個胖子當(dāng)著我的面吹牛顶霞,可吹牛的內(nèi)容都是我干的肄程。 我是一名探鬼主播,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼蓝厌!你這毒婦竟也來了玄叠?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤拓提,失蹤者是張志新(化名)和其女友劉穎诸典,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體崎苗,經(jīng)...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡狐粱,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了胆数。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片肌蜻。...
    茶點(diǎn)故事閱讀 40,001評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖必尼,靈堂內(nèi)的尸體忽然破棺而出蒋搜,到底是詐尸還是另有隱情,我是刑警寧澤判莉,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布豆挽,位于F島的核電站,受9級特大地震影響券盅,放射性物質(zhì)發(fā)生泄漏帮哈。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一锰镀、第九天 我趴在偏房一處隱蔽的房頂上張望娘侍。 院中可真熱鬧,春花似錦泳炉、人聲如沸憾筏。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽氧腰。三九已至,卻和暖如春刨肃,著一層夾襖步出監(jiān)牢的瞬間古拴,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工之景, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留斤富,地道東北人。 一個月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓锻狗,卻偏偏與公主長得像满力,于是被迫代替她去往敵國和親焕参。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,955評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 大數(shù)據(jù)集群遷移這件事,不知道有多少同學(xué)做過潦嘶。我說的不是把一個集群的數(shù)據(jù)備份到另一個集群上涩嚣。我指的是整個數(shù)據(jù)平臺與大...
    彩色螞蟻閱讀 1,949評論 0 5
  • feisky云計(jì)算、虛擬化與Linux技術(shù)筆記posts - 1014, comments - 298, trac...
    不排版閱讀 3,855評論 0 5
  • 在“數(shù)據(jù)庫優(yōu)化方案(二):寫入數(shù)據(jù)量增加時,如何實(shí)現(xiàn)分庫分表锰蓬?”中我曾經(jīng)提到幔睬,由于 MySQL 不像 MongoD...
    逗逼程序員閱讀 321評論 0 2
  • 今天學(xué)習(xí)課文《項(xiàng)鏈》,昨晚已經(jīng)布置預(yù)習(xí)芹扭,要求把課文讀熟麻顶。 今天揭題完畢,帶領(lǐng)孩子們齊讀“項(xiàng)鏈”兩個字舱卡。然后問孩子們...
    江南丹橘閱讀 834評論 0 0
  • 綜合教程 1.我從本篇文章中學(xué)到的一個重要概念: 別看一個成功的作家是多么的輝煌辅肾,其實(shí)他們經(jīng)歷過你所沒有過的困難與...
    應(yīng)數(shù)二班王秀磊閱讀 237評論 2 0