一種大批量數(shù)據(jù)(文件解析)的處理方案

一、場(chǎng)景


下班的路上辩涝,一直在考慮如何處理大批量的文件解析葱峡。場(chǎng)景如下:

系統(tǒng)A中記錄了客戶(hù)的賬戶(hù)余額,系統(tǒng)B每天會(huì)定時(shí)將客戶(hù)的交易流水放入文件服務(wù)器饰及。然后系統(tǒng)A通過(guò)Job解析交易文件蔗坯,更新賬戶(hù)余額。

場(chǎng)景很簡(jiǎn)單燎含,但當(dāng)數(shù)據(jù)量比較大的時(shí)候宾濒,比如客戶(hù)數(shù)量達(dá)到5000萬(wàn)至1億左右,如何優(yōu)化業(yè)務(wù)邏輯瘫镇,保證數(shù)據(jù)的正確性鼎兽?


二、問(wèn)題與解決方案


對(duì)于上述場(chǎng)景铣除,我的第一個(gè)想法就是采取“生產(chǎn)者-消費(fèi)者”的模式,保證程序能夠橫向擴(kuò)展鹦付。最常用的就是采用MQ尚粘。


圖1.單一通道的生產(chǎn)消費(fèi)關(guān)系

當(dāng)業(yè)務(wù)復(fù)雜的時(shí)候,可以建立多個(gè)通道敲长,不同的業(yè)務(wù)用不同的通道來(lái)負(fù)責(zé)郎嫁。


圖2.多個(gè)通道的生產(chǎn)消費(fèi)關(guān)系


接下來(lái),就是具體業(yè)務(wù)邏輯中需要考慮到的一些問(wèn)題祈噪。

1.要不要采用線(xiàn)程池泽铛?

采用多線(xiàn)程是一定的,但為什么還會(huì)有這樣的問(wèn)題呢辑鲤?因?yàn)槲疫€有另外一個(gè)比較好的想法盔腔,可以采用直接初始化幾(30)個(gè)線(xiàn)程待命的方式來(lái)取代線(xiàn)程池,個(gè)人覺(jué)得這樣會(huì)比傳統(tǒng)的線(xiàn)程池效率高一點(diǎn)。如果有人覺(jué)得這樣的想法不是很好弛随,可以忽略這一點(diǎn)瓢喉,直接用線(xiàn)程池。

2.如何保證數(shù)據(jù)的一致性舀透?

從任務(wù)表中撈出需要解析的文件栓票,需要考慮多任務(wù)并發(fā)的情形。這時(shí)愕够,需要對(duì)每一個(gè)正在處理的文件加分布式鎖走贪,保證當(dāng)前文件只有一個(gè)線(xiàn)程在處理。

3.當(dāng)一個(gè)文件處理中遇到了錯(cuò)誤惑芭,應(yīng)該采用什么機(jī)制進(jìn)行容錯(cuò)坠狡?

如果是整個(gè)文件都無(wú)法解析,那么直接反饋到任務(wù)執(zhí)行報(bào)告中去强衡。同時(shí)生成一個(gè)新的調(diào)度擦秽,等下一個(gè)日切時(shí)間。

如果是文件中某一條記錄無(wú)法解析漩勤,那么需要對(duì)該行記錄標(biāo)記一下感挥,反饋到任務(wù)執(zhí)行報(bào)告。同時(shí)繼續(xù)執(zhí)行下一條越败。

4.文件解析的效率問(wèn)題

同一個(gè)賬戶(hù)的流水触幼,可能分散于多個(gè)不同的文件中,為了提高效率究飞,我們考慮需要建立一張臨時(shí)表置谦,對(duì)賬戶(hù)流水記錄進(jìn)行軋差,最后再更新賬戶(hù)余額亿傅。

初步想法是媒峡,將解析記錄都插入臨時(shí)表中,當(dāng)解析任務(wù)全部完成后葵擎,統(tǒng)一觸發(fā)軋差更新的調(diào)度(按照賬戶(hù)進(jìn)行軋差)谅阿。

所以這里需要2個(gè)子調(diào)度 :

? ? a.解析文件,批量入庫(kù)

? ? b.軋差計(jì)算酬滤,更新賬戶(hù)余額

關(guān)于軋差計(jì)算签餐,由于記錄比較多(2千萬(wàn)用戶(hù),每人5條流水盯串,就有1億條記錄了)氯檐,這樣查詢(xún)效率會(huì)比較低,如果有必要体捏,可以考慮分表冠摄。

5.如果說(shuō)文件中并不是交易流水糯崎,而是賬戶(hù)余額,這時(shí)改如何處理耗拓?

同一個(gè)賬戶(hù)的余額可能存在于多個(gè)文件拇颅,如果沒(méi)有按照時(shí)間排序,會(huì)導(dǎo)致更新余額時(shí)的數(shù)據(jù)錯(cuò)誤乔询。這樣的處理不需要考慮軋差的問(wèn)題樟插,只需要將所有的記錄進(jìn)行排序,更新最后一個(gè)余額就可以了竿刁。


三黄锤、結(jié)論


最終的流程圖如下

圖三.結(jié)論
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市食拜,隨后出現(xiàn)的幾起案子鸵熟,更是在濱河造成了極大的恐慌,老刑警劉巖负甸,帶你破解...
    沈念sama閱讀 223,207評(píng)論 6 521
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件流强,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡呻待,警方通過(guò)查閱死者的電腦和手機(jī)打月,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,455評(píng)論 3 400
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蚕捉,“玉大人奏篙,你說(shuō)我怎么就攤上這事∑妊停” “怎么了秘通?”我有些...
    開(kāi)封第一講書(shū)人閱讀 170,031評(píng)論 0 366
  • 文/不壞的土叔 我叫張陵,是天一觀(guān)的道長(zhǎng)敛熬。 經(jīng)常有香客問(wèn)我肺稀,道長(zhǎng),這世上最難降的妖魔是什么应民? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,334評(píng)論 1 300
  • 正文 為了忘掉前任盹靴,我火速辦了婚禮,結(jié)果婚禮上瑞妇,老公的妹妹穿的比我還像新娘。我一直安慰自己梭冠,他們只是感情好辕狰,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,322評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著控漠,像睡著了一般蔓倍。 火紅的嫁衣襯著肌膚如雪悬钳。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,895評(píng)論 1 314
  • 那天偶翅,我揣著相機(jī)與錄音默勾,去河邊找鬼。 笑死聚谁,一個(gè)胖子當(dāng)著我的面吹牛母剥,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播形导,決...
    沈念sama閱讀 41,300評(píng)論 3 424
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼环疼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了朵耕?” 一聲冷哼從身側(cè)響起炫隶,我...
    開(kāi)封第一講書(shū)人閱讀 40,264評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎阎曹,沒(méi)想到半個(gè)月后伪阶,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,784評(píng)論 1 321
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡处嫌,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,870評(píng)論 3 343
  • 正文 我和宋清朗相戀三年栅贴,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锰霜。...
    茶點(diǎn)故事閱讀 40,989評(píng)論 1 354
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡筹误,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出癣缅,到底是詐尸還是另有隱情厨剪,我是刑警寧澤,帶...
    沈念sama閱讀 36,649評(píng)論 5 351
  • 正文 年R本政府宣布友存,位于F島的核電站祷膳,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏屡立。R本人自食惡果不足惜直晨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,331評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望膨俐。 院中可真熱鬧勇皇,春花似錦、人聲如沸焚刺。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,814評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)乳愉。三九已至兄淫,卻和暖如春屯远,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背捕虽。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,940評(píng)論 1 275
  • 我被黑心中介騙來(lái)泰國(guó)打工慨丐, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人泄私。 一個(gè)月前我還...
    沈念sama閱讀 49,452評(píng)論 3 379
  • 正文 我出身青樓房揭,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親挖滤。 傳聞我的和親對(duì)象是個(gè)殘疾皇子崩溪,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,995評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容