Flume TaildirSource源碼淺析

背景

在日常工作中邑闺,可能會有這種需求,類似于監(jiān)控一個目錄下新文件的產(chǎn)生昼蛀,并且這些文件會實時的追加內(nèi)容宴猾,例如ngnix的切割日至,或者某些服務(wù)器上的仿真日志等叼旋。

實現(xiàn)

在之前公司工作中仇哆,有過類似需求,也自己實現(xiàn)過夫植,后來Flume 1.7正式發(fā)布了 TaildirSource讹剔。我們來看下Flume內(nèi)部是怎么實現(xiàn)這個功能的。

源碼

首先先思考一下大體的實現(xiàn)思路是怎樣的详民,最簡單的方法是記錄下該目錄下每個文件上一次的讀取位置延欠。在讀取之后更新最新的讀取位置。



在process方法中沈跨,


Paste_Image.png

通過對每個符合要求的文件進行處理由捎,其中的updateTailFiles方法是獲取當前的更新的inode 列表,具體的內(nèi)部實現(xiàn)是判斷文件最后的更新時間之類的一大坨饿凛,看看注釋就好了狞玛,

主要邏輯不難软驰, 但它是怎么容錯的呢,在Flume宕機重啟之后心肪,是如何知道上一次傳輸?shù)奈恢玫哪囟Э鳎@里,F(xiàn)lume將相應(yīng)的記錄位置保存在文件中硬鞍,來看源碼慧瘤。



其中的有兩個定時的單線程executor service,會定時保存當前的位置固该,重啟時會load這個文件锅减,這樣其實會有一個小問題,就是當channel已經(jīng)處理過event蹬音,然后在兩次executor service啟動期間上煤,系統(tǒng)宕機了,這樣再重啟之后呢著淆,會有這部分數(shù)據(jù)的重傳劫狠。也就是說這里保證的at least once,
還有一個可能出現(xiàn)不一致的點永部,existingInodes 是一個copyOnWriteList, 在executor service 運行過程中會有不一致的情況独泞。
如果要保證exactly once, 要怎么做呢。如果是比較簡單的實現(xiàn)方式的話苔埋,如果是我個人來做懦砂,會為每個event分配個遞增的id,通過在保存在channel端最新的處理的event的id來比較组橄,如果event的id比channel端的id舊荞膘,那就丟棄,否則就更新channel的id玉工。
可能是flume這樣的日志傳輸工具都不是為了金錢交易的場景設(shè)計的羽资,所以就沒有嚴格的執(zhí)行exactly once語義,個人猜測啊遵班。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末屠升,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子狭郑,更是在濱河造成了極大的恐慌腹暖,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件翰萨,死亡現(xiàn)場離奇詭異脏答,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門以蕴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來糙麦,“玉大人,你說我怎么就攤上這事丛肮。” “怎么了魄缚?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵宝与,是天一觀的道長。 經(jīng)常有香客問我冶匹,道長习劫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任嚼隘,我火速辦了婚禮诽里,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘飞蛹。我一直安慰自己谤狡,他們只是感情好,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布卧檐。 她就那樣靜靜地躺著墓懂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪霉囚。 梳的紋絲不亂的頭發(fā)上捕仔,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天,我揣著相機與錄音盈罐,去河邊找鬼榜跌。 笑死,一個胖子當著我的面吹牛盅粪,可吹牛的內(nèi)容都是我干的钓葫。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼湾揽,長吁一口氣:“原來是場噩夢啊……” “哼瓤逼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起库物,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤霸旗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后戚揭,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體诱告,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年民晒,在試婚紗的時候發(fā)現(xiàn)自己被綠了精居。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锄禽。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖靴姿,靈堂內(nèi)的尸體忽然破棺而出沃但,到底是詐尸還是另有隱情,我是刑警寧澤佛吓,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布宵晚,位于F島的核電站,受9級特大地震影響维雇,放射性物質(zhì)發(fā)生泄漏淤刃。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一吱型、第九天 我趴在偏房一處隱蔽的房頂上張望逸贾。 院中可真熱鬧,春花似錦津滞、人聲如沸铝侵。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽哟沫。三九已至,卻和暖如春锌介,著一層夾襖步出監(jiān)牢的瞬間嗜诀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工孔祸, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留隆敢,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓崔慧,卻偏偏與公主長得像拂蝎,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子惶室,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理温自,服務(wù)發(fā)現(xiàn),斷路器皇钞,智...
    卡卡羅2017閱讀 134,711評論 18 139
  • 博客原文 翻譯作品悼泌,水平有限,如有錯誤夹界,煩請留言指正馆里。原文請見 官網(wǎng)英文文檔 引言 概述 Apache Flume...
    rabbitGYK閱讀 11,485評論 13 34
  • ¥開啟¥ 【iAPP實現(xiàn)進入界面執(zhí)行逐一顯】 〖2017-08-25 15:22:14〗 《//首先開一個線程,因...
    小菜c閱讀 6,444評論 0 17
  • Flume架構(gòu)與實踐 Flume是一款在線數(shù)據(jù)采集的系統(tǒng),典型的應(yīng)用場景是作為數(shù)據(jù)的總線鸠踪,在線的進行日志的采集丙者、分...
    mike_zhangliang閱讀 2,103評論 0 2
  • 介紹 概述 Apache Flume是為有效收集聚合和移動大量來自不同源到中心數(shù)據(jù)存儲而設(shè)計的可分布,可靠的营密,可用...
    ximengchj閱讀 3,526評論 0 13