Flume-非關系型數據的收集

背景

在現實世界中,非關系型的數據遠遠多于關系型數據

Flume的基本思想和特點

  • 采用插拔式軟件架構森瘪,所有組件都是可插拔的
  • 良好的可擴展性
  • 高度定制化
  • 聲明式動態(tài)化配置
  • 語意路由
  • 良好的可靠性(支持事務)

以往版本

  • flume og 0.9之前的的版本德绿,已被棄用
  • flume ng 現在廣泛使用的
    這兩個版本是不兼容的

flume (ng版本)基本架構

agent
  • 一系列的數據流稱為agent
  • 從接受到下一個接受中間的數據流
  • 主要包括source channel sink
event
  • flume中的數據流傳遞的數據稱為event
  • event由頭部和字節(jié)數組組成
source
  • agent的內部成員
  • flume中接受event的組件
  • source的種類
    1、avro source (內置avro server)
    2鞍帝、thrift source (內置thrift server)
    3久又、exec source (執(zhí)行指定的shell)
    4幻工、spooling Directory source (檢測某個文件內的文件的變化)
    5励两、kafka source (從kafka中讀取數據)
    6、syslog source(接收tcp 和 udp 發(fā)過來的數據)
    7囊颅、http source (接收http協(xié)議發(fā)來的數據)
    8当悔、taildir source(檢測文件的變化 用的較多)
channel
  • channel是一個暫存區(qū),保存source寫入的event,直到被sink 發(fā)射出去
  • channel包含以下種類:
    1踢代、memory channel
    2盲憎、file channel
    3、jdbc channel
    4胳挎、kafka channel
sink
  • sink 負責從channel 中讀取數據饼疙,并發(fā)送給下一個agent的source,
  • sink的種類:
    1、hdfs sink
    2慕爬、hbase sink
    3窑眯、avro/thrift sink
    4屏积、morphlineSorlSink
    5、kafka sink
flume 的事務
  • flume使用事務的方式是保證event傳遞的可靠性
  • sink 必須在event被存入channl 后磅甩,或者已經傳遞給下一個agent后炊林,才從上個channel中吧數據刪除

flume的高級組件

interceptor
  • 類似于spring mvc 的攔截,來實現在event傳輸過程中的攔截
  • 攔截的數據可以保存在event的頭部
  • interceptor 分為:
    1卷要、timestamp interceptor
    2渣聚、host interceptor
    3、uuid interceptor
    4僧叉、regex filtering interceptor (正則過濾)
    5奕枝、regex extractor interceptor(正則取出)
channel selector
  • channel selector 允許flume source選擇一個或多個目標channel,并將當前的event寫入這些channel,flume提供兩種channel selector:
    1瓶堕、replicating channel selector
    2隘道、multiplexing channel selector
sink processor
  • flume允許將多個sink 組裝成一個邏輯實體(sink group)而sink processor則在sink group的基礎上提供負載均衡和容錯的功能
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市捞烟,隨后出現的幾起案子薄声,更是在濱河造成了極大的恐慌当船,老刑警劉巖题画,帶你破解...
    沈念sama閱讀 217,826評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異德频,居然都是意外死亡苍息,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 92,968評論 3 395
  • 文/潘曉璐 我一進店門壹置,熙熙樓的掌柜王于貴愁眉苦臉地迎上來竞思,“玉大人,你說我怎么就攤上這事钞护「桥纾” “怎么了?”我有些...
    開封第一講書人閱讀 164,234評論 0 354
  • 文/不壞的土叔 我叫張陵难咕,是天一觀的道長课梳。 經常有香客問我,道長余佃,這世上最難降的妖魔是什么暮刃? 我笑而不...
    開封第一講書人閱讀 58,562評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮爆土,結果婚禮上椭懊,老公的妹妹穿的比我還像新娘。我一直安慰自己步势,他們只是感情好氧猬,可當我...
    茶點故事閱讀 67,611評論 6 392
  • 文/花漫 我一把揭開白布背犯。 她就那樣靜靜地躺著,像睡著了一般盅抚。 火紅的嫁衣襯著肌膚如雪媳板。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,482評論 1 302
  • 那天泉哈,我揣著相機與錄音蛉幸,去河邊找鬼。 笑死丛晦,一個胖子當著我的面吹牛奕纫,可吹牛的內容都是我干的。 我是一名探鬼主播烫沙,決...
    沈念sama閱讀 40,271評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼匹层,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了锌蓄?” 一聲冷哼從身側響起升筏,我...
    開封第一講書人閱讀 39,166評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎瘸爽,沒想到半個月后您访,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 45,608評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡剪决,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,814評論 3 336
  • 正文 我和宋清朗相戀三年灵汪,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片柑潦。...
    茶點故事閱讀 39,926評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡享言,死狀恐怖,靈堂內的尸體忽然破棺而出渗鬼,到底是詐尸還是另有隱情览露,我是刑警寧澤,帶...
    沈念sama閱讀 35,644評論 5 346
  • 正文 年R本政府宣布譬胎,位于F島的核電站差牛,受9級特大地震影響,放射性物質發(fā)生泄漏银择。R本人自食惡果不足惜多糠,卻給世界環(huán)境...
    茶點故事閱讀 41,249評論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望浩考。 院中可真熱鬧夹孔,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至怜俐,卻和暖如春身堡,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背拍鲤。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評論 1 269
  • 我被黑心中介騙來泰國打工贴谎, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人季稳。 一個月前我還...
    沈念sama閱讀 48,063評論 3 370
  • 正文 我出身青樓擅这,卻偏偏與公主長得像,于是被迫代替她去往敵國和親景鼠。 傳聞我的和親對象是個殘疾皇子仲翎,可洞房花燭夜當晚...
    茶點故事閱讀 44,871評論 2 354

推薦閱讀更多精彩內容