Apache NiFi學(xué)習(xí)筆記05-02

什么是NiFi

Put simply NiFi was built to automate the flow of data between systems. While the term dataflow is used in a variety of contexts, we use it here to mean the automated and managed flow of information between systems.

NiFi是一種數(shù)據(jù)流處理工具匣吊,可以將處在不同系統(tǒng)(數(shù)據(jù)庫)中的數(shù)據(jù)進行統(tǒng)一的ETL芽狗,并進行存儲。在不同的系統(tǒng)間進行數(shù)據(jù)的導(dǎo)入導(dǎo)出。NiFi具備圖形化的Web界面硼控,用戶能夠通過簡單的拖拽連線蜈块,將數(shù)據(jù)以流的形式在不同的系統(tǒng)中處理袖瞻。NiFi可以在集群上部署辙诞。

NiFi能解決什么問題

簡單的說,如果你有三個數(shù)據(jù)庫(數(shù)據(jù)倉庫)量淌,Mysql骗村,Hive,Hbase。存儲著你需要的某些有關(guān)聯(lián)的數(shù)據(jù)呀枢,你想要將三個數(shù)據(jù)庫中的數(shù)據(jù)抽取出來胚股,做某些處理后統(tǒng)一存儲在某個數(shù)據(jù)庫中。NiFi封裝了對各個數(shù)據(jù)庫的接口裙秋,在圖形化界面中連接各個Processor,能夠很輕松的實現(xiàn)這個需求琅拌。

NiFi的核心概念

NiFi是基于流的編程(Flow Basical Programming, FBP)的一種實現(xiàn)。下面簡要介紹下NiFi的一些基本概念以及與FBP術(shù)語的一些聯(lián)系摘刑。

NiFi Term FBP Term Description
FlowFile Information Packet 數(shù)據(jù)被NiFi抽取出來后是以FlowFile的形式進行操作的进宝,以字段的key/value鍵值對的形式進行存儲
FlowFile Processor Black Box 流文件處理器的對數(shù)據(jù)進行合并、路由枷恕、轉(zhuǎn)換和調(diào)制解調(diào)等處理
Connection Bounded Buffer 將Processor進行關(guān)聯(lián)党晋,以隊列的形式操作,并且能夠以不同的速率在不同的processes中交互
Flow Controller Scheduler Flow Controller維護著Processor對線程的管理和分配徐块,充當(dāng)不同Processor的協(xié)調(diào)者(broker)
Process Group subnet 一些列處理的集合未玻,可以通過合并多個component來創(chuàng)建一個新的components

NiFi的架構(gòu)

NiFi的架構(gòu)圖

NiFi是運行在JVM之上的。

Web Server

NiFi能開啟web服務(wù)胡控,用戶通過訪問該服務(wù)器獲取web圖形界面扳剿,來與NiFi進行交互。

Flow Controller

NiFi最主要的部分铜犬,主要在這部分進行編程

Extensions

擴展部分

FlowFile Repository

追蹤Flow File的狀態(tài)

Content Repository

FlowFile的內(nèi)容實際的活動位置

Provenance Repository

The Provenance Repository is where all provenance event data is stored. The repository construct is pluggable with the default implementation being to use one or more physical disk volumes. Within each location event data is indexed and searchable.

NiFi也可部署在集群上

每個NiFi節(jié)點都做著同樣的數(shù)據(jù)處理工作舞终,集群通過zookeeper來選舉一個Cluster Coordinator,集群中的每個Node通過心跳機制向Cluster Coordinator匯報狀態(tài)信息轻庆。此外癣猾,每個集群都由zookeeper選舉一個主節(jié)點敛劝。故障切換同樣由zookeeper控制。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末纷宇,一起剝皮案震驚了整個濱河市夸盟,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌像捶,老刑警劉巖上陕,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異拓春,居然都是意外死亡释簿,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進店門硼莽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來庶溶,“玉大人,你說我怎么就攤上這事懂鸵∑荩” “怎么了?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵匆光,是天一觀的道長套像。 經(jīng)常有香客問我,道長终息,這世上最難降的妖魔是什么夺巩? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮周崭,結(jié)果婚禮上劲够,老公的妹妹穿的比我還像新娘。我一直安慰自己休傍,他們只是感情好征绎,可當(dāng)我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著磨取,像睡著了一般人柿。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上忙厌,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天凫岖,我揣著相機與錄音,去河邊找鬼逢净。 笑死哥放,一個胖子當(dāng)著我的面吹牛歼指,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播甥雕,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼踩身,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了社露?” 一聲冷哼從身側(cè)響起挟阻,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎峭弟,沒想到半個月后附鸽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡瞒瘸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年坷备,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片情臭。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡省撑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出谎柄,到底是詐尸還是另有隱情丁侄,我是刑警寧澤,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布朝巫,位于F島的核電站鸿摇,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏劈猿。R本人自食惡果不足惜拙吉,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望揪荣。 院中可真熱鬧筷黔,春花似錦、人聲如沸仗颈。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽挨决。三九已至请祖,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間脖祈,已是汗流浹背肆捕。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留盖高,地道東北人慎陵。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓眼虱,卻偏偏與公主長得像,于是被迫代替她去往敵國和親席纽。 傳聞我的和親對象是個殘疾皇子捏悬,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容