nifi學(xué)習(xí)筆記--cluster

? ? ? ?nifi是一個(gè)Zero-Master的集群模式驱显,每一個(gè)node承擔(dān)著一樣的角色,但是處理數(shù)據(jù)的不同部分嫩与。有一個(gè)Cluster Coordinator的角色晓避,通過選舉產(chǎn)生。其他節(jié)點(diǎn)必須向Cluster Coordinator發(fā)送心跳乙帮,Cluster Coordinator來決定剔除節(jié)點(diǎn)或者加入節(jié)點(diǎn)杜漠。當(dāng)一個(gè)新節(jié)點(diǎn)要加入集群,那么它的flow配置文件的版本必須與Cluster Coordinator的節(jié)點(diǎn)的一樣察净,如果不一致驾茴,則不允許加入∏饪ǎ可以通過刪除新增加節(jié)點(diǎn)的配置文件(conf/flow.xml.gz)來加入集群锈至。

? ? ? ?當(dāng)數(shù)據(jù)量比較大的時(shí)候,單個(gè)nifi節(jié)點(diǎn)處理不過來译秦,就需要多個(gè)節(jié)點(diǎn)峡捡。但是多個(gè)節(jié)點(diǎn)管理起來非常麻煩,所以cluster是非常必要的筑悴。以下幾個(gè)概念比較重要:

Primary Node

每個(gè)cluster有一個(gè)Primary Node们拙,用來執(zhí)行"Isolated Processors"「罅撸可以利用zookeeper自動(dòng)選舉Primary Node砚婆,也可以在用戶界面的Cluster Management頁來直接決定誰是Primary Node。

Isolated Processors

在集群中只能單實(shí)例運(yùn)行(比如ListFTP突勇,如果在多個(gè)節(jié)點(diǎn)同時(shí)執(zhí)行装盯,那么獲取數(shù)據(jù)會重復(fù)),會在Primary Node上執(zhí)行甲馋。如果配置得當(dāng)埂奈,那么可以自動(dòng)負(fù)載均衡分發(fā)數(shù)據(jù)到其他節(jié)點(diǎn)。

Dealing with Disconnected Nodes

? ? ?當(dāng)一個(gè)節(jié)點(diǎn)因?yàn)榫W(wǎng)絡(luò)原因掉了以后摔刁,那么在它加入集群之前無法改變flow的配置挥转。如果非要更改海蔽,可以在用戶界面的Cluster Management頁手動(dòng)remove這個(gè)節(jié)點(diǎn)出集群共屈。

Flow Election

cluster啟動(dòng)的時(shí)候每一個(gè)node會提交自己的flow.xml.gz到集群中,然后每臺對和自己一樣的flow進(jìn)行投票党窜,如果投票時(shí)間(nifi.cluster.flow.election.max.wait.time)到了或者某一個(gè)flow.xml.gz已經(jīng)達(dá)到票數(shù)(nifi.cluster.flow.election.max.candidates)拗引,則選出一個(gè)正確的flow.xml.gz。不一致的node自動(dòng)掛掉幌衣,除非它自己沒有flow.xml.gz矾削。

CLuster分發(fā)數(shù)據(jù)

關(guān)于cluster分發(fā)數(shù)據(jù)壤玫,官方文檔說的有點(diǎn)兒不清楚,有一篇文章說的很清楚:How Do I Distribute Data Across an Apache NiFi Cluster

文中提到了三種方法:第一種是數(shù)據(jù)源自己push數(shù)據(jù)哼凯,就是需要在processor前邊加一個(gè)Load Banlacer欲间。


數(shù)據(jù)源pushData

第二種是數(shù)據(jù)源的數(shù)據(jù)依靠processor去拉取數(shù)據(jù),最典型的是GetKafka processor断部,由kafka自己的機(jī)制(使用同一個(gè)group.id)來保證數(shù)據(jù)的分發(fā)猎贴。

processor拉取數(shù)據(jù)


另外一種拉取數(shù)據(jù)的案例是一個(gè)在主節(jié)點(diǎn)上執(zhí)行的list操作,然后通過site-to-site協(xié)議把數(shù)據(jù)分發(fā)到各個(gè)節(jié)點(diǎn)蝴光,然后后端的processor拉取數(shù)據(jù)她渴。如圖所示,當(dāng)RPG生效的時(shí)候 蔑祟,Node1的rpg建立一個(gè)SiteToSiteClient趁耗,保存cluster的狀態(tài)信息(動(dòng)態(tài)跟新)。當(dāng)進(jìn)行數(shù)據(jù)發(fā)送時(shí)疆虚,根據(jù)負(fù)載狀態(tài)苛败,同node1或者node2的InputPort建立socket連接,然后把數(shù)據(jù)發(fā)出去径簿。


site-to-site分發(fā)數(shù)據(jù)案例

第三種就是單純的兩個(gè)NIFI實(shí)例之間的通過site-to-site協(xié)議交換數(shù)據(jù)來實(shí)現(xiàn)數(shù)據(jù)分發(fā)著拭。

NIFI site-to-site

? ? ? ?當(dāng)NIFI實(shí)例之間進(jìn)行數(shù)據(jù)交互的時(shí)候,有很多協(xié)議可以使用牍帚,但是最好的應(yīng)該是NiFi Site-to-Site 協(xié)議儡遮。Site-to-Site 使得NIFI和其他NIFI實(shí)例或者其他消費(fèi)者應(yīng)用之間的數(shù)據(jù)傳輸更加高效和安全。

使用Site-to-Site有以下幾個(gè)優(yōu)點(diǎn):

Easy to configure

? ? ?輸入遠(yuǎn)端NIFI實(shí)例的URL之后暗赶,有效的端口(在NIFI的root process group定義的port)會被發(fā)現(xiàn)并列到下拉列表里邊鄙币。

Secure

? ? ? Site-to-Site可以使用證書來加密數(shù)據(jù)或者提供認(rèn)證。每一個(gè)port可以授權(quán)給指定的用戶蹂随,只有授權(quán)過的用戶才能看到這些port十嘿。

Scalable

? ? ? Site-to-Site可以自動(dòng)發(fā)現(xiàn)遠(yuǎn)端cluster中的所有節(jié)點(diǎn)的狀態(tài),然后數(shù)據(jù)會發(fā)送給所有集群中的節(jié)點(diǎn)(不能指定發(fā)給某幾個(gè)節(jié)點(diǎn))岳锁。

Efficient

? ? ? 為了避免創(chuàng)建鏈接的開銷绩衷,Site-to-Site會批量發(fā)送數(shù)據(jù)。

Reliable

? ? ? 等數(shù)據(jù)傳輸完畢后激率,sender 和 receiver會自動(dòng)向?qū)Ψ桨l(fā)送Checksums咳燕,如果checksums不匹配,那么重新傳輸乒躺。

Automatically load balanced

? ? ?當(dāng)node下線招盲,或者node的負(fù)載出現(xiàn)波動(dòng),和這個(gè)節(jié)點(diǎn)有關(guān)的數(shù)據(jù)會自動(dòng)進(jìn)行調(diào)整嘉冒。

FlowFiles maintain attributes

? ? ? FlowFile的屬性會一起被傳輸曹货。

Adaptable

? ? ? 協(xié)議向下兼容咆繁,兩個(gè)不同版本的nifi也可以交互。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末顶籽,一起剝皮案震驚了整個(gè)濱河市玩般,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌礼饱,老刑警劉巖壤短,帶你破解...
    沈念sama閱讀 212,542評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異慨仿,居然都是意外死亡久脯,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評論 3 385
  • 文/潘曉璐 我一進(jìn)店門镰吆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來帘撰,“玉大人,你說我怎么就攤上這事万皿〈菡遥” “怎么了?”我有些...
    開封第一講書人閱讀 158,021評論 0 348
  • 文/不壞的土叔 我叫張陵牢硅,是天一觀的道長蹬耘。 經(jīng)常有香客問我,道長减余,這世上最難降的妖魔是什么综苔? 我笑而不...
    開封第一講書人閱讀 56,682評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮位岔,結(jié)果婚禮上如筛,老公的妹妹穿的比我還像新娘。我一直安慰自己抒抬,他們只是感情好杨刨,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,792評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著擦剑,像睡著了一般妖胀。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上惠勒,一...
    開封第一講書人閱讀 49,985評論 1 291
  • 那天赚抡,我揣著相機(jī)與錄音,去河邊找鬼捉撮。 笑死怕品,一個(gè)胖子當(dāng)著我的面吹牛妇垢,可吹牛的內(nèi)容都是我干的巾遭。 我是一名探鬼主播肉康,決...
    沈念sama閱讀 39,107評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼灼舍!你這毒婦竟也來了吼和?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,845評論 0 268
  • 序言:老撾萬榮一對情侶失蹤骑素,失蹤者是張志新(化名)和其女友劉穎炫乓,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體献丑,經(jīng)...
    沈念sama閱讀 44,299評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡末捣,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,612評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了创橄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片箩做。...
    茶點(diǎn)故事閱讀 38,747評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖妥畏,靈堂內(nèi)的尸體忽然破棺而出邦邦,到底是詐尸還是另有隱情,我是刑警寧澤醉蚁,帶...
    沈念sama閱讀 34,441評論 4 333
  • 正文 年R本政府宣布燃辖,位于F島的核電站,受9級特大地震影響网棍,放射性物質(zhì)發(fā)生泄漏黔龟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,072評論 3 317
  • 文/蒙蒙 一滥玷、第九天 我趴在偏房一處隱蔽的房頂上張望捌锭。 院中可真熱鬧,春花似錦罗捎、人聲如沸观谦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽豁状。三九已至,卻和暖如春倒得,著一層夾襖步出監(jiān)牢的瞬間泻红,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評論 1 267
  • 我被黑心中介騙來泰國打工霞掺, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留谊路,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,545評論 2 362
  • 正文 我出身青樓菩彬,卻偏偏與公主長得像缠劝,于是被迫代替她去往敵國和親潮梯。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,658評論 2 350

推薦閱讀更多精彩內(nèi)容