kafka原理

一蓝晒、概述

Kafka 是一個(gè)消息系統(tǒng)冈绊,原本開(kāi)發(fā)自 LinkedIn,用作 LinkedIn 的活動(dòng)流數(shù)據(jù)(Activity Stream)和運(yùn)營(yíng)數(shù)據(jù)處理管道(Pipeline)的基礎(chǔ)。現(xiàn)在它已被多家公司作為多種類(lèi)型的數(shù)據(jù)管道和消息系統(tǒng)使用灵临。

  • 活動(dòng)流數(shù)據(jù) 是幾乎所有站點(diǎn)在對(duì)其網(wǎng)站使用情況做報(bào)表時(shí)都要用到的數(shù)據(jù)中最常規(guī)的部分∨枯活動(dòng)數(shù)據(jù)包括頁(yè)面訪問(wèn)量(Page View)儒溉、被查看內(nèi)容方面的信息以及搜索情況等內(nèi)容。這種數(shù)據(jù)通常的處理方式是先把各種活動(dòng)以日志的形式寫(xiě)入某種文件发钝,然后周期性地對(duì)這些文件進(jìn)行統(tǒng)計(jì)分析顿涣。
  • 運(yùn)營(yíng)數(shù)據(jù) 指的是服務(wù)器的性能數(shù)據(jù)(CPU、IO 使用率酝豪、請(qǐng)求時(shí)間涛碑、服務(wù)日志等等數(shù)據(jù)),總的來(lái)說(shuō)孵淘,運(yùn)營(yíng)數(shù)據(jù)的統(tǒng)計(jì)方法種類(lèi)繁多蒲障。

Kafka通常用于應(yīng)用中的兩種廣播類(lèi)型:

  • 在系統(tǒng)和應(yīng)用間建立實(shí)時(shí)的數(shù)據(jù)管道,能夠可信賴(lài)的獲取數(shù)據(jù)。
  • 建立實(shí)時(shí)的流應(yīng)用晌涕,可以處理或者響應(yīng)數(shù)據(jù)流滋捶。

由此可見(jiàn),kafka給自身的定位并不只是一個(gè)消息系統(tǒng)余黎,而是通過(guò)發(fā)布訂閱消息這種機(jī)制實(shí)現(xiàn)了流平臺(tái)重窟。

作為一個(gè)分布式流平臺(tái),通過(guò)需要具備以下三個(gè)關(guān)鍵能力:

  1. 發(fā)布訂閱記錄流惧财,和消息隊(duì)列或者企業(yè)新消息系統(tǒng)類(lèi)似巡扇。
  2. 以可容錯(cuò)、持久的方式保存記錄流
  3. 當(dāng)記錄流產(chǎn)生時(shí)就進(jìn)行處理

Kafka和大多數(shù)消息系統(tǒng)一樣垮衷,搭建好kafka集群后厅翔,生產(chǎn)者向特定的topic生產(chǎn)消息,而消費(fèi)者通過(guò)訂閱topic搀突,能夠準(zhǔn)實(shí)時(shí)的拉取到該topic新消息刀闷,進(jìn)行消費(fèi)。如下圖:

screenshot

kafka主要有以下特性:

  • 消息持久化
  • 高吞吐量
  • 可擴(kuò)展性

尤其是高吞吐量仰迁,是他的最大賣(mài)點(diǎn)甸昏。kafka之所以能夠?qū)崿F(xiàn)高吞吐量,是基于他自身優(yōu)良的設(shè)計(jì)徐许,及集群的可擴(kuò)展性施蜜。

Kafka應(yīng)用場(chǎng)景

  • 消息系統(tǒng)
  • 日志系統(tǒng)
  • 流處理

二、基本術(shù)語(yǔ)

  1. Broker:Kafka 集群包含一個(gè)或多個(gè)服務(wù)器雌隅,這種服務(wù)器被稱(chēng)為 broker翻默。

  2. Topic:每條發(fā)布到 Kafka 集群的消息都有一個(gè)類(lèi)別(主題),這個(gè)類(lèi)別被稱(chēng)為 Topic恰起。(物理上不同 Topic 的消息分開(kāi)存儲(chǔ)修械,邏輯上一個(gè) Topic 的消息雖然保存于一個(gè)或多個(gè) broker 上,但用戶(hù)只需指定消息的 Topic 即可生產(chǎn)或消費(fèi)數(shù)據(jù)而不必關(guān)心數(shù)據(jù)存于何處)村缸。
    kafka中消息訂閱和發(fā)送都是基于某個(gè)topic祠肥。比如有個(gè)topic叫做NBA賽事信息,那么producer會(huì)把NBA賽事信息的消息發(fā)送到此topic下面梯皿。所有訂閱此topic的consumer將會(huì)拉取到此topic下的消息。Topic就像一個(gè)特定主題的收件箱县恕,producer往里丟东羹,consumer取走。

  3. Partition:Partition 是物理上的概念忠烛,每個(gè) Topic 包含一個(gè)或多個(gè) Partition属提。

  4. Producer:負(fù)責(zé)發(fā)布消息到 Kafka broker。

  5. Consumer:消息消費(fèi)者,向 Kafka broker 讀取消息的客戶(hù)端冤议。

  6. Consumer Group:每個(gè) Consumer 屬于一個(gè)特定的 Consumer Group(可為每個(gè) Consumer 指定 group name斟薇,若不指定 group name 則屬于默認(rèn)的 group)。

三恕酸、主題(Topic)和日志(Log)

一個(gè)Topic可以認(rèn)為是一類(lèi)消息堪滨,每個(gè)topic將被分成多個(gè)partition(區(qū)),每個(gè)partition在存儲(chǔ)層面是append log文件。任何發(fā)布到此partition的消息都會(huì)被直接追加到log文件的尾部蕊温,每條消息在文件中的位置稱(chēng)為offset(偏移量)袱箱,offset為一個(gè)long型數(shù)字,它用來(lái)唯一標(biāo)記某個(gè)分區(qū)內(nèi)的一條消息义矛。kafka并沒(méi)有提供其它額外的索引機(jī)制來(lái)存儲(chǔ)offset发笔,因?yàn)樵趉afka中幾乎不允許對(duì)消息進(jìn)行“隨機(jī)讀寫(xiě)”。

screenshot

四凉翻、Consumer與topic關(guān)系以及機(jī)制

Kafka和其它消息系統(tǒng)有一個(gè)不一樣的設(shè)計(jì)了讨,在consumer之上加了一層group。同一個(gè)group的consumer可以并行消費(fèi)同一個(gè)topic的消息制轰,但是同group的consumer量蕊,不會(huì)重復(fù)消費(fèi)。這就好比多個(gè)consumer組成了一個(gè)團(tuán)隊(duì)艇挨,一起干活残炮,當(dāng)然干活的速度就上來(lái)了。group中的consumer是如何配合協(xié)調(diào)的缩滨,其實(shí)和topic的分區(qū)相關(guān)聯(lián)势就,后面我們會(huì)詳細(xì)論述。

如果同一個(gè)topic需要被多次消費(fèi)脉漏,可以通過(guò)設(shè)立多個(gè)consumer group來(lái)實(shí)現(xiàn)苞冯。每個(gè)group分別消費(fèi),互不影響侧巨。

  • 如果所有的consumer都具有相同的group舅锄,這種情況和JMS queue模式很像,消息將會(huì)在consumers之間負(fù)載均衡司忱。
  • 如果所有的consumer都具有不同的group皇忿,那這就是"發(fā)布-訂閱",消息將會(huì)廣播給所有的消費(fèi)者坦仍。

在kafka中鳍烁,一個(gè)partition中的消息只會(huì)被group中的一個(gè)consumer消費(fèi)(同一時(shí)刻),每個(gè)group中consumer消息消費(fèi)互相獨(dú)立繁扎,我們可以認(rèn)為一個(gè)group是一個(gè)"訂閱"者幔荒。一個(gè)Topic中的每個(gè)partions只會(huì)被一個(gè)"訂閱者"中的一個(gè)consumer消費(fèi)糊闽,不過(guò)一個(gè)consumer可以同時(shí)消費(fèi)多個(gè)partitions中的消息。

kafka只能保證一個(gè)partition中的消息被某個(gè)consumer消費(fèi)時(shí)是順序的爹梁。事實(shí)上右犹,從Topic角度來(lái)說(shuō),,當(dāng)有多個(gè)partitions時(shí)姚垃,消息仍不是全局有序的念链。

通常情況下,一個(gè)group中會(huì)包含多個(gè)consumer莉炉,這樣不僅可以提高topic中消息的并發(fā)消費(fèi)能力钓账,而且還能提高"故障容錯(cuò)"性。如果group中的某個(gè)consumer失效絮宁,那么其消費(fèi)的partitions將會(huì)有其他consumer自動(dòng)接管梆暮。kafka的設(shè)計(jì)原理決定對(duì)于一個(gè)topic,同一個(gè)group中不能有多于partitions個(gè)數(shù)的consumer同時(shí)消費(fèi)绍昂,否則將意味著某些consumer將無(wú)法得到消息啦粹。


參考文章如下:
作者:稀有氣體
來(lái)源:CSDN
原文:https://blog.csdn.net/liyiming2017/article/details/82790040

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市窘游,隨后出現(xiàn)的幾起案子唠椭,更是在濱河造成了極大的恐慌,老刑警劉巖忍饰,帶你破解...
    沈念sama閱讀 211,290評(píng)論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件贪嫂,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡艾蓝,警方通過(guò)查閱死者的電腦和手機(jī)力崇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)赢织,“玉大人亮靴,你說(shuō)我怎么就攤上這事∮谥茫” “怎么了茧吊?”我有些...
    開(kāi)封第一講書(shū)人閱讀 156,872評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)八毯。 經(jīng)常有香客問(wèn)我搓侄,道長(zhǎng),這世上最難降的妖魔是什么宪彩? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,415評(píng)論 1 283
  • 正文 為了忘掉前任休讳,我火速辦了婚禮,結(jié)果婚禮上尿孔,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好活合,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,453評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布雏婶。 她就那樣靜靜地躺著,像睡著了一般白指。 火紅的嫁衣襯著肌膚如雪留晚。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,784評(píng)論 1 290
  • 那天告嘲,我揣著相機(jī)與錄音错维,去河邊找鬼。 笑死橄唬,一個(gè)胖子當(dāng)著我的面吹牛赋焕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播仰楚,決...
    沈念sama閱讀 38,927評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼隆判,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了僧界?” 一聲冷哼從身側(cè)響起侨嘀,我...
    開(kāi)封第一講書(shū)人閱讀 37,691評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎捂襟,沒(méi)想到半個(gè)月后咬腕,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,137評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡葬荷,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,472評(píng)論 2 326
  • 正文 我和宋清朗相戀三年涨共,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片闯狱。...
    茶點(diǎn)故事閱讀 38,622評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡煞赢,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出哄孤,到底是詐尸還是另有隱情照筑,我是刑警寧澤,帶...
    沈念sama閱讀 34,289評(píng)論 4 329
  • 正文 年R本政府宣布瘦陈,位于F島的核電站凝危,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏晨逝。R本人自食惡果不足惜蛾默,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,887評(píng)論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望捉貌。 院中可真熱鬧支鸡,春花似錦冬念、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,741評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至瀑构,卻和暖如春裆针,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背寺晌。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,977評(píng)論 1 265
  • 我被黑心中介騙來(lái)泰國(guó)打工世吨, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人呻征。 一個(gè)月前我還...
    沈念sama閱讀 46,316評(píng)論 2 360
  • 正文 我出身青樓耘婚,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親怕犁。 傳聞我的和親對(duì)象是個(gè)殘疾皇子边篮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,490評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • 姓名:周小蓬 16019110037 轉(zhuǎn)載自:http://blog.csdn.net/YChenFeng/art...
    aeytifiw閱讀 34,713評(píng)論 13 425
  • 本文轉(zhuǎn)載自http://dataunion.org/?p=9307 背景介紹Kafka簡(jiǎn)介Kafka是一種分布式的...
    Bottle丶Fish閱讀 5,465評(píng)論 0 34
  • 目標(biāo) 高吞吐量來(lái)支持高容量的事件流處理 支持從離線系統(tǒng)加載數(shù)據(jù) 低延遲的消息系統(tǒng) 持久化 依賴(lài)文件系統(tǒng),持久化到本...
    jiangmo閱讀 1,268評(píng)論 0 4
  • 背景介紹 Kafka簡(jiǎn)介 Kafka是一種分布式的奏甫,基于發(fā)布/訂閱的消息系統(tǒng)戈轿。主要設(shè)計(jì)目標(biāo)如下: 以時(shí)間復(fù)雜度為O...
    高廣超閱讀 12,826評(píng)論 8 167
  • 過(guò)往的歲月,不著痕跡的悄然去遠(yuǎn)阵子。再回首思杯,明滅在記憶中的,卻是大片大片的空白挠进。這種虛空無(wú)著的飄懸之感色乾,時(shí)常在氣定神閑...
    翻了車(chē)閱讀 499評(píng)論 31 2