kafka高吞吐量的原因

前言:? Kafka雖然是基于磁盤做的數(shù)據(jù)存儲策精,但卻具有高性能舰始、高吞吐、低延時的特點咽袜,其吞吐量動輒幾萬丸卷、幾十上百萬⊙玻總結(jié)起來大致就5個原因谜嫉,順序讀寫、零拷貝凹联、分區(qū)沐兰、批量發(fā)送、數(shù)據(jù)壓縮蔽挠。

1住闯、順序讀寫

????眾所周知Kafka是將消息記錄持久化到本地磁盤中的,一般人會認為磁盤讀寫性能差澳淑,可能會對Kafka性能如何保證提出質(zhì)疑比原。實際上不管是內(nèi)存還是磁盤,快或慢關(guān)鍵在于尋址的方式杠巡,磁盤分為順序讀寫與隨機讀寫量窘,內(nèi)存也一樣分為順序讀寫與隨機讀寫∏庥担基于磁盤的隨機讀寫確實很慢蚌铜,但磁盤的順序讀寫性能卻很高,一般而言要高出磁盤隨機讀寫三個數(shù)量級嫩海,一些情況下磁盤順序讀寫性能甚至要高于內(nèi)存隨機讀寫冬殃。

? ??Kafka的message是不斷追加到本地磁盤文件末尾的,而不是隨機的寫入出革,這使得Kafka寫入吞吐量得到了顯著提升造壮。?


kafka添加message

? ??這種方法有一個缺陷—— 沒有辦法刪除數(shù)據(jù) ,所以Kafka是不會刪除數(shù)據(jù)的骂束,它會把所有的數(shù)據(jù)都保留下來耳璧,每個消費者(Consumer)對每個Topic都有一個offset用來表示 讀取到了第幾條數(shù)據(jù) 。


2展箱、零拷貝

????linux操作系統(tǒng) “零拷貝” 機制使用了sendfile方法旨枯, 允許操作系統(tǒng)將數(shù)據(jù)從Page Cache 直接發(fā)送到網(wǎng)絡(luò),只需要最后一步的copy操作將數(shù)據(jù)復(fù)制到 NIC 緩沖區(qū)混驰, 這樣避免重新復(fù)制數(shù)據(jù) 攀隔。示意圖如下:


零拷貝

? ??通過這種 “零拷貝” 的機制皂贩,Page Cache 結(jié)合 sendfile 方法,Kafka消費端的性能也大幅提升昆汹。這也是為什么有時候消費端在不斷消費數(shù)據(jù)時明刷,我們并沒有看到磁盤io比較高,此刻正是操作系統(tǒng)緩存在提供數(shù)據(jù)满粗。


3辈末、分區(qū)

????Kafka的message是按topic分類存儲的,topic中的數(shù)據(jù)又是按照一個一個的partition即分區(qū)存儲到不同broker節(jié)點映皆。每個partition對應(yīng)了操作系統(tǒng)上的一個文件夾挤聘,partition實際上又是按照segment分段存儲的。這也非常符合分布式系統(tǒng)分區(qū)分桶的設(shè)計思想捅彻。

? ? 通過這種分區(qū)分段的設(shè)計组去,Kafka的message消息實際上是分布式存儲在一個一個小的segment中的,每次文件操作也是直接操作的segment步淹。為了進一步的查詢優(yōu)化从隆,Kafka又默認為分段后的數(shù)據(jù)文件建立了索引文件,就是文件系統(tǒng)上的.index文件贤旷。這種分區(qū)分段+索引的設(shè)計广料,不僅提升了數(shù)據(jù)讀取的效率,同時也提高了數(shù)據(jù)操作的并行度幼驶。


4、批量讀寫

????Kafka數(shù)據(jù)讀寫也是批量的而不是單條的韧衣。

? ? 除了利用底層的技術(shù)外盅藻,Kafka還在應(yīng)用程序?qū)用嫣峁┝艘恍┦侄蝸硖嵘阅堋W蠲黠@的就是使用批次畅铭。在向Kafka寫入數(shù)據(jù)時氏淑,可以啟用批次寫入,這樣可以避免在網(wǎng)絡(luò)上頻繁傳輸單個消息帶來的延遲和帶寬開銷硕噩。假設(shè)網(wǎng)絡(luò)帶寬為10MB/S假残,一次性傳輸10MB的消息比傳輸1KB的消息10000萬次顯然要快得多。


5炉擅、批量壓縮

? ???在很多情況下辉懒,系統(tǒng)的瓶頸不是CPU或磁盤,而是網(wǎng)絡(luò)IO谍失,對于需要在廣域網(wǎng)上的數(shù)據(jù)中心之間發(fā)送消息的數(shù)據(jù)流水線尤其如此眶俩。進行數(shù)據(jù)壓縮會消耗少量的CPU資源,不過對于kafka而言,網(wǎng)絡(luò)IO更應(yīng)該需要考慮。

? ? 1)如果每個消息都壓縮快鱼,但是壓縮率相對很低颠印,所以Kafka使用了批量壓縮纲岭,即將多個消息一起壓縮而不是單個消息壓縮

? ? 2)Kafka允許使用遞歸的消息集合,批量的消息可以通過壓縮的形式傳輸并且在日志中也可以保持壓縮格式线罕,直到被消費者解壓縮

? ? 3)Kafka支持多種壓縮協(xié)議止潮,包括Gzip和Snappy壓縮協(xié)議


總結(jié):Kafka速度的秘訣在于,它把所有的消息都變成一個批量的文件钞楼,并且進行合理的批量壓縮喇闸,減少網(wǎng)絡(luò)IO損耗,通過mmap提高I/O速度窿凤,寫入數(shù)據(jù)的時候由于單個Partion是末尾添加所以速度最優(yōu)仅偎;讀取數(shù)據(jù)的時候配合sendfile直接暴力輸出。


參考:https://blog.csdn.net/kzadmxz/article/details/101576401

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末雳殊,一起剝皮案震驚了整個濱河市橘沥,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌夯秃,老刑警劉巖座咆,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異仓洼,居然都是意外死亡介陶,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門色建,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哺呜,“玉大人,你說我怎么就攤上這事箕戳∧巢校” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵陵吸,是天一觀的道長玻墅。 經(jīng)常有香客問我,道長壮虫,這世上最難降的妖魔是什么澳厢? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮囚似,結(jié)果婚禮上剩拢,老公的妹妹穿的比我還像新娘。我一直安慰自己谆构,他們只是感情好裸扶,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著搬素,像睡著了一般呵晨。 火紅的嫁衣襯著肌膚如雪魏保。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天摸屠,我揣著相機與錄音谓罗,去河邊找鬼。 笑死季二,一個胖子當著我的面吹牛檩咱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播胯舷,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼刻蚯,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了桑嘶?” 一聲冷哼從身側(cè)響起炊汹,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎逃顶,沒想到半個月后讨便,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡以政,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年霸褒,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盈蛮。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡废菱,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出抖誉,到底是詐尸還是另有隱情昙啄,我是刑警寧澤,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布寸五,位于F島的核電站,受9級特大地震影響耿币,放射性物質(zhì)發(fā)生泄漏梳杏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一淹接、第九天 我趴在偏房一處隱蔽的房頂上張望十性。 院中可真熱鬧,春花似錦塑悼、人聲如沸劲适。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽霞势。三九已至烹植,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間愕贡,已是汗流浹背草雕。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留固以,地道東北人墩虹。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像憨琳,于是被迫代替她去往敵國和親诫钓。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360