消息中間件如何實(shí)現(xiàn)每秒幾十萬的高并發(fā)寫入？

接著另外一個(gè)就是kafka寫數(shù)據(jù)的時(shí)候据过，非常關(guān)鍵的一點(diǎn)，他是以磁盤順序?qū)懙姆绞絹韺懙亩士妗Ｒ簿褪钦f绳锅，僅僅將數(shù)據(jù)追加到文件的末尾，不是在文件的隨機(jī)位置來修改數(shù)據(jù)酝掩。

普通的機(jī)械磁盤如果你要是隨機(jī)寫的話鳞芙，確實(shí)性能極差，也就是隨便找到文件的某個(gè)位置來寫數(shù)據(jù)。

但是如果你是追加文件末尾按照順序的方式來寫數(shù)據(jù)的話原朝，那么這種磁盤順序?qū)懙男阅芑旧峡梢愿鷮憙?nèi)存的性能本身也是差不多的闯割。

所以大家就知道了，上面那個(gè)圖里竿拆，Kafka在寫數(shù)據(jù)的時(shí)候宙拉，一方面基于了os層面的page cache來寫數(shù)據(jù)，所以性能很高丙笋，本質(zhì)就是在寫內(nèi)存罷了谢澈。

另外一個(gè)，他是采用磁盤順序?qū)懙姆绞接澹约词箶?shù)據(jù)刷入磁盤的時(shí)候锥忿，性能也是極高的，也跟寫內(nèi)存是差不多的怠肋。

基于上面兩點(diǎn)敬鬓，kafka就實(shí)現(xiàn)了寫入數(shù)據(jù)的超高性能。

那么大家想想笙各，假如說kafka寫入一條數(shù)據(jù)要耗費(fèi)1毫秒的時(shí)間钉答，那么是不是每秒就是可以寫入1000條數(shù)據(jù)？

但是假如kafka的性能極高杈抢，寫入一條數(shù)據(jù)僅僅耗費(fèi)0.01毫秒呢数尿？那么每秒是不是就可以寫入10萬條數(shù)？

所以要保證每秒寫入幾萬甚至幾十萬條數(shù)據(jù)的核心點(diǎn)惶楼，就是盡最大可能提升每條數(shù)據(jù)寫入的性能右蹦，這樣就可以在單位時(shí)間內(nèi)寫入更多的數(shù)據(jù)量，提升吞吐量歼捐。

2何陆、零拷貝技術(shù)

說完了寫入這塊，再來談?wù)勏M(fèi)這塊豹储。

大家應(yīng)該都知道贷盲，從Kafka里我們經(jīng)常要消費(fèi)數(shù)據(jù)，那么消費(fèi)的時(shí)候?qū)嶋H上就是要從kafka的磁盤文件里讀取某條數(shù)據(jù)然后發(fā)送給下游的消費(fèi)者颂翼，如下圖所示晃洒。

那么這里如果頻繁的從磁盤讀數(shù)據(jù)然后發(fā)給消費(fèi)者，性能瓶頸在哪里呢朦乏？

假設(shè)要是kafka什么優(yōu)化都不做球及，就是很簡(jiǎn)單的從磁盤讀數(shù)據(jù)發(fā)送給下游的消費(fèi)者，那么大概過程如下所示：

先看看要讀的數(shù)據(jù)在不在os cache里呻疹，如果不在的話就從磁盤文件里讀取數(shù)據(jù)后放入os cache吃引。

接著從操作系統(tǒng)的os cache里拷貝數(shù)據(jù)到應(yīng)用程序進(jìn)程的緩存里，再從應(yīng)用程序進(jìn)程的緩存里拷貝數(shù)據(jù)到操作系統(tǒng)層面的Socket緩存里，最后從Socket緩存里提取數(shù)據(jù)后發(fā)送到網(wǎng)卡镊尺，最后發(fā)送出去給下游消費(fèi)朦佩。

整個(gè)過程，如下圖所示：

大家看上圖庐氮，很明顯可以看到有兩次沒必要的拷貝吧语稠！

一次是從操作系統(tǒng)的cache里拷貝到應(yīng)用進(jìn)程的緩存里，接著又從應(yīng)用程序緩存里拷貝回操作系統(tǒng)的Socket緩存里弄砍。

而且為了進(jìn)行這兩次拷貝仙畦，中間還發(fā)生了好幾次上下文切換，一會(huì)兒是應(yīng)用程序在執(zhí)行音婶，一會(huì)兒上下文切換到操作系統(tǒng)來執(zhí)行慨畸。

所以這種方式來讀取數(shù)據(jù)是比較消耗性能的。

Kafka為了解決這個(gè)問題衣式，在讀數(shù)據(jù)的時(shí)候是引入零拷貝技術(shù)寸士。

也就是說，直接讓操作系統(tǒng)的cache中的數(shù)據(jù)發(fā)送到網(wǎng)卡后傳輸給下游的消費(fèi)者碴卧，中間跳過了兩次拷貝數(shù)據(jù)的步驟弱卡，Socket緩存中僅僅會(huì)拷貝一個(gè)描述符過去，不會(huì)拷貝數(shù)據(jù)到Socket緩存螟深。

大家看下圖谐宙，體會(huì)一下這個(gè)精妙的過程：

通過零拷貝技術(shù)，就不需要把os cache里的數(shù)據(jù)拷貝到應(yīng)用緩存界弧，再從應(yīng)用緩存拷貝到Socket緩存了，兩次拷貝都省略了搭综，所以叫做零拷貝垢箕。

對(duì)Socket緩存僅僅就是拷貝數(shù)據(jù)的描述符過去，然后數(shù)據(jù)就直接從os cache中發(fā)送到網(wǎng)卡上去了兑巾，這個(gè)過程大大的提升了數(shù)據(jù)消費(fèi)時(shí)讀取文件數(shù)據(jù)的性能条获。

而且大家會(huì)注意到，在從磁盤讀數(shù)據(jù)的時(shí)候蒋歌，會(huì)先看看os cache內(nèi)存中是否有帅掘，如果有的話，其實(shí)讀數(shù)據(jù)都是直接讀內(nèi)存的堂油。

如果kafka集群經(jīng)過良好的調(diào)優(yōu)修档，大家會(huì)發(fā)現(xiàn)大量的數(shù)據(jù)都是直接寫入os cache中，然后讀數(shù)據(jù)的時(shí)候也是從os cache中讀府框。

相當(dāng)于是Kafka完全基于內(nèi)存提供數(shù)據(jù)的寫和讀了吱窝，所以這個(gè)整體性能會(huì)極其的高。

說個(gè)題外話，下回有機(jī)會(huì)給大家說一下Elasticsearch的架構(gòu)原理院峡，其實(shí)ES底層也是大量基于os cache實(shí)現(xiàn)了海量數(shù)據(jù)的高性能檢索的兴使，跟Kafka原理類似。

3照激、最后的總結(jié)

通過這篇文章對(duì)kafka底層的頁緩存技術(shù)的使用发魄，磁盤順序?qū)懙乃悸罚约傲憧截惣夹g(shù)的運(yùn)用俩垃，大家應(yīng)該就明白Kafka每臺(tái)機(jī)器在底層對(duì)數(shù)據(jù)進(jìn)行寫和讀的時(shí)候采取的是什么樣的思路励幼，為什么他的性能可以那么高，做到每秒幾十萬的吞吐量吆寨。

這種設(shè)計(jì)思想對(duì)我們平時(shí)自己設(shè)計(jì)中間件的架構(gòu)赏淌，或者是出去面試的時(shí)候，都有很大的幫助啄清。

今天和大家的分享就到這吧六水！有收獲，有感觸辣卒，需要java資料或者喜歡小編的可以關(guān)注小編掷贾，私信“架構(gòu)”就可以免費(fèi)獲得java架構(gòu)資料和最新面試資料！以下是部分資料截圖：

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末荣茫，一起剝皮案震驚了整個(gè)濱河市想帅，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌啡莉，老刑警劉巖港准，帶你破解...
沈念sama閱讀 218,036評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異咧欣，居然都是意外死亡浅缸，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,046評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門魄咕，熙熙樓的掌柜王于貴愁眉苦臉地迎上來衩椒，“玉大人，你說我怎么就攤上這事哮兰∶龋” “怎么了？”我有些...
開封第一講書人閱讀 164,411評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵喝滞，是天一觀的道長阁将。經(jīng)常有香客問我，道長囤躁，這世上最難降的妖魔是什么冀痕？我笑而不...
開封第一講書人閱讀 58,622評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任荔睹，我火速辦了婚禮，結(jié)果婚禮上言蛇，老公的妹妹穿的比我還像新娘僻他。我一直安慰自己，他們只是感情好腊尚，可當(dāng)我...
茶點(diǎn)故事閱讀 67,661評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布吨拗。她就那樣靜靜地躺著，像睡著了一般婿斥。火紅的嫁衣襯著肌膚如雪劝篷。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,521評(píng)論 1贊 304
城市分裂傳說
那天民宿，我揣著相機(jī)與錄音娇妓，去河邊找鬼。笑死活鹰，一個(gè)胖子當(dāng)著我的面吹牛哈恰，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播志群，決...
沈念sama閱讀 40,288評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼着绷，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了锌云？” 一聲冷哼從身側(cè)響起荠医，我...
開封第一講書人閱讀 39,200評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎桑涎，沒想到半個(gè)月后彬向，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,644評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡攻冷，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,837評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年幢泼，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片讲衫。...
茶點(diǎn)故事閱讀 39,953評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖孵班，靈堂內(nèi)的尸體忽然破棺而出涉兽，到底是詐尸還是另有隱情，我是刑警寧澤篙程，帶...
沈念sama閱讀 35,673評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布枷畏，位于F島的核電站，受9級(jí)特大地震影響虱饿，放射性物質(zhì)發(fā)生泄漏拥诡。R本人自食惡果不足惜触趴，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,281評(píng)論 3贊 329
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望渴肉。院中可真熱鬧冗懦，春花似錦、人聲如沸仇祭。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,889評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽乌奇。三九已至没讲，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間礁苗，已是汗流浹背爬凑。一陣腳步聲響...
開封第一講書人閱讀 33,011評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留试伙，地道東北人嘁信。一個(gè)月前我還...
沈念sama閱讀 48,119評(píng)論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像迁霎，于是被迫代替她去往敵國和親吱抚。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,901評(píng)論 2贊 355

消息中間件如何實(shí)現(xiàn)每秒幾十萬的高并發(fā)寫入蛇尚？

消息中間件如何實(shí)現(xiàn)每秒幾十萬的高并發(fā)寫入？

目錄

1顾画、頁緩存技術(shù) + 磁盤順序?qū)?/b>

2取劫、零拷貝技術(shù)

3、最后的總結(jié)

推薦閱讀更多精彩內(nèi)容