Kafka壓縮

一、kafka壓縮幾點說明

首先說明一點kafka的壓縮和kafka的compact是不同的桐绒,compact就是相同的key只保留一條,是數(shù)據(jù)清理方式的一種和kafka的定期刪除策略是并列的蚤蔓;而kafka的壓縮是指數(shù)據(jù)不刪除只是采用壓縮算法進行壓縮搏讶。
kafka從0.7版本就開始支持壓縮功能:
1)kafka的發(fā)送端將消息按照批量(如果批量設(shè)置一條或者很小洼畅,可能有相反的效果)的方式進行壓縮吩案。
2)服務(wù)器端直接將壓縮消息保存(特別注意,如果kafka的版本不同帝簇,那么就存在broker需要先解壓縮再壓縮的問題务热,導(dǎo)致消耗資源過多)。
3)消費端自動解壓縮己儒,測試了下,發(fā)送端無論采用什么壓縮模式捆毫,消費端無論設(shè)置什么解壓模式闪湾,都可以自動完成解壓縮功能。
4)壓縮消息可以和非壓縮消息混存绩卤,也就是說如果你kafka里面先保存的是非壓縮消息途样,后面改成壓縮江醇,不用擔心,kafka消費端自動支持何暇。

二陶夜、kafka壓縮算法種類和性能區(qū)別

測試的kafka版本:kafka_2.12-1.1.1
測試的kafka客戶端版本:0.10.2.1
測試數(shù)據(jù)的條數(shù):20000
kafka支持三種壓縮算法,lz4裆站、snappy条辟、gzip,

壓縮算法 大小 壓縮比 生成耗時(毫秒) 消費耗時(毫秒)
None 8.2MB 0 4739 17464
gzip 1.9 MB 23% 4684 16257
snappy 3.2 MB 39% 3936 16726
lz4 2.9 MB 35% 3723 17229

測試遇到疑問宏胯,開始非壓縮算法發(fā)送2萬條大小為16MB羽嫡,后面再發(fā)送到gzip的時候大小竟然自動變成了8.2MB,采用的是delete模式肩袍,估計可能是日志之類的杭棵,snappy也有類似的現(xiàn)象開始是4.0MB,后面log大小縮小為3.2MB氛赐,有朋友知道麻煩告知魂爪。
我懷疑可能是版本原因?qū)е聰?shù)據(jù)重新被壓縮,1.1.1優(yōu)化的更好艰管,所以壓縮效果更好

通過上面數(shù)據(jù)來看滓侍,gzip的壓縮效果最好,但是生成耗時更長蛙婴,snappy和lz4的數(shù)據(jù)差不多粗井,更傾向于lz4,具huxi大神的書上所說kafka里面對snappy做了硬編碼街图,所以性能上最好的是lz4浇衬,推薦使用此壓縮算法。

壓縮率對比:


圖:http://i.stack.imgur.com/LPCSe.png

性能對比圖:


網(wǎng)上找來圖

壓縮設(shè)置

很簡單:

  /*compressType有四種取值:none lz4 gzip snappy*/
    props.put(ProducerConfig.COMPRESSION_TYPE_CONFIG, compressType);

其他說明

消費端無論設(shè)置什么壓縮模式餐济,都可以正確的解壓kafka的消息耘擂,也就是說消費端可以不設(shè)置解壓縮,
不過可能性能有所下降絮姆。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末醉冤,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子篙悯,更是在濱河造成了極大的恐慌蚁阳,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件鸽照,死亡現(xiàn)場離奇詭異螺捐,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門定血,熙熙樓的掌柜王于貴愁眉苦臉地迎上來赔癌,“玉大人,你說我怎么就攤上這事澜沟≡制保” “怎么了?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵茫虽,是天一觀的道長刊苍。 經(jīng)常有香客問我,道長席噩,這世上最難降的妖魔是什么班缰? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮悼枢,結(jié)果婚禮上埠忘,老公的妹妹穿的比我還像新娘。我一直安慰自己馒索,他們只是感情好莹妒,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著绰上,像睡著了一般旨怠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蜈块,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天鉴腻,我揣著相機與錄音,去河邊找鬼百揭。 笑死爽哎,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的器一。 我是一名探鬼主播课锌,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼祈秕!你這毒婦竟也來了渺贤?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤请毛,失蹤者是張志新(化名)和其女友劉穎志鞍,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體方仿,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡固棚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年街州,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玻孟。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖鳍征,靈堂內(nèi)的尸體忽然破棺而出黍翎,到底是詐尸還是另有隱情,我是刑警寧澤艳丛,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布匣掸,位于F島的核電站,受9級特大地震影響氮双,放射性物質(zhì)發(fā)生泄漏碰酝。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一戴差、第九天 我趴在偏房一處隱蔽的房頂上張望送爸。 院中可真熱鬧,春花似錦暖释、人聲如沸袭厂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽纹磺。三九已至,卻和暖如春亮曹,著一層夾襖步出監(jiān)牢的瞬間橄杨,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工照卦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留式矫,地道東北人。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓窄瘟,卻偏偏與公主長得像衷佃,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子蹄葱,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容