kafka基礎(chǔ)

kafka架構(gòu):

kafka架構(gòu).png

kafka應(yīng)用場(chǎng)景:
1)大數(shù)據(jù)領(lǐng)域
2)數(shù)據(jù)集成
3)流計(jì)算集成
kafka消息生產(chǎn)者發(fā)送消息是批量發(fā)送捌省,默認(rèn)是16Kb發(fā)送一次

pros.put("batch.size", 16384)  #16kb

批量發(fā)送等待時(shí)間

pros.put("linger.er", 5) 

若5秒鐘內(nèi)未到達(dá)16kb也發(fā)送弟疆,批量發(fā)送時(shí)間和發(fā)送等待時(shí)間滿足一個(gè)即可發(fā)送
kakfa消息生產(chǎn)者只支持pull模式獲取消息
原因:因?yàn)閗afka使用于大量消息處理菇曲,在大量消息發(fā)送到broker中時(shí)若使用push模式推送消息給消息消費(fèi)者缚态,很容易由于消息生產(chǎn)者達(dá)到消費(fèi)能力極限蓝谨,導(dǎo)致消費(fèi)者宕機(jī)
kafka消費(fèi)者一次活動(dòng)多少條消息可配置:

conusmer.poll(Duration.ofMillis(1000))  #默認(rèn)每次獲取1000條消息

生產(chǎn)者和消費(fèi)者通過topic關(guān)聯(lián)
kafka消息在服務(wù)器上默認(rèn)的存儲(chǔ)位置:/tmp/kafka-logs
每個(gè)分區(qū)有一套文件:.index文件垛玻、.log文件摹察、.timeindex文件
具體消息存儲(chǔ)在.log文件內(nèi)冤留,消息會(huì)不斷追加到.log文件內(nèi)不會(huì)刪除(和rabbitmq不同碧囊,rabbitmq中消費(fèi)過的消息會(huì)被刪除)
這樣做的好處:可以實(shí)現(xiàn)順序?qū)懀ㄡ槍?duì)一個(gè)分區(qū)),速度高纤怒;提供了消費(fèi)歷史消息的能力
kafka topic 可分區(qū) partition

注意:

  • kafka啟動(dòng)時(shí)糯而,設(shè)置副本數(shù)量不可比節(jié)點(diǎn)broker數(shù)量大,否則會(huì)報(bào)錯(cuò)

不同節(jié)點(diǎn)中副本有不同的角色(leader節(jié)點(diǎn)泊窘、fellow節(jié)點(diǎn))只有l(wèi)eader才提供讀(消費(fèi)者讀)寫(生產(chǎn)者寫)功能熄驼,fellow節(jié)點(diǎn)只有備份功能
為什么kafka的設(shè)計(jì)不實(shí)現(xiàn)不同節(jié)點(diǎn)讀寫分離功能:
避免了讀寫一致性問題
.log文件達(dá)到閾值kafka會(huì)對(duì)文件進(jìn)行分段segment,每個(gè)segment會(huì)有一條文件(index文件像寒、.log文件、.timeindex文件)
閾值大泄霞帧:log.sement.bytes = 1G
同一個(gè)kafka消息消費(fèi)者組內(nèi)的消費(fèi)者不會(huì)同時(shí)消費(fèi)同一個(gè)topic下相同的partition的消息诺祸;當(dāng)消費(fèi)者數(shù)量大于partition數(shù)量時(shí),多余的消費(fèi)者沒有可以消費(fèi)的partition祭芦;當(dāng)partition數(shù)量大于消費(fèi)者數(shù)量時(shí)筷笨,消費(fèi)者組中某個(gè)消費(fèi)者可以消費(fèi)多個(gè)partition

consumer offset:用于記錄消費(fèi)者消費(fèi)消息的位置,保存在_consumer_offset-0(存儲(chǔ)了某一個(gè)partition和某一個(gè)消費(fèi)者消費(fèi)消息的偏移量也就是位置)

kafka防止消息重復(fù)消費(fèi)問題(冪等),消息生產(chǎn)者配置開關(guān):
kafka只能保證一次會(huì)話里針對(duì)單個(gè)partition的消息冪等

props.put("enable.idempotence", true)

在broker會(huì)生成冪等標(biāo)志
kafka針對(duì)過個(gè)分區(qū)的冪等(kafka的事務(wù)实束,保證多消息的原子性):
解釋: 保證多個(gè)消息同時(shí)成功或者同時(shí)失敗
事務(wù)消息使用場(chǎng)景:
1奥秆、發(fā)送多條消息
2、發(fā)送消息到多個(gè)topic或者多個(gè)partition
3咸灿、消費(fèi)以后發(fā)出消息 consume-process-produce(解釋:從一個(gè)上游系統(tǒng)接收消息构订,同時(shí)又將消息發(fā)送到一個(gè)下游系統(tǒng))
代碼實(shí)現(xiàn)(偽代碼):

#初始化事務(wù)
producer.initTransactions();
try{
  #開啟事務(wù)
  producer.beginTransaction() 
  producer.send();
  producer.send();
  ...
  #提交事務(wù)
  producer.commitTransaction() 
} catch(KafkaException e){
  #終止事務(wù)
  producer.abortTransaction() 
}
#應(yīng)用于上面場(chǎng)景3(消費(fèi)以后發(fā)出消息)
producer.sendOffsetsToTransaction()
producer.close();

kafka事務(wù)原理:
分布式事務(wù)的思想:2pc ,3pc避矢, TCC
1悼瘾、kafka應(yīng)用了分布式事務(wù)里的兩階段思想:第一階段是預(yù)提交,第二階段才是真正的提交审胸,
2亥宿、兩階段必須需要一個(gè)協(xié)調(diào)者的角色(Transaction Coordinator: 在kafka服務(wù)端)
3、事務(wù)日志:topic_transaction_state砂沛,當(dāng)服務(wù)異常等極端情況kafka服務(wù)重啟以后烫扼,會(huì)通過查找事務(wù)日志檢查每一個(gè)事務(wù)狀態(tài)(topic_transaction_state),處理未完成的事務(wù)消息碍庵。
4映企、生產(chǎn)者事務(wù)ID:transaction.id,極端情況下生成者掛了事務(wù)發(fā)送執(zhí)行到一半静浴,當(dāng)生產(chǎn)者重啟時(shí)堰氓,服務(wù)當(dāng)如何判斷是哪一個(gè)事務(wù)就是通過生產(chǎn)者事務(wù)ID來判斷的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市苹享,隨后出現(xiàn)的幾起案子双絮,更是在濱河造成了極大的恐慌,老刑警劉巖得问,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件囤攀,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡宫纬,警方通過查閱死者的電腦和手機(jī)抚岗,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哪怔,“玉大人宣蔚,你說我怎么就攤上這事∪暇常” “怎么了胚委?”我有些...
    開封第一講書人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)叉信。 經(jīng)常有香客問我亩冬,道長(zhǎng),這世上最難降的妖魔是什么硼身? 我笑而不...
    開封第一講書人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任硅急,我火速辦了婚禮,結(jié)果婚禮上佳遂,老公的妹妹穿的比我還像新娘营袜。我一直安慰自己,他們只是感情好丑罪,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開白布荚板。 她就那樣靜靜地躺著,像睡著了一般吩屹。 火紅的嫁衣襯著肌膚如雪跪另。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,573評(píng)論 1 305
  • 那天煤搜,我揣著相機(jī)與錄音免绿,去河邊找鬼。 笑死擦盾,一個(gè)胖子當(dāng)著我的面吹牛嘲驾,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播厌衙,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼距淫,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了婶希?” 一聲冷哼從身側(cè)響起榕暇,我...
    開封第一講書人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎喻杈,沒想到半個(gè)月后彤枢,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡筒饰,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年缴啡,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片瓷们。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡业栅,死狀恐怖秒咐,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情碘裕,我是刑警寧澤携取,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站帮孔,受9級(jí)特大地震影響雷滋,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜文兢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一晤斩、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧姆坚,春花似錦澳泵、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至萍程,卻和暖如春幢妄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背茫负。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來泰國打工蕉鸳, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人忍法。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓潮尝,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國和親饿序。 傳聞我的和親對(duì)象是個(gè)殘疾皇子勉失,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容