1、名詞解析:
broker: 一個(gè)Kafka節(jié)點(diǎn)就是一個(gè)broker橡淆,多個(gè)broker可以組成一個(gè)Kafka集群。
topic: 主題 ,代表一類消息
partition:topic物理上的分組瘫证,一個(gè)topic可以分為多個(gè)partition,每個(gè)partition是一個(gè)有序的隊(duì)列庄撮。每個(gè)partition都對(duì)應(yīng)唯一的消費(fèi)者1嘲啤!洞斯!
offset:每個(gè)partition都由一系列有序的毡庆、不可變的消息組成,這些消息被連續(xù)的追加到partition中烙如。partition中的每個(gè)消息都有一個(gè)連續(xù)的序列號(hào)叫做offset,用于partition唯一標(biāo)識(shí)一條消息.同一個(gè)partition的offset是被順序消費(fèi)的
topic和partition以及offset關(guān)系如圖所示
2么抗、kafka的log存儲(chǔ)解析
參考資料:https://blog.csdn.net/jewes/article/details/42970799
segment index file采取稀疏索引存儲(chǔ)方式,它減少索引文件大小亚铁,通過mmap可以直接內(nèi)存操作蝇刀,稀疏索引為數(shù)據(jù)文件的每個(gè)對(duì)應(yīng)message設(shè)置一個(gè)元數(shù)據(jù)指針,它比稠密索引節(jié)省了更多的存儲(chǔ)空間,但查找起來需要消耗更多的時(shí)間(但此時(shí)每塊的數(shù)據(jù)量少的多徘溢,查找起來快)吞琐。
2、Kafka集群partitions/replicas默認(rèn)分配解析
集群partitions/replicas默認(rèn)分配
參考資料:https://blog.csdn.net/lizhitao/article/details/41778193