1.topic分成多個(gè)partition的話察绷,多個(gè)partition可以分布在多臺(tái)機(jī)器上蚓让,為topic提供了無(wú)限大的橫向拓展性
2. partiton分為多個(gè)segment的話跑慕,因?yàn)閟eqment的內(nèi)容是一個(gè)數(shù)據(jù)文件加上一個(gè)索引文件廉沮,如果不分成多個(gè)segment,只有一個(gè)partition文件的話,partition會(huì)一直變大绍移,對(duì)于已經(jīng)過期的數(shù)據(jù)想做刪除环凿,會(huì)很麻煩。如果劃分成segment的話,可以刪除已經(jīng)過期的整個(gè)segment文件
3. partition是文件夾御毅,segment是里面的文件
我也是初學(xué)者根欧,寫這個(gè)只是做一下筆記
kafka高吞吐量的原因kafa 吞吐量高的原因 順序讀寫 kafka的消息是不斷追加到文件中的,這個(gè)特性使kafka可以充分利用磁盤的順序讀寫性能 順序讀寫不需要硬盤磁頭的尋道時(shí)間端蛆,只需很少的扇區(qū)...