遇到的問(wèn)題:
Clickhouse本身是分布式的,數(shù)據(jù)要分布存儲(chǔ)在不同的分片,來(lái)達(dá)到分布式計(jì)算的效果。那我們保存到Clickhouse的一個(gè)大Bitmap就要被拆分成n個(gè)小的Bitmap保存到不同的節(jié)點(diǎn),而且要保證相同的offset在不同的Bitmap中都在相同的本地節(jié)點(diǎn)中,來(lái)達(dá)到本地碰撞計(jì)算的目的明场。RoaringBitmap壓縮率越高那么保存起來(lái)越是節(jié)省資源,計(jì)算效率也會(huì)更快李丰。
解決的思路和方向:
1苦锨、RoaringBitmap壓縮的原理
RoaringBitmap本身會(huì)把數(shù)據(jù)按照一定的邏輯拆分成不同的小桶,那么保存數(shù)據(jù)時(shí)趴泌,沒(méi)有offset段的那些小桶就不會(huì)被創(chuàng)建出來(lái)舟舒,通過(guò)這樣的邏輯就實(shí)現(xiàn)了數(shù)據(jù)的壓縮存儲(chǔ)。