今天介紹的雪花算法:Snowflake衙猪,可以讓負(fù)責(zé)生成分布式 ID 的每臺(tái)機(jī)器在每毫秒內(nèi)生成不一樣的 ID隙姿。Snowflake 是 Twitter 開源的分布式 ID 生成算法墙基,它不依賴數(shù)據(jù)庫(kù)。
核心思想是:分布式 ID 固定是一個(gè) long 型的數(shù)字桌粉,一個(gè) long 型占8個(gè)字節(jié)旦袋,也就是64個(gè)bit,原始 Snowflake 算法中對(duì)于 bit 的分配如下圖:
- 第1個(gè) bit 位是標(biāo)識(shí)部分瞄沙,在 java 中由于 long 的最高位是符號(hào)位己沛,正數(shù)是0,負(fù)數(shù)是1距境,一般生成的 ID 為正數(shù)申尼,所以固定為0;
- 時(shí)間戳部分占41 bit垫桂,這個(gè)是毫秒級(jí)的時(shí)間师幕,一般實(shí)現(xiàn)上不會(huì)存儲(chǔ)當(dāng)前的時(shí)間戳,而是時(shí)間戳的差值(當(dāng)前時(shí)間-固定的開始時(shí)間)诬滩,這樣可以使產(chǎn)生的ID從更小值開始们衙;41位的時(shí)間戳可以使用69年,(1L << 41) / (1000L * 60 * 60 * 24 * 365) = 69年碱呼;
- 工作機(jī)器id占10 bit,這里比較靈活宗侦,比如愚臀,可以使用前5位作為數(shù)據(jù)中心機(jī)房標(biāo)識(shí),后5位作為單機(jī)房機(jī)器標(biāo)識(shí)矾利,算下來(lái)可以部署1024個(gè)節(jié)點(diǎn)姑裂;
- 序列號(hào)部分占12 bit,支持同一毫秒內(nèi)同一個(gè)節(jié)點(diǎn)可以生成4096個(gè) ID
根據(jù)這個(gè)算法的邏輯男旗,只需要將這個(gè)算法用編程語(yǔ)言實(shí)現(xiàn)出來(lái)舶斧,封裝為一個(gè)工具方法,那么各個(gè)業(yè)務(wù)應(yīng)用可以直接使用該工具方法來(lái)獲取分布式 ID察皇,我們只需保證每個(gè)業(yè)務(wù)應(yīng)用有自己的工作機(jī)器 ID 即可茴厉,而不需要單獨(dú)去搭建獲取分布式 ID 的應(yīng)用。
Snowflake 算法實(shí)現(xiàn)起來(lái)并不難什荣,這里提供一個(gè) Github 上的 Java 實(shí)現(xiàn)版本:SnowFlake
不過(guò)國(guó)內(nèi)的很多大廠矾缓,其實(shí)并沒(méi)有直接使用 Snowflake 原始算法,多多少少都進(jìn)行了改造稻爬,因?yàn)?Snowflake 算法中最難實(shí)踐的就是工作機(jī)器 Id嗜闻,原始的 Snowflake 算法需要人工去為每臺(tái)機(jī)器指定一個(gè)機(jī)器 Id 并配置在某個(gè)地方,從而讓 Snowflake 可以從此處獲取機(jī)器 Id桅锄。但是對(duì)于大廠來(lái)說(shuō)琉雳,機(jī)器是很多的样眠,這樣做的人力成本太大,且容易出錯(cuò)翠肘,因此才會(huì)對(duì) Snowflake 進(jìn)行改造檐束。