最常用的分布式 ID 解決方案次兆,都在這里了稿茉!

「一、分布式ID概念」

說起ID芥炭,特性就是唯一漓库,在人的世界里,ID就是身份證园蝠,是每個人的唯一的身份標識渺蒿。在復雜的分布式系統(tǒng)中,往往也需要對大量的數(shù)據(jù)和消息進行唯一標識彪薛。舉個例子茂装,數(shù)據(jù)庫的ID字段在單體的情況下可以使用自增來作為ID,但是對數(shù)據(jù)分庫分表后一定需要一個唯一的ID來標識一條數(shù)據(jù)善延,這個ID就是分布式ID少态。對于分布式ID而言,也需要具備分布式系統(tǒng)的特點:高并發(fā)易遣,高可用彼妻,高性能等特點。

「二、分布式ID實現(xiàn)方案」

下表為一些常用方案對比:

|
| 描述 | 優(yōu)點 | 缺點 |
| --- | --- | --- | --- |
| UUID | UUID是通用唯一標識碼的縮寫侨歉,其目的是上分布式系統(tǒng)中的所有元素都有唯一的辨識信息屋摇,而不需要通過中央控制器來指定唯一標識。 | 1. 降低全局節(jié)點的壓力幽邓,使得主鍵生成速度更快摊册;2. 生成的主鍵全局唯一;3. 跨服務(wù)器合并數(shù)據(jù)方便 | 1. UUID占用16個字符颊艳,空間占用較多茅特;2. 不是遞增有序的數(shù)字,數(shù)據(jù)寫入IO隨機性很大棋枕,且索引效率下降 |
| 數(shù)據(jù)庫主鍵自增 | MySQL數(shù)據(jù)庫設(shè)置主鍵且主鍵自動增長 | 1. INT和BIGINT類型占用空間較邪仔蕖;2. 主鍵自動增長重斑,IO寫入連續(xù)性好兵睛;3. 數(shù)字類型查詢速度優(yōu)于字符串 | 1. 并發(fā)性能不高,受限于數(shù)據(jù)庫性能窥浪;2. 分庫分表祖很,需要改造,復雜漾脂;3. 自增:數(shù)據(jù)量泄露 |
| Redis自增 | Redis計數(shù)器假颇,原子性自增 | 使用內(nèi)存,并發(fā)性能好 | 1. 數(shù)據(jù)丟失骨稿;2. 自增:數(shù)據(jù)量泄露 |
| 雪花算法(snowflake) | 大名鼎鼎的雪花算法笨鸡,分布式ID的經(jīng)典解決方案 | 1. 不依賴外部組件;2. 性能好 | 時鐘回撥 |

目前流行的分布式ID解決方案有兩種:「號段模式」「雪花算法」坦冠。

「號段模式」依賴于數(shù)據(jù)庫形耗,但是區(qū)別于數(shù)據(jù)庫主鍵自增的模式。假設(shè)100為一個號段100辙浑,200激涤,300,每取一次可以獲得100個ID判呕,性能顯著提高倦踢。

「雪花算法」是由符號位+時間戳+工作機器id+序列號組成的,如圖所示:

圖片

符號位為0佛玄,0表示正數(shù)硼一,ID為正數(shù)累澡。

時間戳位不用多說梦抢,用來存放時間戳,單位是ms愧哟。

工作機器id位用來存放機器的id奥吩,通常分為5個區(qū)域位+5個服務(wù)器標識位哼蛆。

序號位是自增。

  • 雪花算法能存放多少數(shù)據(jù)霞赫?時間范圍:2^41 / (3652460601000) = 69年 工作進程范圍:2^10 = 1024 序列號范圍:2^12 = 4096腮介,表示1ms可以生成4096個ID。

根據(jù)這個算法的邏輯端衰,只需要將這個算法用Java語言實現(xiàn)出來叠洗,封裝為一個工具方法,那么各個業(yè)務(wù)應(yīng)用可以直接使用該工具方法來獲取分布式ID旅东,只需保證每個業(yè)務(wù)應(yīng)用有自己的工作機器id即可灭抑,而不需要單獨去搭建一個獲取分布式ID的應(yīng)用。下面是推特版的Snowflake算法:

public class SnowFlake {    /**     * 起始的時間戳     */    private final static long START_STMP = 1480166465631L;    /**     * 每一部分占用的位數(shù)     */    private final static long SEQUENCE_BIT = 12; //序列號占用的位數(shù)    private final static long MACHINE_BIT = 5;   //機器標識占用的位數(shù)    private final static long DATACENTER_BIT = 5;//數(shù)據(jù)中心占用的位數(shù)    /**     * 每一部分的最大值     */    private final static long MAX_DATACENTER_NUM = -1L ^ (-1L << DATACENTER_BIT);    private final static long MAX_MACHINE_NUM = -1L ^ (-1L << MACHINE_BIT);    private final static long MAX_SEQUENCE = -1L ^ (-1L << SEQUENCE_BIT);    /**     * 每一部分向左的位移     */    private final static long MACHINE_LEFT = SEQUENCE_BIT;    private final static long DATACENTER_LEFT = SEQUENCE_BIT + MACHINE_BIT;    private final static long TIMESTMP_LEFT = DATACENTER_LEFT + DATACENTER_BIT;    private long datacenterId;  //數(shù)據(jù)中心    private long machineId;     //機器標識    private long sequence = 0L; //序列號    private long lastStmp = -1L;//上一次時間戳    public SnowFlake(long datacenterId, long machineId) {        if (datacenterId > MAX_DATACENTER_NUM || datacenterId < 0) {            throw new IllegalArgumentException("datacenterId can't be greater than MAX_DATACENTER_NUM or less than 0");        }        if (machineId > MAX_MACHINE_NUM || machineId < 0) {            throw new IllegalArgumentException("machineId can't be greater than MAX_MACHINE_NUM or less than 0");        }        this.datacenterId = datacenterId;        this.machineId = machineId;    }    /**     * 產(chǎn)生下一個ID     *     * @return     */    public synchronized long nextId() {        long currStmp = getNewstmp();        if (currStmp < lastStmp) {            throw new RuntimeException("Clock moved backwards.  Refusing to generate id");        }        if (currStmp == lastStmp) {            //相同毫秒內(nèi)抵代,序列號自增            sequence = (sequence + 1) & MAX_SEQUENCE;            //同一毫秒的序列數(shù)已經(jīng)達到最大            if (sequence == 0L) {                currStmp = getNextMill();            }        } else {            //不同毫秒內(nèi)腾节,序列號置為0            sequence = 0L;        }        lastStmp = currStmp;        return (currStmp - START_STMP) << TIMESTMP_LEFT //時間戳部分                | datacenterId << DATACENTER_LEFT       //數(shù)據(jù)中心部分                | machineId << MACHINE_LEFT             //機器標識部分                | sequence;                             //序列號部分    }    private long getNextMill() {        long mill = getNewstmp();        while (mill <= lastStmp) {            mill = getNewstmp();        }        return mill;    }    private long getNewstmp() {        return System.currentTimeMillis();    }    public static void main(String[] args) {        SnowFlake snowFlake = new SnowFlake(2, 3);        for (int i = 0; i < (1 << 12); i++) {            System.out.println(snowFlake.nextId());        }    }}

「三、分布式ID開源組件」

3.1 如何選擇開源組件

選擇開源組件首先需要看軟件特性是否滿足需求荤牍,主要包括兼容性和擴展性案腺。

其次需要看目前的技術(shù)能力,根據(jù)目前自己或者團隊的技術(shù)棧和技術(shù)能力康吵,能否可以平滑的使用劈榨。

第三,要看開源組件的社區(qū)晦嵌,主要關(guān)注更新是否頻繁鞋既、項目是否有人維護、遇到坑的時候可以取得聯(lián)系尋求幫助耍铜、是否在業(yè)內(nèi)被廣泛使用等邑闺。

3.2 美團Leaf

Leaf是美團基礎(chǔ)研發(fā)平臺推出的一個分布式ID生成服務(wù),名字取自德國哲學家棕兼、數(shù)學家萊布尼茨的一句話:“There are no two identical leaves in the world.”Leaf具備高可靠陡舅、低延遲、全局唯一等特點伴挚。目前已經(jīng)廣泛應(yīng)用于美團金融靶衍、美團外賣、美團酒旅等多個部門茎芋。具體的技術(shù)細節(jié)颅眶,可參考美團技術(shù)博客的一篇文章:《Leaf美團分布式ID生成服務(wù)》。目前田弥,Leaf項目已經(jīng)在Github上開源:https://github.com/Meituan-Dianping/Leaf涛酗。Leaf在特性如下:

  1. 全局唯一,絕對不會出現(xiàn)重復的ID,且ID整體趨勢遞增商叹。
  2. 高可用燕刻,服務(wù)完全基于分布式架構(gòu),即使MySQL宕機剖笙,也能容忍一段時間的數(shù)據(jù)庫不可用卵洗。
  3. 高并發(fā)低延時,在CentOS 4C8G的虛擬機上弥咪,遠程調(diào)用QPS可達5W+过蹂,TP99在1ms內(nèi)。
  4. 接入簡單聚至,直接通過公司RPC服務(wù)或者HTTP調(diào)用即可接入榴啸。

3.3 百度UidGenerator

UidGenerator百度開源的一款基于Snowflake算法的分布式高性能唯一ID生成器。采用官網(wǎng)的一段描述:UidGenerator以組件形式工作在應(yīng)用項目中, 支持自定義workerId位數(shù)和初始化策略, 從而適用于docker等虛擬化環(huán)境下實例自動重啟晚岭、漂移等場景鸥印。在實現(xiàn)上, UidGenerator通過借用未來時間來解決sequence天然存在的并發(fā)限制; 采用RingBuffer來緩存已生成的UID, 并行化UID的生產(chǎn)和消費, 同時對CacheLine補齊,避免了由RingBuffer帶來的硬件級「偽共享」問題. 最終單機QPS可達600萬坦报。UidGenerator的GitHub地址:https://github.com/baidu/uid-generator

3.4 開源組件對比

百度UidGenerator是Java語言的库说;最近一次提交記錄是兩年前,基本無人維護片择;只支持雪花算法潜的。

美團Leaf也是Java語言的;最近維護為2020年字管;支持號段模式和雪花算法啰挪。

綜上理論和兩款開源組件的對比,還是美團Leaf稍勝一籌嘲叔。

你還知道哪些常用的分布式ID解決方案呢亡呵?

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市硫戈,隨后出現(xiàn)的幾起案子锰什,更是在濱河造成了極大的恐慌,老刑警劉巖丁逝,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件汁胆,死亡現(xiàn)場離奇詭異,居然都是意外死亡霜幼,警方通過查閱死者的電腦和手機嫩码,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來罪既,“玉大人铸题,你說我怎么就攤上這事铡恕。” “怎么了回挽?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵没咙,是天一觀的道長猩谊。 經(jīng)常有香客問我千劈,道長,這世上最難降的妖魔是什么牌捷? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任墙牌,我火速辦了婚禮,結(jié)果婚禮上暗甥,老公的妹妹穿的比我還像新娘喜滨。我一直安慰自己,他們只是感情好撤防,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著寄月,像睡著了一般。 火紅的嫁衣襯著肌膚如雪漾肮。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天克懊,我揣著相機與錄音,去河邊找鬼谭溉。 笑死墙懂,一個胖子當著我的面吹牛扮念,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播扔亥,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼场躯,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了旅挤?” 一聲冷哼從身側(cè)響起踢关,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎粘茄,沒想到半個月后签舞,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秕脓,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年儒搭,在試婚紗的時候發(fā)現(xiàn)自己被綠了吠架。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡搂鲫,死狀恐怖傍药,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情魂仍,我是刑警寧澤拐辽,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站擦酌,受9級特大地震影響俱诸,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜赊舶,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一睁搭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧笼平,春花似錦园骆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至捶牢,卻和暖如春鸠珠,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背秋麸。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工渐排, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人灸蟆。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓驯耻,卻偏偏與公主長得像,于是被迫代替她去往敵國和親炒考。 傳聞我的和親對象是個殘疾皇子可缚,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容