阿飛Javaer架曹,轉(zhuǎn)載請注明原創(chuàng)出處灯抛,謝謝!
實現(xiàn)動機
傳統(tǒng)數(shù)據(jù)庫軟件開發(fā)中音瓷,主鍵自動生成技術(shù)是基本需求。而各大數(shù)據(jù)庫對于該需求也提供了相應(yīng)的支持夹抗,比如MySQL的自增鍵绳慎。 對于MySQL而言,分庫分表之后漠烧,不同表生成全局唯一的Id是非常棘手的問題杏愤。因為同一個邏輯表內(nèi)的不同實際表之間的自增鍵是無法互相感知的, 這樣會造成重復(fù)Id的生成已脓。我們當然可以通過約束表生成鍵的規(guī)則來達到數(shù)據(jù)的不重復(fù)珊楼,但是這需要引入額外的運維力量來解決重復(fù)性問題,并使框架缺乏擴展性度液。
目前有許多第三方解決方案可以完美解決這個問題厕宗,比如UUID等依靠特定算法自生成不重復(fù)鍵(由于InnoDB采用的B+Tree索引特性,UUID生成的主鍵插入性能較差)堕担,或者通過引入Id生成服務(wù)等已慢。 但也正因為這種多樣性導(dǎo)致了Sharding-JDBC如果強依賴于任何一種方案就會限制其自身的發(fā)展。
基于以上的原因霹购,最終采用了以JDBC接口來實現(xiàn)對于生成Id的訪問佑惠,而將底層具體的Id生成實現(xiàn)分離出來。
sharding-jdbc的分布式ID采用twitter開源的snowflake算法齐疙,不需要依賴任何第三方組件膜楷,這樣其擴展性和維護性得到最大的簡化;但是snowflake算法的缺陷(強依賴時間贞奋,如果時鐘回撥赌厅,就會生成重復(fù)的ID),sharding-jdbc沒有給出解決方案忆矛,如果用戶想要強化察蹲,需要自行擴展请垛;
擴展:美團的分布式ID生成系統(tǒng)也是基于snowflake算法,并且解決了時鐘回撥的問題洽议,讀取有興趣請閱讀Leaf——美團點評分布式ID生成系統(tǒng)
分布式ID簡介
github上對分布式ID這個特性的描述是:Distributed Unique Time-Sequence Generation
宗收,兩個重要特性是:分布式唯一和時間序;基于Twitter Snowflake算法實現(xiàn)亚兄,長度為64bit混稽;64bit組成如下:
- 1bit sign bit.
- 41bits timestamp offset from 2016.11.01(Sharding-JDBC distributed primary key published data) to now.
- 10bits worker process id.
- 12bits auto increment offset in one mills.
分布式ID源碼分析
核心源碼在sharding-jdbc-core模塊中的com.dangdang.ddframe.rdb.sharding.keygen.DefaultKeyGenerator.java
中:
public final class DefaultKeyGenerator implements KeyGenerator {
public static final long EPOCH;
// 自增長序列的長度(單位是位時的長度)
private static final long SEQUENCE_BITS = 12L;
// workerId的長度(單位是位時的長度)
private static final long WORKER_ID_BITS = 10L;
private static final long SEQUENCE_MASK = (1 << SEQUENCE_BITS) - 1;
private static final long WORKER_ID_LEFT_SHIFT_BITS = SEQUENCE_BITS;
private static final long TIMESTAMP_LEFT_SHIFT_BITS = WORKER_ID_LEFT_SHIFT_BITS + WORKER_ID_BITS;
// 位運算計算workerId的最大值(workerId占10位,那么1向左移10位就是workerId的最大值)
private static final long WORKER_ID_MAX_VALUE = 1L << WORKER_ID_BITS;
@Setter
private static TimeService timeService = new TimeService();
private static long workerId;
// EPOCH就是起始時間审胚,從2016-11-01 00:00:00開始的毫秒數(shù)
static {
Calendar calendar = Calendar.getInstance();
calendar.set(2016, Calendar.NOVEMBER, 1);
calendar.set(Calendar.HOUR_OF_DAY, 0);
calendar.set(Calendar.MINUTE, 0);
calendar.set(Calendar.SECOND, 0);
calendar.set(Calendar.MILLISECOND, 0);
EPOCH = calendar.getTimeInMillis();
}
private long sequence;
private long lastTime;
/**
* 得到分布式唯一ID需要先設(shè)置workerId匈勋,workId的值范圍[0, 1024)
* @param workerId work process id
*/
public static void setWorkerId(final long workerId) {
// google-guava提供的入?yún)z查方法:workerId只能在0~WORKER_ID_MAX_VALUE之間;
Preconditions.checkArgument(workerId >= 0L && workerId < WORKER_ID_MAX_VALUE);
DefaultKeyGenerator.workerId = workerId;
}
/**
* 調(diào)用該方法膳叨,得到分布式唯一ID
* @return key type is @{@link Long}.
*/
@Override
public synchronized Number generateKey() {
long currentMillis = timeService.getCurrentMillis();
// 每次取分布式唯一ID的時間不能少于上一次取時的時間
Preconditions.checkState(lastTime <= currentMillis, "Clock is moving backwards, last time is %d milliseconds, current time is %d milliseconds", lastTime, currentMillis);
// 如果同一毫秒范圍內(nèi)洽洁,那么自增,否則從0開始
if (lastTime == currentMillis) {
// 如果自增后的sequence值超過4096菲嘴,那么等待直到下一個毫秒
if (0L == (sequence = ++sequence & SEQUENCE_MASK)) {
currentMillis = waitUntilNextTime(currentMillis);
}
} else {
sequence = 0;
}
// 更新lastTime的值饿自,即最后一次獲取分布式唯一ID的時間
lastTime = currentMillis;
// 從這里可知分布式唯一ID的組成部分;
return ((currentMillis - EPOCH) << TIMESTAMP_LEFT_SHIFT_BITS) | (workerId << WORKER_ID_LEFT_SHIFT_BITS) | sequence;
}
// 獲取下一毫秒的方法:死循環(huán)獲取當前毫秒與lastTime比較龄坪,直到大于lastTime的值昭雌;
private long waitUntilNextTime(final long lastTime) {
long time = timeService.getCurrentMillis();
while (time <= lastTime) {
time = timeService.getCurrentMillis();
}
return time;
}
}
獲取workerId的三種方式
sharding-jdbc的sharding-jdbc-plugin
模塊中,提供了三種方式獲取workerId的方式健田,并提供接口獲取分布式唯一ID的方法--generateKey()
烛卧,接下來對各種方式如何生成workerId進行分析;
HostNameKeyGenerator
- 根據(jù)hostname獲取妓局,源碼如下(HostNameKeyGenerator.java):
/**
* 根據(jù)機器名最后的數(shù)字編號獲取工作進程Id.如果線上機器命名有統(tǒng)一規(guī)范,建議使用此種方式.
* 例如機器的HostName為:dangdang-db-sharding-dev-01(公司名-部門名-服務(wù)名-環(huán)境名-編號)
* ,會截取HostName最后的編號01作為workerId.
*
* @author DonneyYoung
**/
static void initWorkerId() {
InetAddress address;
Long workerId;
try {
address = InetAddress.getLocalHost();
} catch (final UnknownHostException e) {
throw new IllegalStateException("Cannot get LocalHost InetAddress, please check your network!");
}
// 先得到服務(wù)器的hostname总放,例如JTCRTVDRA44,linux上可通過命令"cat /proc/sys/kernel/hostname"查看好爬;
String hostName = address.getHostName();
try {
// 計算workerId的方式:
// 第一步hostName.replaceAll("\\d+$", "")间聊,即去掉hostname后純數(shù)字部分,例如JTCRTVDRA44去掉后就是JTCRTVDRA
// 第二步hostName.replace(第一步的結(jié)果, "")抵拘,即將原h(huán)ostname的非數(shù)字部分去掉哎榴,得到純數(shù)字部分,就是workerId
workerId = Long.valueOf(hostName.replace(hostName.replaceAll("\\d+$", ""), ""));
} catch (final NumberFormatException e) {
throw new IllegalArgumentException(String.format("Wrong hostname:%s, hostname must be end with number!", hostName));
}
DefaultKeyGenerator.setWorkerId(workerId);
}
IPKeyGenerator
- 根據(jù)IP獲取僵蛛,源碼如下(IPKeyGenerator.java):
/**
* 根據(jù)機器IP獲取工作進程Id,如果線上機器的IP二進制表示的最后10位不重復(fù),建議使用此種方式
* ,列如機器的IP為192.168.1.108,二進制表示:11000000 10101000 00000001 01101100
* ,截取最后10位 01 01101100,轉(zhuǎn)為十進制364,設(shè)置workerId為364.
*/
static void initWorkerId() {
InetAddress address;
try {
// 首先得到IP地址尚蝌,例如192.168.1.108
address = InetAddress.getLocalHost();
} catch (final UnknownHostException e) {
throw new IllegalStateException("Cannot get LocalHost InetAddress, please check your network!");
}
// IP地址byte[]數(shù)組形式,這個byte數(shù)組的長度是4充尉,數(shù)組0~3下標對應(yīng)的值分別是192飘言,168,1驼侠,108
byte[] ipAddressByteArray = address.getAddress();
// 由這里計算workerId源碼可知姿鸿,workId由兩部分組成:
// 第一部分(ipAddressByteArray[ipAddressByteArray.length - 2] & 0B11) << Byte.SIZE:ipAddressByteArray[ipAddressByteArray.length - 2]即取byte[]倒數(shù)第二個值谆吴,即1,然后&0B11苛预,即只取最后2位(IP段倒數(shù)第二個段取2位句狼,IP段最后一位取全部8位,總計10位)热某,然后左移Byte.SIZE腻菇,即左移8位(因為這一部分取得的是IP段中倒數(shù)第二個段的值);
// 第二部分(ipAddressByteArray[ipAddressByteArray.length - 1] & 0xFF):ipAddressByteArray[ipAddressByteArray.length - 1]即取byte[]最后一位昔馋,即108筹吐,然后&0xFF,即通過位運算將byte轉(zhuǎn)為int秘遏;
// 最后將第一部分得到的值加上第二部分得到的值就是最終的workId
DefaultKeyGenerator.setWorkerId((long) (((ipAddressByteArray[ipAddressByteArray.length - 2] & 0B11) << Byte.SIZE) + (ipAddressByteArray[ipAddressByteArray.length - 1] & 0xFF)));
}
IPSectionKeyGenerator
- 根據(jù)IP段獲取丘薛,源碼如下(IPSectionKeyGenerator.java):
/**
* 瀏覽 {@link IPKeyGenerator} workerId生成的規(guī)則后,感覺對服務(wù)器IP后10位(特別是IPV6)數(shù)值比較約束.
*
* <p>
* 有以下優(yōu)化思路:
* 因為workerId最大限制是2^10邦危,我們生成的workerId只要滿足小于最大workerId即可榔袋。
* 1.針對IPV4:
* ....IP最大 255.255.255.255。而(255+255+255+255) < 1024铡俐。
* ....因此采用IP段數(shù)值相加即可生成唯一的workerId,不受IP位限制妥粟。
* 2.針對IPV6:
* ....IP最大ffff:ffff:ffff:ffff:ffff:ffff:ffff:ffff
* ....為了保證相加生成出的workerId < 1024,思路是將每個bit位的后6位相加审丘。這樣在一定程度上也可以滿足workerId不重復(fù)的問題。
* </p>
* 使用這種IP生成workerId的方法,必須保證IP段相加不能重復(fù)
*
* @author DogFc
*/
static void initWorkerId() {
InetAddress address;
try {
address = InetAddress.getLocalHost();
} catch (final UnknownHostException e) {
throw new IllegalStateException("Cannot get LocalHost InetAddress, please check your network!");
}
// 得到IP地址的byte[]形式值
byte[] ipAddressByteArray = address.getAddress();
long workerId = 0L;
//如果是IPV4勾给,計算方式是遍歷byte[]滩报,然后把每個IP段數(shù)值相加得到的結(jié)果就是workerId
if (ipAddressByteArray.length == 4) {
for (byte byteNum : ipAddressByteArray) {
workerId += byteNum & 0xFF;
}
//如果是IPV6,計算方式是遍歷byte[]播急,然后把每個IP段后6位(& 0B111111 就是得到后6位)數(shù)值相加得到的結(jié)果就是workerId
} else if (ipAddressByteArray.length == 16) {
for (byte byteNum : ipAddressByteArray) {
workerId += byteNum & 0B111111;
}
} else {
throw new IllegalStateException("Bad LocalHost InetAddress, please check your network!");
}
DefaultKeyGenerator.setWorkerId(workerId);
}
建議
大道至簡脓钾,強烈推薦HostNameKeyGenerator方式獲取workerId,只需服務(wù)器按照標準統(tǒng)一配置好hostname即可桩警;這種方案有點類似spring-boot:約定至上可训;并能夠讓架構(gòu)最簡化,不依賴任何第三方組件捶枢;