? etcd是由CoreOS團隊發(fā)的一個分布式一致性的KV存儲系統(tǒng)鼎文,可用于服務注冊發(fā)現(xiàn)和共享配置膳凝,隨著CoreOS和Kubernetes等項目在開源社區(qū)日益火熱,它們項目中都用到的etcd組件作為一個高可用強一致性的服務發(fā)現(xiàn)存儲倉庫震束,漸漸為開發(fā)人員所關注对雪。在云計算時代河狐,如何讓服務快速透明地接入到計算集群中,如何讓共享配置信息快速被集群中的所有機器發(fā)現(xiàn),更為重要的是甚牲,如何構建這樣一套高可用义郑、安全蝶柿、易于部署以及響應快速的服務集群丈钙,已經(jīng)成為了迫切需要解決的問題。etcd為解決這類問題帶來了福音交汤,本文將從etcd的應用場景開始雏赦,深入解讀etcd的實現(xiàn)方式,以供開發(fā)者們更為充分地享用etcd所帶來的便利芙扎。
特點:
使用場景
- 配置管理
- 服務注冊于發(fā)現(xiàn)
- 選主
- 應用調(diào)度
- 分布式隊列
- 分布式鎖
原理:
? etcd推薦使用奇數(shù)作為集群節(jié)點個數(shù)星岗。因為奇數(shù)個節(jié)點和其配對的偶數(shù)個節(jié)點相比,容錯能力相同戒洼,卻可以少一個節(jié)點俏橘。綜合考慮性能和容錯能力,etcd官方文檔推薦的etcd集群大小是3,5,7圈浇。由于etcd使用是Raft算法寥掐,每次寫入數(shù)據(jù)需要有2N+1個節(jié)點同意可以寫入數(shù)據(jù),所以部分節(jié)點由于網(wǎng)絡或者其他不可靠因素延遲收到數(shù)據(jù)更新磷蜀,但是最終數(shù)據(jù)會保持一致召耘,高度可靠。隨著節(jié)點數(shù)目的增加褐隆,每次的寫入延遲會相應的線性遞增污它,除了節(jié)點數(shù)量會影響寫入數(shù)據(jù)的延遲,如果節(jié)點跟接節(jié)點之間的網(wǎng)絡延遲庶弃,也會導致數(shù)據(jù)的延遲寫入衫贬。
結(jié)論:
? 1.節(jié)點數(shù)并非越多越好,過多的節(jié)點將會導致數(shù)據(jù)延遲寫入歇攻。
? 2.節(jié)點跟節(jié)點之間的跨機房固惯,專線之間網(wǎng)絡延遲,也將會導致數(shù)據(jù)延遲寫入掉伏。
? 3.受網(wǎng)絡IO和磁盤IO的延遲
? 4.為了提高吞吐量缝呕,etcd通常將多個請求一次批量處理并提交Raft,
? 5.增加節(jié)點斧散,讀性能會提升供常,寫性能會下降,減少節(jié)點鸡捐,寫性能會提升栈暇。
部署
單機節(jié)點(CentOS 7)
$ yum install etcd -y
修改配置文件,通過yum 安裝的etcd箍镜,以下是etcd的配置文件:
$ vim /etc/etcd/etcd.conf
#[Member]
#ETC D_CORS=""
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
#ETCD_WAL_DIR=""
#ETCD_LISTEN_PEER_URLS="http://localhost:2380"
ETCD_LISTEN_CLIENT_URLS="http://192.168.1.109:2379"
#ETCD_MAX_SNAPSHOTS="5"
#ETCD_MAX_WALS="5"
ETCD_NAME="default"
#ETCD_SNAPSHOT_COUNT="100000"
#ETCD_HEARTBEAT_INTERVAL="100"
#ETCD_ELECTION_TIMEOUT="1000"
#ETCD_QUOTA_BACKEND_BYTES="0"
#ETCD_MAX_REQUEST_BYTES="1572864"
#ETCD_GRPC_KEEPALIVE_MIN_TIME="5s"
#ETCD_GRPC_KEEPALIVE_INTERVAL="2h0m0s"
#ETCD_GRPC_KEEPALIVE_TIMEOUT="20s"
#
#[Clustering]
#ETCD_INITIAL_ADVERTISE_PEER_URLS="http://localhost:2380"
ETCD_ADVERTISE_CLIENT_URLS="http://192.168.1.109:2379"
#ETCD_DISCOVERY=""
#ETCD_DISCOVERY_FALLBACK="proxy"
#ETCD_DISCOVERY_PROXY=""
#ETCD_DISCOVERY_SRV=""
#ETCD_INITIAL_CLUSTER="default=http://localhost:2380"
#ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
#ETCD_INITIAL_CLUSTER_STATE="new"
#ETCD_STRICT_RECONFIG_CHECK="true"
#ETCD_ENABLE_V2="true"
#
#[Proxy]
#ETCD_PROXY="off"
#ETCD_PROXY_FAILURE_WAIT="5000"
#ETCD_PROXY_REFRESH_INTERVAL="30000"
#ETCD_PROXY_DIAL_TIMEOUT="1000"
#ETCD_PROXY_WRITE_TIMEOUT="5000"
#ETCD_PROXY_READ_TIMEOUT="0"
#
#[Security]
#ETCD_CERT_FILE=""
#ETCD_KEY_FILE=""
#ETCD_CLIENT_CERT_AUTH="false"
#ETCD_TRUSTED_CA_FILE=""
#ETCD_AUTO_TLS="false"
#ETCD_PEER_CERT_FILE=""
#ETCD_PEER_KEY_FILE=""
#ETCD_PEER_CLIENT_CERT_AUTH="false"
#ETCD_PEER_TRUSTED_CA_FILE=""
#ETCD_PEER_AUTO_TLS="false"
#
#[Logging]
#ETCD_DEBUG="false"
#ETCD_LOG_PACKAGE_LEVELS=""
#ETCD_LOG_OUTPUT="default"
#
#[Unsafe]
#ETCD_FORCE_NEW_CLUSTER="false"
#
#[Version]
#ETCD_VERSION="false"
#ETCD_AUTO_COMPACTION_RETENTION="0"
#
#[Profiling]
#ETCD_ENABLE_PPROF="false"
#ETCD_METRICS="basic"
#
#[Auth]
#ETCD_AUTH_TOKEN="simple"
參數(shù)說明:
- –data-dir:指定節(jié)點的數(shù)據(jù)存儲目錄源祈,若不指定煎源,則默認是當前目錄。這些數(shù)據(jù)包括節(jié)點ID香缺,集群ID手销,集群初始化配置,Snapshot文件图张,若未指 定–wal-dir锋拖,還會存儲WAL文件
- –wal-dir:指定節(jié)點的was文件存儲目錄,若指定了該參數(shù)祸轮,wal文件會和其他數(shù)據(jù)文件分開存儲
- –name:節(jié)點名稱
- –initial-advertise-peer-urls:告知集群其他節(jié)點的URL兽埃,tcp2380端口用于集群通信
- –listen-peer-urls:監(jiān)聽URL,用于與其他節(jié)點通訊
- –advertise-client-urls:告知客戶端的URL, 也就是服務的URL适袜,tcp2379端口用于監(jiān)聽客戶端請求
- –initial-cluster-token:集群的ID
- –initial-cluster:集群中所有節(jié)點
- –initial-cluster-state:集群狀態(tài)柄错,new為新創(chuàng)建集群,existing為已存在的集群
- etcd 默認存儲大小限制是 2GB, 可以通過
--quota-backend-bytes
標記配置苦酱,最大支持 8GB.
啟動etcd服務
$ systemctl start etcd.service
$ systemctl status etcd.service
● etcd.service - Etcd Server
Loaded: loaded (/usr/lib/systemd/system/etcd.service; disabled; vendor preset: disabled)
Active: active (running) since 六 2018-06-02 22:17:34 CST; 9s ago
Main PID: 2876 (etcd)
CGroup: /system.slice/etcd.service
└─2876 /usr/bin/etcd --name=default --data-dir=/var/lib/etcd/default.etcd --listen-client-urls=http://192.168.1.109:2379
多節(jié)點部署
自定義的 etcd discovery 服務
這種方式就是利用一個已有的 etcd 集群來提供 discovery 服務售貌,從而搭建一個新的 etcd 集群。
假設已有的 etcd
集群的一個訪問地址是:myetcd.local
躏啰,那么我們首先需要在已有 etcd
中創(chuàng)建一個特殊的 key趁矾,方法如下:
$ curl -X PUT https://myetcd.local/v2/keys/discovery/6c007a14875d53d9bf0ef5a6fc0257c817f0fb83/_config/size -d value=3
其中 value=3
表示本集群的大小,即: 有多少集群節(jié)點给僵。而 6c007a14875d53d9bf0ef5a6fc0257c817f0fb83
就是用來做 discovery 的 token毫捣。
接下來你在 3 個節(jié)點上分別啟動 etcd
程序,并加上剛剛的 token帝际。
加 token 的方式同樣也有 命令行參數(shù) 和 環(huán)境變量 兩種蔓同。
命令行參數(shù):
-discovery https://myetcd.local/v2/keys/discovery/6c007a14875d53d9bf0ef5a6fc0257c817f0fb83
環(huán)境變量
ETCD_DISCOVERY=https://myetcd.local/v2/keys/discovery/6c007a14875d53d9bf0ef5a6fc0257c817f0fb83
以命令行參數(shù)啟動方式為例:
$ etcd -name etcd0 -initial-advertise-peer-urls http://10.0.1.10:2380 \
-listen-peer-urls http://10.0.1.10:2380 \
-listen-client-urls http://10.0.1.10:2379,http://127.0.0.1:2379 \
-advertise-client-urls http://10.0.1.10:2379 \
-discovery https://myetcd.local/v2/keys/discovery/6c007a14875d53d9bf0ef5a6fc0257c817f0fb83
$ etcd -name etcd1 -initial-advertise-peer-urls http://10.0.1.11:2380 \
-listen-peer-urls http://10.0.1.11:2380 \
-listen-client-urls http://10.0.1.11:2379,http://127.0.0.1:2379 \
-advertise-client-urls http://10.0.1.11:2379 \
-discovery https://myetcd.local/v2/keys/discovery/6c007a14875d53d9bf0ef5a6fc0257c817f0fb83
$ etcd -name etcd2 -initial-advertise-peer-urls http://10.0.1.12:2380 \
-listen-peer-urls http://10.0.1.12:2380 \
-listen-client-urls http://10.0.1.12:2379,http://127.0.0.1:2379 \
-advertise-client-urls http://10.0.1.12:2379 \
-discovery https://myetcd.local/v2/keys/discovery/6c007a14875d53d9bf0ef5a6fc0257c817f0fb83
測試
可以使用etcd附帶的基準 CLI工具完成基準測試etcd性能。
對于一些基準性能數(shù)字蹲诀,我們考慮具有以下硬件配置的三個成員的etcd集群:
- Google云計算引擎
- 3臺8個vCPU + 16GB內(nèi)存+ 50GB固態(tài)硬盤
- 1臺機器(客戶端)斑粱,16個vCPU + 30GB內(nèi)存+ 50GB SSD
- Ubuntu 17.04
- etcd 3.2.0,去1.8.3
有了這個配置脯爪,etcd可以大致寫出:
密鑰數(shù)量 | 密鑰大性虮薄(字節(jié)) | 值大小以字節(jié)為單位 | 連接數(shù) | 客戶數(shù)量 | 目標ETCD服務器 | 平均寫入QPS | 每個請求的平均延遲 | 平均服務器RSS |
---|---|---|---|---|---|---|---|---|
萬 | 8 | 256 | 1 | 1 | 只有領導者 | 583 | 1.6毫秒 | 48 MB |
100000 | 8 | 256 | 100 | 1000 | 只有領導者 | 44341 | 22毫秒 | 124MB |
100000 | 8 | 256 | 100 | 1000 | 所有成員 | 50104 | 20ms的 | 126MB |
示例命令是:
# write to leader
benchmark --endpoints=${HOST_1} --target-leader --conns=1 --clients=1 \
put --key-size=8 --sequential-keys --total=10000 --val-size=256
benchmark --endpoints=${HOST_1} --target-leader --conns=100 --clients=1000 \
put --key-size=8 --sequential-keys --total=100000 --val-size=256
# write to all members
benchmark --endpoints=${HOST_1},${HOST_2},${HOST_3} --conns=100 --clients=1000 \
put --key-size=8 --sequential-keys --total=100000 --val-size=256
可線性讀取請求通過集群成員的法定人數(shù)達成一致以獲取最新數(shù)據(jù)『勐可序列化的讀取請求比線性讀取要便宜尚揣,因為它們由任何單個etcd成員提供,而不是成員法定人數(shù)掖举,以換取可能的陳舊數(shù)據(jù)快骗。etcd可以閱讀:
請求數(shù) | 密鑰大小(字節(jié)) | 值大小以字節(jié)為單位 | 連接數(shù) | 客戶數(shù)量 | 一致性 | 平均讀取QPS | 每個請求的平均延遲 |
---|---|---|---|---|---|---|---|
萬 | 8 | 256 | 1 | 1 | 線性化 | 1,353 | 為0.7ms |
萬 | 8 | 256 | 1 | 1 | 序列化 | 2909 | 0.3ms的 |
100000 | 8 | 256 | 100 | 1000 | 線性化 | 141578 | 5.5ms |
100000 | 8 | 256 | 100 | 1000 | 序列化 | 185758 | 時間為2.2ms |
示例命令是:
# Single connection read requests
benchmark --endpoints=${HOST_1},${HOST_2},${HOST_3} --conns=1 --clients=1 \
range YOUR_KEY --consistency=l --total=10000
benchmark --endpoints=${HOST_1},${HOST_2},${HOST_3} --conns=1 --clients=1 \
range YOUR_KEY --consistency=s --total=10000
# Many concurrent read requests
benchmark --endpoints=${HOST_1},${HOST_2},${HOST_3} --conns=100 --clients=1000 \
range YOUR_KEY --consistency=l --total=100000
benchmark --endpoints=${HOST_1},${HOST_2},${HOST_3} --conns=100 --clients=1000 \
range YOUR_KEY --consistency=s --total=100000
我們鼓勵在新環(huán)境中首次安裝etcd集群時運行基準測試,以確保集群達到足夠的性能; 群集延遲和吞吐量可能會對較小的環(huán)境差異敏感方篮。
以上測試部分翻譯自官方文檔(https://coreos.com/etcd/docs/latest/op-guide/performance.html)
-
關于對Raft算法原理參考鏈接:
-
InfoQ:Raft 一致性算法論文譯文
http://www.infoq.com/cn/articles/raft-paper
知乎:raft算法與paxos算法相比有什么優(yōu)勢名秀,使用場景有什么差異?
https://www.zhihu.com/question/36648084
Raft算法動畫:經(jīng)典的Raft算法動畫演示鏈接
-