三十一库正、 Elasticsearch集群搭建部署及配置

1苍柏、在三個節(jié)點上都下載es
如果要安裝es，首先就要從官網(wǎng)下載es的linux安裝包姜贡，并且最新es版本要求有JDK 8以上的版本试吁，將下載的包解壓后即可。

2楼咳、zen discovery集群發(fā)現(xiàn)機制
zen discovery機制提供了unicast discovery集群發(fā)現(xiàn)機制熄捍，集群發(fā)現(xiàn)時的節(jié)點間通信是依賴的transport module烛恤，也就是es底層的網(wǎng)絡(luò)通信模塊和協(xié)議。

es默認(rèn)配置為使用unicast集群發(fā)現(xiàn)機制,還有multicast機制

你會在多臺機器上治唤，每臺機器部署一個es進程棒动，每臺機器都啟動一個es進程，你怎么讓多臺機器上的多個es進程宾添，互相發(fā)現(xiàn)對方船惨，然后完美的組成一個生產(chǎn)環(huán)境的es集群呢？缕陕？粱锐？。扛邑。怜浅。。

默認(rèn)情況下蔬崩，es進程會綁定在自己的回環(huán)地址上恶座，也就是127.0.0.1，然后掃描本機上的9300~9305端口號沥阳，嘗試跟那些端口上啟動的其他es進程進行通信跨琳，然后組成一個集群。這對于在本機上搭建es集群的開發(fā)環(huán)境是很方便的桐罕。但是對于生產(chǎn)環(huán)境下的集群是不行的脉让，需要將每臺es進程綁定在一個非回環(huán)的ip地址上，才能跟其他節(jié)點進行通信功炮，同時需要使用集群發(fā)現(xiàn)機制來跟其他節(jié)點上的es node進行通信溅潜。

我們?nèi)绻趙indows上自己玩兒的話，你直接啟動多個es進程薪伏，他們自己就會組成一個集群滚澜，在生產(chǎn)環(huán)境中的多臺機器上部署es集群，各個節(jié)點互相發(fā)現(xiàn)然后組成一個集群的機制毅该，同時也負責(zé)es集群的master選舉

（1）master node和data node兩種角色
client不只跟master通信博秫，而是client跟任何一個node進行通信，node再將請求轉(zhuǎn)發(fā)給對應(yīng)的node來進行執(zhí)行眶掌。正常情況下挡育，就只有一個master node。

master node的責(zé)任：就是負責(zé)維護整個集群的狀態(tài)信息朴爬，也就是一些集群元數(shù)據(jù)信息即寒，同時在node加入集群或者從集群中下線時，重新分配shard，或者是創(chuàng)建或刪除了一個索引母赵。包括每次cluster state如果有改變的化逸爵，那么master都會負責(zé)將集群狀態(tài)同步給所有的node。
master node負責(zé)接收所有的cluster state相關(guān)的變化信息凹嘲，然后將這個改變后的最新的cluster state推動給集群中所有的data node师倔，集群中所有的node都有一份完整的cluster state。只不過master node負責(zé)維護而已周蹭。其他的node趋艘，除了master之外的node，就是負責(zé)數(shù)據(jù)的存儲和讀寫的凶朗，寫入索引歹啼，搜索數(shù)據(jù)亚铁，data node棕硫。

如果要讓多個node組成一個es集群戚啥，首先第一個要設(shè)置的參數(shù)，就是cluster.name宛畦，多個node的cluster.name如果一樣瘸洛，才滿足組成一個集群的基本條件。
這個cluster.name的默認(rèn)值是elasticsearch次和，在生產(chǎn)環(huán)境中货矮，一定要修改這個值，否則可能會導(dǎo)致未知的node無端加入集群斯够，造成集群運行異常。

（2）master node喧锦、data node读规、network.host
你配置的時候，是配置多個node變成master eligible node燃少，但是只是說束亏，從這些master eligible node選舉一個node出來作為master node，其他master eligible node只是接下來有那個master node故障的時候阵具，接替他的資格碍遍，但是還是作為data node去使用的一般建議master eligible node給3個即可：node.master: true，node.data: false
剩下的node都設(shè)置為data node：node.master: false阳液，node.data: true
但是如果一個小集群怕敬，就10個以內(nèi)的節(jié)點，那就所有節(jié)點都可以作為master eligible node以及data node即可帘皿，超過10個node的集群再單獨拆分master和data node吧
小集群master eligible node东跪，同時也是data node

（3）ping
ping是一個node用discovery機制來發(fā)現(xiàn)其他node的一個過程
（4）unicast
unicast discovery集群發(fā)現(xiàn)機制是要求配置一個主機列表，用來作為gossip（流言式）通信協(xié)議的路由器。這些機器如果通過hostname來指定虽填，那么在ping的時候會被解析為ip地址丁恭。unicast discovery機制最重要的兩個配置如下所示：

iscovery.zen.ping.unicast.hosts: ["host1", "host2"] 用逗號分割的主機列表
hosts.resolve_timeout：60s hostName被DNS解析為ip地址的timeout等待時長
cluster.name：cluster_name
node.name:cluster_node1
network.host:192.168.1.113

（1）已經(jīng)初步配置好了，各個節(jié)點斋日，首先通過network.host綁定到了非回環(huán)的ip地址牲览，從而可以跟其他節(jié)點通信
（2）通過discovery.zen.ping.unicast.hosts配置了一批unicast中間路由的node
（3）所有node都可以發(fā)送ping消息到路由node，再從路由node獲取cluster state回來
（4）接著所有node會選舉出一個master
（5）所有node都會跟master進行通信恶守，然后加入master的集群
（6）要求cluster.name必須一樣第献，才能組成一個集群
（7）node.name就標(biāo)識出了每個node我們自己設(shè)置的一個名稱

（5）master選舉

在ping發(fā)現(xiàn)過程中，為集群選舉出一個master也是很重要的熬的，es集群會自動完成這個操作痊硕。這里建議設(shè)置discovery.zen.ping_timeout參數(shù)（默認(rèn)是3s），如果因為網(wǎng)絡(luò)慢或者擁塞押框，導(dǎo)致master選舉超時岔绸，那么可以增加這個參數(shù)，確保集群啟動的穩(wěn)定性橡伞。

在完成一個集群的master選舉之后盒揉，每次一個新的node加入集群，都會發(fā)送一個join request到master node兑徘，可以設(shè)置discovery.zen.join_timeout保證node穩(wěn)定加入集群刚盈，增加join的timeout等待時長，如果一次join不上挂脑，默認(rèn)會重試20次藕漱。
如果master node被停止了，或者自己宕機了崭闲，那么集群中的node會再次進行一次ping過程肋联，并且選舉出一個新的master。
如果discovery.zen.master_election.ignore_non_master_pings設(shè)置為了true刁俭，那么會強制區(qū)分master候選節(jié)點橄仍，如果node的node.master設(shè)置為了false，還來發(fā)送ping請求參與master選舉牍戚，那么這些node會被忽略掉侮繁，因為他們沒有資格參與。

discovery.zen.minimum_master_nodes參數(shù)用于設(shè)置對于一個新選舉的master如孝，要求必須有多少個master候選node去連接那個新選舉的master宪哩。而且還用于設(shè)置一個集群中必須擁有的master候選node。如果這些要求沒有被滿足暑竟，那么master node就會被停止斋射，然后會重新選舉一個新的master育勺。這個參數(shù)必須設(shè)置為我們的master候選node的quorum數(shù)量。一般避免說只有兩個master候選node罗岖，因為2的quorum還是2涧至。如果在那個情況下，任何一個master候選節(jié)點宕機了桑包，集群就無法正常運作了南蓬。

（6）集群故障的探查

es有兩種集群故障探查機制，第一種是通過master進行的哑了，master會ping集群中所有的其他node赘方，確保它們是否是存活著的。第二種弱左，每個node都會去ping master node來確保master node是存活的窄陡，否則就會發(fā)起一個選舉過程。

有下面三個參數(shù)用來配置集群故障的探查過程：

ping_interval：每隔多長時間會ping一次node拆火，默認(rèn)是1s
ping_timeout：每次ping的timeout等待時長是多長時間跳夭，默認(rèn)是30s
ping_retries：如果一個node被ping多少次都失敗了，就會認(rèn)為node故障们镜，默認(rèn)是3次

（7）集群狀態(tài)更新

master node是集群中唯一一個可以對cluster state進行更新的node币叹。master node每次會處理一個集群狀態(tài)的更新事件，應(yīng)用這次狀態(tài)更新模狭，然后將更新后的狀態(tài)發(fā)布到集群中所有的node上去颈抚。每個node都會接收publish message，ack這個message嚼鹉，但是不會應(yīng)用這個更新贩汉。如果master沒有在discovery.zen.commit_timeout指定的時間內(nèi)（默認(rèn)是30s），從至少discovery.zen.minimum_master_nodes個節(jié)點獲取ack響應(yīng)锚赤，那么這次cluster state change事件就會被reject雾鬼，不會應(yīng)用。

但是一旦在指定時間內(nèi)宴树，指定數(shù)量的node都返回了ack消息，那么cluster state就會被commit晶疼，然后一個message會被發(fā)送給所有的node酒贬。所有的node接收到那個commit message之后，接著才會將之前接收到的集群狀態(tài)應(yīng)用到自己本地的狀態(tài)副本中去翠霍。接著master會等待所有節(jié)點再次響應(yīng)是否更新自己本地副本狀態(tài)成功锭吨，在一個等待超時時長內(nèi)，如果接收到了響應(yīng)寒匙，那么就會繼續(xù)處理內(nèi)存queue中保存的下一個更新狀態(tài)零如。discovery.zen.publish_timeout默認(rèn)是30s躏将，這個超時等待時長是從plublish cluster state開始計算的。

（8）master宕機阻塞集群操作

如果要讓集群正常運轉(zhuǎn)考蕾，那么必須有一個master祸憋，還有discovery.zen.minimum_master_nodes指定數(shù)量的master候選node，都在運行肖卧。discovery.zen.no_master_block可以控制當(dāng)master宕機時蚯窥，什么樣的操作應(yīng)該被拒絕。有下面兩個選項：
all：一旦master宕機塞帐，那么所有的操作都會被拒絕
write：這是默認(rèn)的選項拦赠，所有的寫操作都會被拒絕，但是讀操作是被允許的
3葵姥、生產(chǎn)集群部署之必須根據(jù)自己的集群設(shè)置的一些重要參數(shù)
（1）荷鼠、集群名和節(jié)點名
cluster.name，node.name
（2）榔幸、文件路徑
將重要的日志及配置文件放入到指定的目錄中允乐，避免升級的時候補刪除
path.logs: /var/log/elasticsearch
path.data: /var/data/elasticsearch
path.plugins: /var/plugin/elasticsearch
config：/etc/elasticsearch
es有兩個配置文件，elasticsearch.yml牡辽，用于配置es喳篇，還有一個log4j.properties用來配置es日志打印。這些文件都被放在config目錄下态辛，默認(rèn)就是ES_HOME/config麸澜。可以通過下面的命令來重新設(shè)置：./bin/elasticsearch -Epath.conf=/path/to/my/config/奏黑。
（3）炊邦、日志配置

es使用log4j2來記錄日志，log4j2可以通過log4j2.properties文件來進行配置熟史。比如下面的這份配置文件：

appender.rolling.type = RollingFile 
appender.rolling.name = rolling
appender.rolling.fileName = ${sys:es.logs.base_path}${sys:file.separator}${sys:es.logs.cluster_name}.log 
appender.rolling.layout.type = PatternLayout
appender.rolling.layout.pattern = [%d{ISO8601}][%-5p][%-25c] %.10000m%n
appender.rolling.filePattern = ${sys:es.logs.base_path}${sys:file.separator}${sys:es.logs.cluster_name}-%d{yyyy-MM-dd}.log 
appender.rolling.policies.type = Policies
appender.rolling.policies.time.type = TimeBasedTriggeringPolicy 
appender.rolling.policies.time.interval = 1 
appender.rolling.policies.time.modulate = true 

appender.rolling.type = RollingFile馁害，就配置了appender類型是RollingFile

appender.rolling.fileName = ${sys:es.logs.base_path}$ {sys:file.separator}${sys:es.logs.cluster_name}.log，就配置了日志路徑是/var/log/elasticsearch/production.log

appender.rolling.filePattern = ${sys:es.logs.base_path}$ {sys:file.separator}${sys:es.logs.cluster_name}-%d{yyyy-MM-dd}.log蹂匹，就配置了將日志每天寫一份到/var/log/elasticsearch/production-2017-01-01.log文件中

appender.rolling.policies.time.type = TimeBasedTriggeringPolic碘菜，這里配置了用基于時間的roll策略

appender.rolling.policies.time.interval = 1，這個設(shè)置了每天一份日志文件

appender.rolling.policies.time.modulate = true限寞，這個設(shè)置了根據(jù)自然天來劃分文件忍啸，而不是24小時

還可以配置將日志文件保留一段時間內(nèi)，同時刪除之前的日志文件

appender.rolling.strategy.type = DefaultRolloverStrategy 
appender.rolling.strategy.action.type = Delete 
appender.rolling.strategy.action.basepath = ${sys:es.logs.base_path} 
appender.rolling.strategy.action.condition.type = IfLastModified 
appender.rolling.strategy.action.condition.age = 7D 
appender.rolling.strategy.action.PathConditions.type = IfFileName 
appender.rolling.strategy.action.PathConditions.glob = ${sys:es.logs.cluster_name}-*

第一行是配置了默認(rèn)的DefaultRolloverStrategy
第二行是配置了Delete action履植，在rollover之后计雌，就會刪除文件
第三行是配置了es log的基礎(chǔ)路徑
第四行是配置了rollover發(fā)生的條件，是基于IfLastModified
第五行是配置了保留的天數(shù)玫霎，這里是7天
第六行是配置了刪除匹配7天前的文件
第七行是配置了一個刪除文件的格式凿滤，這樣就只是刪除過期日志文件妈橄，但是不要刪除慢查詢?nèi)罩?/p>

三十一、 Elasticsearch集群搭建部署及配置

三十一骏全、 Elasticsearch集群搭建部署及配置