1苍柏、在三個節(jié)點上都下載es
如果要安裝es,首先就要從官網(wǎng)下載es的linux安裝包姜贡,并且最新es版本要求有JDK 8以上的版本试吁,將下載的包解壓后即可。
2楼咳、zen discovery集群發(fā)現(xiàn)機制
zen discovery機制提供了unicast discovery集群發(fā)現(xiàn)機制熄捍,集群發(fā)現(xiàn)時的節(jié)點間通信是依賴的transport module烛恤,也就是es底層的網(wǎng)絡(luò)通信模塊和協(xié)議。
es默認(rèn)配置為使用unicast集群發(fā)現(xiàn)機制,還有multicast機制
你會在多臺機器上治唤,每臺機器部署一個es進程棒动,每臺機器都啟動一個es進程,你怎么讓多臺機器上的多個es進程宾添,互相發(fā)現(xiàn)對方船惨,然后完美的組成一個生產(chǎn)環(huán)境的es集群呢?缕陕?粱锐?。扛邑。怜浅。。
默認(rèn)情況下蔬崩,es進程會綁定在自己的回環(huán)地址上恶座,也就是127.0.0.1,然后掃描本機上的9300~9305端口號沥阳,嘗試跟那些端口上啟動的其他es進程進行通信跨琳,然后組成一個集群。這對于在本機上搭建es集群的開發(fā)環(huán)境是很方便的桐罕。但是對于生產(chǎn)環(huán)境下的集群是不行的脉让,需要將每臺es進程綁定在一個非回環(huán)的ip地址上,才能跟其他節(jié)點進行通信功炮,同時需要使用集群發(fā)現(xiàn)機制來跟其他節(jié)點上的es node進行通信溅潜。
我們?nèi)绻趙indows上自己玩兒的話,你直接啟動多個es進程薪伏,他們自己就會組成一個集群滚澜,在生產(chǎn)環(huán)境中的多臺機器上部署es集群,各個節(jié)點互相發(fā)現(xiàn)然后組成一個集群的機制毅该,同時也負責(zé)es集群的master選舉
(1)master node和data node兩種角色
client不只跟master通信博秫,而是client跟任何一個node進行通信,node再將請求轉(zhuǎn)發(fā)給對應(yīng)的node來進行執(zhí)行眶掌。正常情況下挡育,就只有一個master node。
master node的責(zé)任: 就是負責(zé)維護整個集群的狀態(tài)信息朴爬,也就是一些集群元數(shù)據(jù)信息即寒,同時在node加入集群或者從集群中下線時,重新分配shard,或者是創(chuàng)建或刪除了一個索引母赵。包括每次cluster state如果有改變的化逸爵,那么master都會負責(zé)將集群狀態(tài)同步給所有的node。
master node負責(zé)接收所有的cluster state相關(guān)的變化信息凹嘲,然后將這個改變后的最新的cluster state推動給集群中所有的data node师倔,集群中所有的node都有一份完整的cluster state。只不過master node負責(zé)維護而已周蹭。其他的node趋艘,除了master之外的node,就是負責(zé)數(shù)據(jù)的存儲和讀寫的凶朗,寫入索引歹啼,搜索數(shù)據(jù)亚铁,data node棕硫。
如果要讓多個node組成一個es集群戚啥,首先第一個要設(shè)置的參數(shù),就是cluster.name宛畦,多個node的cluster.name如果一樣瘸洛,才滿足組成一個集群的基本條件。
這個cluster.name的默認(rèn)值是elasticsearch次和,在生產(chǎn)環(huán)境中货矮,一定要修改這個值,否則可能會導(dǎo)致未知的node無端加入集群斯够,造成集群運行異常。
(2)master node喧锦、data node读规、network.host
你配置的時候,是配置多個node變成master eligible node燃少,但是只是說束亏,從這些master eligible node選舉一個node出來作為master node,其他master eligible node只是接下來有那個master node故障的時候阵具,接替他的資格碍遍,但是還是作為data node去使用的一般建議master eligible node給3個即可:node.master: true,node.data: false
剩下的node都設(shè)置為data node:node.master: false阳液,node.data: true
但是如果一個小集群怕敬,就10個以內(nèi)的節(jié)點,那就所有節(jié)點都可以作為master eligible node以及data node即可帘皿,超過10個node的集群再單獨拆分master和data node吧
小集群master eligible node东跪,同時也是data node
(3)ping
ping是一個node用discovery機制來發(fā)現(xiàn)其他node的一個過程
(4)unicast
unicast discovery集群發(fā)現(xiàn)機制是要求配置一個主機列表,用來作為gossip(流言式)通信協(xié)議的路由器。這些機器如果通過hostname來指定虽填,那么在ping的時候會被解析為ip地址丁恭。unicast discovery機制最重要的兩個配置如下所示:
iscovery.zen.ping.unicast.hosts: ["host1", "host2"] 用逗號分割的主機列表
hosts.resolve_timeout:60s hostName被DNS解析為ip地址的timeout等待時長
cluster.name:cluster_name
node.name:cluster_node1
network.host:192.168.1.113
(1)已經(jīng)初步配置好了,各個節(jié)點斋日,首先通過network.host綁定到了非回環(huán)的ip地址牲览,從而可以跟其他節(jié)點通信
(2)通過discovery.zen.ping.unicast.hosts配置了一批unicast中間路由的node
(3)所有node都可以發(fā)送ping消息到路由node,再從路由node獲取cluster state回來
(4)接著所有node會選舉出一個master
(5)所有node都會跟master進行通信恶守,然后加入master的集群
(6)要求cluster.name必須一樣第献,才能組成一個集群
(7)node.name就標(biāo)識出了每個node我們自己設(shè)置的一個名稱
(5)master選舉
在ping發(fā)現(xiàn)過程中,為集群選舉出一個master也是很重要的熬的,es集群會自動完成這個操作痊硕。這里建議設(shè)置discovery.zen.ping_timeout參數(shù)(默認(rèn)是3s),如果因為網(wǎng)絡(luò)慢或者擁塞押框,導(dǎo)致master選舉超時岔绸,那么可以增加這個參數(shù),確保集群啟動的穩(wěn)定性橡伞。
在完成一個集群的master選舉之后盒揉,每次一個新的node加入集群,都會發(fā)送一個join request到master node兑徘,可以設(shè)置discovery.zen.join_timeout保證node穩(wěn)定加入集群刚盈,增加join的timeout等待時長,如果一次join不上挂脑,默認(rèn)會重試20次藕漱。
如果master node被停止了,或者自己宕機了崭闲,那么集群中的node會再次進行一次ping過程肋联,并且選舉出一個新的master。
如果discovery.zen.master_election.ignore_non_master_pings設(shè)置為了true刁俭,那么會強制區(qū)分master候選節(jié)點橄仍,如果node的node.master設(shè)置為了false,還來發(fā)送ping請求參與master選舉牍戚,那么這些node會被忽略掉侮繁,因為他們沒有資格參與。
discovery.zen.minimum_master_nodes參數(shù)用于設(shè)置對于一個新選舉的master如孝,要求必須有多少個master候選node去連接那個新選舉的master宪哩。而且還用于設(shè)置一個集群中必須擁有的master候選node。如果這些要求沒有被滿足暑竟,那么master node就會被停止斋射,然后會重新選舉一個新的master育勺。這個參數(shù)必須設(shè)置為我們的master候選node的quorum數(shù)量。一般避免說只有兩個master候選node罗岖,因為2的quorum還是2涧至。如果在那個情況下,任何一個master候選節(jié)點宕機了桑包,集群就無法正常運作了南蓬。
(6)集群故障的探查
es有兩種集群故障探查機制,第一種是通過master進行的哑了,master會ping集群中所有的其他node赘方,確保它們是否是存活著的。第二種弱左,每個node都會去ping master node來確保master node是存活的窄陡,否則就會發(fā)起一個選舉過程。
有下面三個參數(shù)用來配置集群故障的探查過程:
ping_interval:每隔多長時間會ping一次node拆火,默認(rèn)是1s
ping_timeout:每次ping的timeout等待時長是多長時間跳夭,默認(rèn)是30s
ping_retries:如果一個node被ping多少次都失敗了,就會認(rèn)為node故障们镜,默認(rèn)是3次
(7)集群狀態(tài)更新
master node是集群中唯一一個可以對cluster state進行更新的node币叹。master node每次會處理一個集群狀態(tài)的更新事件,應(yīng)用這次狀態(tài)更新模狭,然后將更新后的狀態(tài)發(fā)布到集群中所有的node上去颈抚。每個node都會接收publish message,ack這個message嚼鹉,但是不會應(yīng)用這個更新贩汉。如果master沒有在discovery.zen.commit_timeout指定的時間內(nèi)(默認(rèn)是30s),從至少discovery.zen.minimum_master_nodes個節(jié)點獲取ack響應(yīng)锚赤,那么這次cluster state change事件就會被reject雾鬼,不會應(yīng)用。
但是一旦在指定時間內(nèi)宴树,指定數(shù)量的node都返回了ack消息,那么cluster state就會被commit晶疼,然后一個message會被發(fā)送給所有的node酒贬。所有的node接收到那個commit message之后,接著才會將之前接收到的集群狀態(tài)應(yīng)用到自己本地的狀態(tài)副本中去翠霍。接著master會等待所有節(jié)點再次響應(yīng)是否更新自己本地副本狀態(tài)成功锭吨,在一個等待超時時長內(nèi),如果接收到了響應(yīng)寒匙,那么就會繼續(xù)處理內(nèi)存queue中保存的下一個更新狀態(tài)零如。discovery.zen.publish_timeout默認(rèn)是30s躏将,這個超時等待時長是從plublish cluster state開始計算的。
(8)master宕機阻塞集群操作
如果要讓集群正常運轉(zhuǎn)考蕾,那么必須有一個master祸憋,還有discovery.zen.minimum_master_nodes指定數(shù)量的master候選node,都在運行肖卧。discovery.zen.no_master_block可以控制當(dāng)master宕機時蚯窥,什么樣的操作應(yīng)該被拒絕。有下面兩個選項:
all:一旦master宕機塞帐,那么所有的操作都會被拒絕
write:這是默認(rèn)的選項拦赠,所有的寫操作都會被拒絕,但是讀操作是被允許的
3葵姥、生產(chǎn)集群部署之必須根據(jù)自己的集群設(shè)置的一些重要參數(shù)
(1)荷鼠、集群名和節(jié)點名
cluster.name,node.name
(2)榔幸、文件路徑
將重要的日志及配置文件放入到指定的目錄中允乐,避免升級的時候補刪除
path.logs: /var/log/elasticsearch
path.data: /var/data/elasticsearch
path.plugins: /var/plugin/elasticsearch
config:/etc/elasticsearch
es有兩個配置文件,elasticsearch.yml牡辽,用于配置es喳篇,還有一個log4j.properties用來配置es日志打印。這些文件都被放在config目錄下态辛,默認(rèn)就是ES_HOME/config麸澜。可以通過下面的命令來重新設(shè)置:./bin/elasticsearch -Epath.conf=/path/to/my/config/奏黑。
(3)炊邦、日志配置
es使用log4j2來記錄日志,log4j2可以通過log4j2.properties文件來進行配置熟史。比如下面的這份配置文件:
appender.rolling.type = RollingFile
appender.rolling.name = rolling
appender.rolling.fileName = ${sys:es.logs.base_path}${sys:file.separator}${sys:es.logs.cluster_name}.log
appender.rolling.layout.type = PatternLayout
appender.rolling.layout.pattern = [%d{ISO8601}][%-5p][%-25c] %.10000m%n
appender.rolling.filePattern = ${sys:es.logs.base_path}${sys:file.separator}${sys:es.logs.cluster_name}-%d{yyyy-MM-dd}.log
appender.rolling.policies.type = Policies
appender.rolling.policies.time.type = TimeBasedTriggeringPolicy
appender.rolling.policies.time.interval = 1
appender.rolling.policies.time.modulate = true
appender.rolling.type = RollingFile馁害,就配置了appender類型是RollingFile
appender.rolling.fileName = {sys:file.separator}${sys:es.logs.cluster_name}.log,就配置了日志路徑是/var/log/elasticsearch/production.log
appender.rolling.filePattern = {sys:file.separator}${sys:es.logs.cluster_name}-%d{yyyy-MM-dd}.log蹂匹,就配置了將日志每天寫一份到/var/log/elasticsearch/production-2017-01-01.log文件中
appender.rolling.policies.time.type = TimeBasedTriggeringPolic碘菜,這里配置了用基于時間的roll策略
appender.rolling.policies.time.interval = 1,這個設(shè)置了每天一份日志文件
appender.rolling.policies.time.modulate = true限寞,這個設(shè)置了根據(jù)自然天來劃分文件忍啸,而不是24小時
還可以配置將日志文件保留一段時間內(nèi),同時刪除之前的日志文件
appender.rolling.strategy.type = DefaultRolloverStrategy
appender.rolling.strategy.action.type = Delete
appender.rolling.strategy.action.basepath = ${sys:es.logs.base_path}
appender.rolling.strategy.action.condition.type = IfLastModified
appender.rolling.strategy.action.condition.age = 7D
appender.rolling.strategy.action.PathConditions.type = IfFileName
appender.rolling.strategy.action.PathConditions.glob = ${sys:es.logs.cluster_name}-*
第一行是配置了默認(rèn)的DefaultRolloverStrategy
第二行是配置了Delete action履植,在rollover之后计雌,就會刪除文件
第三行是配置了es log的基礎(chǔ)路徑
第四行是配置了rollover發(fā)生的條件,是基于IfLastModified
第五行是配置了保留的天數(shù)玫霎,這里是7天
第六行是配置了刪除匹配7天前的文件
第七行是配置了一個刪除文件的格式凿滤,這樣就只是刪除過期日志文件妈橄,但是不要刪除慢查詢?nèi)罩?/p>