Elasticsearch

ES分布式架構(gòu)

ES底層是基于lucene的顿锰，核心思想是在多臺服務(wù)器上啟動多個es進程實例蛔糯，組成一個es集群
建立一個索引時，將索引拆分成多個shard幌甘，每個shard存儲部分?jǐn)?shù)據(jù)潮售，然后這個shard有多個備份，每個shard都有一個primary shard锅风，負責(zé)寫入數(shù)據(jù)饲做，但是還有幾個replica shard，每個primary shard寫入數(shù)據(jù)之后就會同步到其他幾個replica shard上去

通過這個replica的方案遏弱，每個shard有多個備份，如果某個機器宕機了塞弊，還有別的數(shù)據(jù)副本備份在其他機器漱逸，從而實現(xiàn)了高可用

es集群有多個節(jié)點，會自動選舉出一個master的節(jié)點游沿，這個master節(jié)點主要是管理維護索引元數(shù)據(jù)饰抒，負責(zé)切換primary shard和replica shard身份，如果master節(jié)點宕機了诀黍，就會重新選舉出一個節(jié)點為master袋坑；如果其他節(jié)點宕機了，就會由master節(jié)點將那臺機器的primary shard的身份轉(zhuǎn)移到其他機器的replica shard眯勾，接著如果修復(fù)了那臺機器枣宫，master節(jié)點會控制將缺失的replica shard分配過去，同步修改數(shù)據(jù)吃环，讓集群恢復(fù)正常

ES的結(jié)構(gòu)

es中存儲數(shù)據(jù)的基本單位是索引（index）也颤，索引相當(dāng)于mysql的一個數(shù)據(jù)庫，索引之后是類型（type）(mysql數(shù)據(jù)庫里的表)郁轻，一個索引可以有多個type翅娶，每個type的字段差不多文留，但是會略有一點區(qū)別；type之后是mapping竭沫，mapping代表這個type的結(jié)構(gòu)定義燥翅，每個type會有一個mapping，定義表里面有哪些字段和類型蜕提；之后是document森书，類似于mysql的一條記錄，往index的type里面插入一條數(shù)據(jù)贯溅，就是指插入一條document;每個document有多個field拄氯，每個field代表這個document的一個字段的值，類似mysql的一個字段
$index-->type-->mapping-->document-->field$

ES寫數(shù)據(jù)過程

客戶端選擇一個node發(fā)送請求它浅，這個node這時被稱作coordinating node（協(xié)調(diào)節(jié)點）译柏，coordinating node對document進行路由，將請求轉(zhuǎn)發(fā)給對應(yīng)的帶有primary shard的node姐霍，coordinating node 如果發(fā)現(xiàn)primary node和所有的replica node都寫完之后鄙麦，會返回響應(yīng)結(jié)果給客戶端

image

ES讀數(shù)據(jù)過程

可以通過doc id來查詢，會根據(jù)doc id進行hash镊折，判斷doc id被分配到那個shard上去胯府，從那個shard去查詢

客戶端發(fā)送一個請求到任意一個node，這個node這時被稱作coordinating node（協(xié)調(diào)節(jié)點）
coordinating node對doc id進行hash恨胚，并將請求轉(zhuǎn)發(fā)給對應(yīng)的node骂因，此時會使用round-robin隨機輪詢算法，在primary shard以及其所有的replica shard里面隨機選一個赃泡，讓讀請求負載均衡
接受請求的node返回document給coordinating node寒波，coordinating node 返回document給客戶端

ES搜索數(shù)據(jù)過程

客戶端發(fā)送請求到一個node，這個node這時被稱作coordinating node（協(xié)調(diào)節(jié)點）
coordinating node會將搜索請求轉(zhuǎn)發(fā)到所有的shard對應(yīng)的primary shard和replica node
query phrase:每個shard將自己的的搜索結(jié)果返回給coordinating node升熊，由coordinating node對結(jié)果進行合并俄烁，排序，分頁等级野，產(chǎn)出最終結(jié)果
fetch Phrase:coordinating node根據(jù)doc id去各個節(jié)點拉取實際的document數(shù)據(jù)页屠，最終返回給客戶端

ES寫數(shù)據(jù)底層原理

coordinating node將document路由之后，實際寫數(shù)據(jù)的primary shard會先將document寫入內(nèi)存buffer蓖柔，在buffer里的時候數(shù)據(jù)是搜索不到的辰企，同時將數(shù)據(jù)寫入translog日志文件。如果buffer快滿了况鸣，或者到一定時間蟆豫，就會將buffer數(shù)據(jù)refresh到一個新的segment file，但是此時數(shù)據(jù)不是直接進入segment file磁盤文件懒闷，而是先進入os cache十减。
每隔1s栈幸，es將buffer寫入一個新的segment file，每秒鐘會產(chǎn)生一個新的磁盤文件segment file帮辟，這個segment file就存儲著最近1s內(nèi)buffer寫入的數(shù)據(jù)
如果buffer沒有數(shù)據(jù)速址，不會執(zhí)行refresh操作；如果有由驹，默認(rèn)是1s1次refresh
只要buffer被寫進了os cache芍锚，就可以被檢索到，所以寫入的數(shù)據(jù)默認(rèn)是1s后能看到蔓榄，所以es被稱作準(zhǔn)實時的
當(dāng)重復(fù)上述步驟時并炮，translog會越來越大，當(dāng)translog大到一定長度時甥郑，就會觸發(fā)commit操作
- commit第一步逃魄，會將buffer數(shù)據(jù)refresh到os cache中去，然后清空buffer澜搅，然后將一個commit point寫入磁盤伍俘，里面標(biāo)識著這個commit point對應(yīng)的所有的segment file
- 同時強行將os cache中的數(shù)據(jù)fsync到磁盤文件中去
- 最后清空translog日志，重啟一個translog
- 這個commit叫flush勉躺，默認(rèn)是30分鐘一次
  translog:在執(zhí)行commit之前癌瘾，數(shù)據(jù)要么在buffer，要么在os cache饵溅，都屬于內(nèi)存區(qū)域妨退，一旦機器宕機，數(shù)據(jù)就會丟失蜕企，所以translog日志能夠幫助在宕機的時候恢復(fù)數(shù)據(jù)
  translog其實也是先寫入 os cache 的咬荷，默認(rèn)每隔5秒刷一次到磁盤中去，所以默認(rèn)情況下糖赔，可能有 5 秒的數(shù)據(jù)會僅僅停留在 buffer 或者 translog 文件的 os cache 中，如果此時機器掛了轩端，會丟失 5 秒鐘的數(shù)據(jù)放典。

刪除/更新底層原理

如果是刪除操作，commit的時候會生成一個.del文件基茵，里面將某個doc標(biāo)識為deleted狀態(tài)奋构，那么搜索的時候根據(jù).del文件就知道這個doc被刪除了
如果是更新操作，就是將原來的doc標(biāo)識為deleted狀態(tài)拱层，然后重新寫入一條數(shù)據(jù)

buffer 每次 refresh 一次弥臼，就會產(chǎn)生一個 segment file，所以默認(rèn)情況下是 1 秒鐘一個 segment file根灯，這樣下來 segment file會越來越多径缅，此時會定期執(zhí)行merge掺栅。每次merge的時候，會將多個segment file合并成一個纳猪，同時這里會將標(biāo)識為deleted的doc給物理刪除掉氧卧，然后將新的segment file寫入磁盤，這里會寫一個commit point氏堤，標(biāo)識所有新的segment file沙绝，然后打開 segment file供搜索使用，同時刪除舊的segment file鼠锈。

倒排索引

在搜索引擎中闪檬，每個文檔都有一個對應(yīng)的文檔ID，文檔內(nèi)容被表示為一系列關(guān)鍵詞的集合
倒排索引就是關(guān)鍵詞到文檔ID的映射购笆，每個關(guān)鍵詞都對應(yīng)這一系列的文件粗悯，這些文件中都出現(xiàn)了關(guān)鍵詞

DocID	Doc
1	谷歌地圖之父跳槽 Facebook
2	谷歌地圖之父加盟 Facebook
3	谷歌地圖創(chuàng)始人拉斯離開谷歌加盟 Facebook
4	谷歌地圖之父跳槽 Facebook 與 Wave 項目取消有關(guān)
5	谷歌地圖之父拉斯加盟社交網(wǎng)站 Facebook

對文檔進行分詞之后，得到以下倒排索引

WordId	Word	DocIds
1	谷歌	1由桌，2为黎，3，4行您，5
2	地圖	1铭乾，2，3娃循，4炕檩，5
3	之父	1，2捌斧，4笛质，5
4	跳槽	1，4
5	Facebook	1捞蚂，2妇押，3，4姓迅，5
6	加盟	2敲霍，3，5
7	創(chuàng)始人	3
8	拉斯	3丁存，5
9	離開	3
10	與	4
..	..	..

另外肩杈，實用的倒排索引還可以記錄更多的信息，比如文檔頻率信息解寝，表示在文檔集合中有多少個文檔包含某個單詞扩然。

那么，有了倒排索引聋伦，搜索引擎可以很方便地響應(yīng)用戶的查詢夫偶。比如用戶輸入查詢 Facebook界睁，搜索系統(tǒng)查找倒排索引，從中讀出包含這個單詞的文檔索守，這些文檔就是提供給用戶的搜索結(jié)果晕窑。

最后編輯于：2019.08.17 16:06:45

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市卵佛，隨后出現(xiàn)的幾起案子杨赤，更是在濱河造成了極大的恐慌，老刑警劉巖截汪，帶你破解...
沈念sama閱讀 206,968評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件疾牲，死亡現(xiàn)場離奇詭異，居然都是意外死亡衙解，警方通過查閱死者的電腦和手機阳柔，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,601評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來蚓峦，“玉大人舌剂，你說我怎么就攤上這事∈钜” “怎么了霍转？”我有些...
開封第一講書人閱讀 153,220評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長一汽。經(jīng)常有香客問我避消，道長，這世上最難降的妖魔是什么召夹？我笑而不...
開封第一講書人閱讀 55,416評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任岩喷，我火速辦了婚禮，結(jié)果婚禮上监憎，老公的妹妹穿的比我還像新娘纱意。我一直安慰自己，他們只是感情好鲸阔，可當(dāng)我...
茶點故事閱讀 64,425評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布偷霉。她就那樣靜靜地躺著，像睡著了一般隶债。火紅的嫁衣襯著肌膚如雪腾它。梳的紋絲不亂的頭發(fā)上跑筝，一...
開封第一講書人閱讀 49,144評論 1贊 285
城市分裂傳說
那天死讹，我揣著相機與錄音，去河邊找鬼曲梗。笑死赞警，一個胖子當(dāng)著我的面吹牛妓忍，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播愧旦，決...
沈念sama閱讀 38,432評論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼世剖，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了笤虫？” 一聲冷哼從身側(cè)響起旁瘫，我...
開封第一講書人閱讀 37,088評論 0贊 261
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎琼蚯，沒想到半個月后酬凳，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,586評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡遭庶，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,028評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年宁仔，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片峦睡。...
茶點故事閱讀 38,137評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡翎苫，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出榨了，到底是詐尸還是另有隱情煎谍，我是刑警寧澤，帶...
沈念sama閱讀 33,783評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布阻逮，位于F島的核電站粱快，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏叔扼。R本人自食惡果不足惜事哭，卻給世界環(huán)境...
茶點故事閱讀 39,343評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望瓜富。院中可真熱鬧鳍咱，春花似錦、人聲如沸与柑。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,333評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽价捧。三九已至丑念，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間结蟋，已是汗流浹背脯倚。一陣腳步聲響...
開封第一講書人閱讀 31,559評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人推正。一個月前我還...
沈念sama閱讀 45,595評論 2贊 355
代替公主和親
正文我出身青樓恍涂，卻偏偏與公主長得像，于是被迫代替她去往敵國和親植榕。傳聞我的和親對象是個殘疾皇子再沧，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 42,901評論 2贊 345