elasticsearch 性能調(diào)優(yōu)（二）

關(guān)于Lucene：

????????Apache Lucene將寫入索引的所有信息組織成一種倒排索引（Inverted Index）的結(jié)構(gòu)之中家妆，該結(jié)構(gòu)是種將詞項映射到文檔的數(shù)據(jù)結(jié)構(gòu)沉衣。其工作方式與傳統(tǒng)的關(guān)系數(shù)據(jù)庫不同毅待，大致來說倒排索引是面向詞項而不是面向文檔的妒挎。且Lucene索引之中還存儲了很多其他的信息，如詞向量等等捶索，每個Lucene都是由多個段構(gòu)成的，每個段只會被創(chuàng)建一次但會被查詢多次董朝，段一旦創(chuàng)建就不會再被修改鸠项。多個段會在段合并的階段合并在一起，何時合并由Lucene的內(nèi)在機(jī)制決定子姜，段合并后數(shù)量會變少祟绊，但是相應(yīng)的段本身會變大。段合并的過程是非常消耗I/O的闲询，且與之同時會有些不再使用的信息被清理掉久免。在Lucene中浅辙，將數(shù)據(jù)轉(zhuǎn)化為倒排索引扭弧，將完整串轉(zhuǎn)化為可用于搜索的詞項的過程叫做分析。文本分析由分析器（Analyzer）來執(zhí)行记舆，分析其由分詞器（Tokenizer）鸽捻，過濾器（Filter）和字符映射器（Character Mapper）組成，其各個功能顯而易見泽腮。除此之外御蒲，Lucene有自己的一套完整的查詢語言來幫助我們進(jìn)行搜索和讀寫。

ElasticSearch诊赊，ES的架構(gòu)遵循的設(shè)計理念有以下幾個特征：

1.?合理的默認(rèn)配置：只需修改節(jié)點中的Yaml配置文件厚满，就可以迅捷配置。這和Spring4中對配置的簡化有相似的地方碧磅。

2.?分布式工作模式：ES強大的Zen發(fā)現(xiàn)機(jī)制不僅支持組廣播也支持點單播碘箍，且有“知一點即知天下”之妙。

3.?對等架構(gòu)：節(jié)點之間自動備份分片鲸郊，且使分片本身和樣本之間盡量”遠(yuǎn)離“丰榴，可以避免單點故障。且Master節(jié)點和Data節(jié)點幾乎完全等價秆撮。

4.?易于向集群擴(kuò)充新節(jié)點：大大簡化研發(fā)或運維將新節(jié)點加入集群所需的工作四濒。

5.?不對索引中的數(shù)據(jù)結(jié)構(gòu)增加任何限制：ES支持在一個索引之中存在多種數(shù)據(jù)類型。

6.?準(zhǔn)實時：搜索和版本同步职辨，由于ES是分布式應(yīng)用盗蟆，一個重大的挑戰(zhàn)就是一致性問題，無論索引還是文檔數(shù)據(jù)舒裤，然而事實證明ES表現(xiàn)優(yōu)秀姆涩。

（一）分片策略

選擇合適的分片數(shù)和副本數(shù)。ES的分片分為兩種惭每，主分片（Primary Shard）和副本（Replicas）骨饿。默認(rèn)情況下亏栈，ES會為每個索引創(chuàng)建5個分片，即使是在單機(jī)環(huán)境下宏赘，這種冗余被稱作過度分配（Over Allocation）绒北，目前看來這么做完全沒有必要，僅在散布文檔到分片和處理查詢的過程中就增加了更多的復(fù)雜性察署，好在ES的優(yōu)秀性能掩蓋了這一點闷游。假設(shè)一個索引由一個分片構(gòu)成，那么當(dāng)索引的大小超過單個節(jié)點的容量的時候贴汪，ES不能將索引分割成多份脐往，因此必須在創(chuàng)建索引的時候就指定好需要的分片數(shù)量。此時我們所能做的就是創(chuàng)建一個新的索引扳埂，并在初始設(shè)定之中指定這個索引擁有更多的分片业簿。反之如果過度分配，就增大了Lucene在合并分片查詢結(jié)果時的復(fù)雜度阳懂，從而增大了耗時梅尤，所以我們得到了以下結(jié)論：

我們應(yīng)該使用最少的分片！

主分片岩调，副本和節(jié)點最大數(shù)之間數(shù)量存在以下關(guān)系：

節(jié)點數(shù)<=主分片數(shù)*（副本數(shù)+1）

控制分片分配行為巷燥。以上是在創(chuàng)建每個索引的時候需要考慮的優(yōu)化方法，然而在索引已創(chuàng)建好的前提下号枕，是否就是沒有辦法從分片的角度提高了性能了呢缰揪？當(dāng)然不是，首先能做的是調(diào)整分片分配器的類型葱淳，具體是在elasticsearch.yml中設(shè)置cluster.routing.allocation.type屬性钝腺，共有兩種分片器even_shard,balanced（默認(rèn)）。even_shard是盡量保證每個節(jié)點都具有相同數(shù)量的分片蛙紫，balanced是基于可控制的權(quán)重進(jìn)行分配拍屑，相對于前一個分配器，它更暴漏了一些參數(shù)而引入調(diào)整分配過程的能力坑傅。

每次ES的分片調(diào)整都是在ES上的數(shù)據(jù)分布發(fā)生了變化的時候進(jìn)行的僵驰，最有代表性的就是有新的數(shù)據(jù)節(jié)點加入了集群的時候。當(dāng)然調(diào)整分片的時機(jī)并不是由某個閾值觸發(fā)的唁毒，ES內(nèi)置十一個裁決者來決定是否觸發(fā)分片調(diào)整蒜茴，這里暫不贅述。另外浆西，這些分配部署策略都是可以在運行時更新的粉私，更多配置分片的屬性也請大家自行Google。

（二）路由優(yōu)化

ES中所謂的路由和IP網(wǎng)絡(luò)不同近零，是一個類似于Tag的東西诺核。在創(chuàng)建文檔的時候抄肖，可以通過字段為文檔增加一個路由屬性的Tag。ES內(nèi)在機(jī)制決定了擁有相同路由屬性的文檔窖杀，一定會被分配到同一個分片上漓摩，無論是主分片還是副本。那么入客，在查詢的過程中管毙，一旦指定了感興趣的路由屬性，ES就可以直接到相應(yīng)的分片所在的機(jī)器上進(jìn)行搜索桌硫，而避免了復(fù)雜的分布式協(xié)同的一些工作夭咬，從而提升了ES的性能。于此同時铆隘，假設(shè)機(jī)器1上存有路由屬性A的文檔卓舵，機(jī)器2上存有路由屬性為B的文檔，那么我在查詢的時候一旦指定目標(biāo)路由屬性為A咖驮，即使機(jī)器2故障癱瘓边器，對機(jī)器1構(gòu)不成很大影響训枢，所以這么做對災(zāi)況下的查詢也提出了解決方案托修。所謂的路由，本質(zhì)上是一個分桶（Bucketing）操作恒界。當(dāng)然睦刃，查詢中也可以指定多個路由屬性，機(jī)制大同小異十酣。

（三）ES上的GC調(diào)優(yōu)

ElasticSearch本質(zhì)上是個Java程序涩拙，所以配置JVM垃圾回收器本身也是一個很有意義的工作。我們使用JVM的Xms和Xmx參數(shù)來提供指定內(nèi)存大小耸采，本質(zhì)上提供的是JVM的堆空間大小兴泥，當(dāng)JVM的堆空間不足的時候就會觸發(fā)致命的OutOfMemoryException。這意味著要么內(nèi)存不足虾宇，要么出現(xiàn)了內(nèi)存泄露搓彻。處理GC問題，首先要確定問題的源頭嘱朽，一般有兩種方案：

1. 開啟ElasticSearch上的GC日志

2. 使用jstat命令

3. 生成內(nèi)存Dump

關(guān)于第一條旭贬，在ES的配置文件elasticsearch.yml中有相關(guān)的屬性可以配置，關(guān)于每個屬性的用途這里當(dāng)然說不完搪泳。

第二條稀轨，jstat命令可以幫助我們查看JVM堆中各個區(qū)的使用情況和GC的耗時情況。

第三條岸军，最后的辦法就是將JVM的堆空間轉(zhuǎn)儲到文件中去奋刽，實質(zhì)上是對JVM堆空間的一個快照瓦侮。

想了解更多關(guān)于JVM本身GC調(diào)優(yōu)方法請參考：http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html

另外，通過修改ES節(jié)點的啟動參數(shù)佣谐，也可以調(diào)整GC的方式脏榆，但是實質(zhì)上和上述方法是等同的。

（四）避免內(nèi)存交換

這一點很簡單台谍，由于操作系統(tǒng)的虛擬內(nèi)存頁交換機(jī)制须喂，會給性能帶來障礙，如數(shù)據(jù)寫滿內(nèi)存會寫入Linux中的Swap分區(qū)趁蕊。

可以通過在elasticsearch.yml文件中的bootstrap.mlockall設(shè)置為true來實現(xiàn)坞生，但是需要管理員權(quán)限，需要修改操作系統(tǒng)的相關(guān)配置文件掷伙。

（五）控制索引合并

上文提到過是己，ES中的分片和副本本質(zhì)上都是Lucene索引，而Lucene索引又基于多個索引段構(gòu)建（至少一個）任柜，索引文件中的絕大多數(shù)都是只被寫一次卒废，讀多次，在Lucene內(nèi)在機(jī)制控制下宙地，當(dāng)滿足某種條件的時候多個索引段會被合并到一個更大的索引段摔认，而那些舊的索引段會被拋棄并移除磁盤，這個操作叫做段合并宅粥。

Lucene要執(zhí)行段合并的理由很簡單充分：索引段粒度越小参袱，查詢性能越低且耗費的內(nèi)存越多。頻繁的文檔更改操作會導(dǎo)致大量的小索引段秽梅，從而導(dǎo)致文件句柄打開過多的問題抹蚀，如修改系統(tǒng)配置，增大系統(tǒng)允許的最大文件打開數(shù)企垦』啡溃總的來講，當(dāng)索引段由多一個合并為一個的時候钞诡，會減少索引段的數(shù)量從而提高ES性能郑现。對于研發(fā)者來講，我們所能做的就是選擇合適的合并策略臭增，盡管段合并完全是Lucene的任務(wù)懂酱，但隨著Lucene開放更多配置借口，新版本的ES還是提供了三種合并的策略tiered誊抛，log_byte_size列牺，log_doc。另外拗窃，ES也提供了兩種Lucene索引段合并的調(diào)度器：concurrent和serial瞎领。其中各者具體區(qū)別泌辫，這里暫不贅述，只是拋磚引玉九默。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末震放，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子驼修，更是在濱河造成了極大的恐慌殿遂，老刑警劉巖，帶你破解...
沈念sama閱讀 217,657評論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件乙各，死亡現(xiàn)場離奇詭異墨礁，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)耳峦，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,889評論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門恩静，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人蹲坷，你說我怎么就攤上這事驶乾。” “怎么了循签？”我有些...
開封第一講書人閱讀 164,057評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵级乐，是天一觀的道長。經(jīng)常有香客問我懦底，道長唇牧，這世上最難降的妖魔是什么罕扎？我笑而不...
開封第一講書人閱讀 58,509評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任聚唐，我火速辦了婚禮，結(jié)果婚禮上腔召，老公的妹妹穿的比我還像新娘杆查。我一直安慰自己，他們只是感情好臀蛛，可當(dāng)我...
茶點故事閱讀 67,562評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布亲桦。她就那樣靜靜地躺著，像睡著了一般浊仆。火紅的嫁衣襯著肌膚如雪客峭。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,443評論 1贊 302
城市分裂傳說
那天抡柿，我揣著相機(jī)與錄音舔琅，去河邊找鬼。笑死洲劣，一個胖子當(dāng)著我的面吹牛备蚓，可吹牛的內(nèi)容都是我干的课蔬。我是一名探鬼主播，決...
沈念sama閱讀 40,251評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼郊尝，長吁一口氣：“原來是場噩夢啊……” “哼二跋！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起流昏，我...
開封第一講書人閱讀 39,129評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤扎即，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后况凉，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體铺遂，經(jīng)...
沈念sama閱讀 45,561評論 1贊 314
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,779評論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年茎刚，在試婚紗的時候發(fā)現(xiàn)自己被綠了襟锐。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,902評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡膛锭，死狀恐怖粮坞，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情初狰，我是刑警寧澤莫杈，帶...
沈念sama閱讀 35,621評論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站奢入，受9級特大地震影響筝闹，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜腥光，卻給世界環(huán)境...
茶點故事閱讀 41,220評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一关顷、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧武福，春花似錦议双、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,838評論 0贊 22
一樁弒父案平痰，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至伍纫，卻和暖如春宗雇，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背莹规。一陣腳步聲響...
開封第一講書人閱讀 32,971評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工赔蒲，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 48,025評論 2贊 370
代替公主和親
正文我出身青樓嘹履，卻偏偏與公主長得像腻扇，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子砾嫉，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,843評論 2贊 354

elasticsearch 性能調(diào)優(yōu)（二）

推薦閱讀更多精彩內(nèi)容