最強(qiáng)Elasticsearch入門(mén)相關(guān)概念

1、ES是如何產(chǎn)生的冠桃？

（1）思考：大規(guī)模數(shù)據(jù)如何檢索？

如：當(dāng)系統(tǒng)數(shù)據(jù)量上了10億道宅、100億條的時(shí)候食听，我們?cè)谧鱿到y(tǒng)架構(gòu)的時(shí)候通常會(huì)從以下角度去考慮問(wèn)題：
1）用什么數(shù)據(jù)庫(kù)好？(mysql污茵、sybase樱报、oracle、達(dá)夢(mèng)泞当、神通迹蛤、mongodb、hbase…)
2）如何解決單點(diǎn)故障；(lvs盗飒、F5嚷量、A10、Zookeep逆趣、MQ)
3）如何保證數(shù)據(jù)安全性蝶溶；(熱備、冷備宣渗、異地多活)
4）如何解決檢索難題抖所；(數(shù)據(jù)庫(kù)代理中間件：mysql-proxy、Cobar痕囱、MaxScale等;)
5）如何解決統(tǒng)計(jì)分析問(wèn)題部蛇；(離線、近實(shí)時(shí))

（2）傳統(tǒng)數(shù)據(jù)庫(kù)的應(yīng)對(duì)解決方案

對(duì)于關(guān)系型數(shù)據(jù)咐蝇，我們通常采用以下或類似架構(gòu)去解決查詢瓶頸和寫(xiě)入瓶頸：
解決要點(diǎn)：
1）通過(guò)主從備份解決數(shù)據(jù)安全性問(wèn)題涯鲁；
2）通過(guò)數(shù)據(jù)庫(kù)代理中間件心跳監(jiān)測(cè)，解決單點(diǎn)故障問(wèn)題有序；
3）通過(guò)代理中間件將查詢語(yǔ)句分發(fā)到各個(gè)slave節(jié)點(diǎn)進(jìn)行查詢抹腿，并匯總結(jié)果

image.png

2、ES介紹

Elasticsearch 是一個(gè)分布式可擴(kuò)展的實(shí)時(shí)搜索和分析引擎.Elasticsearch也使用Java開(kāi)發(fā)并使用Apache Lucene作為其核心來(lái)實(shí)現(xiàn)所有索引和搜索的功能旭寿，但是它的目的是通過(guò)簡(jiǎn)單的RESTful API來(lái)隱藏Lucene的復(fù)雜性警绩，從而讓全文搜索變得簡(jiǎn)單，它不僅包括了全文搜索功能盅称，還可以進(jìn)行以下工作:

分布式實(shí)時(shí)文件存儲(chǔ)肩祥，并將每一個(gè)字段都編入索引，使其可以被搜索缩膝。
實(shí)時(shí)分析的分布式搜索引擎混狠。
可以擴(kuò)展到上百臺(tái)服務(wù)器，處理PB級(jí)別的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)疾层。

基本概念
先說(shuō)Elasticsearch的文件存儲(chǔ)将饺，Elasticsearch是面向文檔型數(shù)據(jù)庫(kù)，一條數(shù)據(jù)在這里就是一個(gè)文檔痛黎，用JSON作為文檔序列化的格式

用MySQL的關(guān)系來(lái)說(shuō)明ES的存儲(chǔ)

索引（indices）--------------------------------Databases 數(shù)據(jù)庫(kù)
類型（type）-----------------------------Table 數(shù)據(jù)表
文檔（Document）----------------Row 行
字段（Field）-------------------Columns 列

3予弧、ES核心概念

1）Cluster：集群。

ES可以作為一個(gè)獨(dú)立的單個(gè)搜索服務(wù)器湖饱。不過(guò)掖蛤，為了處理大型數(shù)據(jù)集，實(shí)現(xiàn)容錯(cuò)和高可用性井厌，ES可以運(yùn)行在許多互相合作的服務(wù)器上蚓庭。這些服務(wù)器的集合稱為集群致讥。

2）Node：節(jié)點(diǎn)。

形成集群的每個(gè)服務(wù)器稱為節(jié)點(diǎn)彪置。

3）Shard：分片拄踪。

當(dāng)有大量的文檔時(shí)蝇恶，由于內(nèi)存的限制拳魁、磁盤(pán)處理能力不足、無(wú)法足夠快的響應(yīng)客戶端的請(qǐng)求等撮弧，一個(gè)節(jié)點(diǎn)可能不夠潘懊。這種情況下，數(shù)據(jù)可以分為較小的分片贿衍。每個(gè)分片放到不同的服務(wù)器上授舟。
當(dāng)你查詢的索引分布在多個(gè)分片上時(shí)，ES會(huì)把查詢發(fā)送給每個(gè)相關(guān)的分片贸辈，并將結(jié)果組合在一起释树，而應(yīng)用程序并不知道分片的存在。即：這個(gè)過(guò)程對(duì)用戶來(lái)說(shuō)是透明的擎淤。

4）Replia：副本奢啥。

為提高查詢吞吐量或?qū)崿F(xiàn)高可用性，可以使用分片副本捧杉。
副本是一個(gè)分片的精確復(fù)制弟跑，每個(gè)分片可以有零個(gè)或多個(gè)副本吨拍。ES中可以有許多相同的分片，其中之一被選擇更改索引操作赌结，這種特殊的分片稱為主分片。
當(dāng)主分片丟失時(shí)孝冒，如：該分片所在的數(shù)據(jù)不可用時(shí)柬姚，集群將副本提升為新的主分片。

5）全文檢索庄涡。

全文檢索就是對(duì)一篇文章進(jìn)行索引伤靠，可以根據(jù)關(guān)鍵字搜索，類似于mysql里的like語(yǔ)句啼染。
全文索引就是把內(nèi)容根據(jù)詞的意義進(jìn)行分詞宴合，然后分別創(chuàng)建索引，例如”你們的激情是因?yàn)槭裁词虑閬?lái)的” 可能會(huì)被分詞成：“你們“迹鹅，”激情“卦洽，“什么事情“，”來(lái)“ 等關(guān)鍵詞斜棚，這樣當(dāng)你搜索“你們” 或者 “激情” 都會(huì)把這句搜出來(lái)阀蒂。

4该窗、倒排索引

也常被稱為反向索引、置入檔案或反向檔案蚤霞，是一種索引方法酗失，被用來(lái)存儲(chǔ)在全文搜索下某個(gè)單詞在一個(gè)文檔或者一組文檔中的存儲(chǔ)位置的映射。它是文檔檢索系統(tǒng)中最常用的數(shù)據(jù)結(jié)構(gòu)昧绣。通過(guò)倒排索引规肴，可以根據(jù)單詞快速獲取包含這個(gè)單詞的文檔列表。倒排索引主要由兩個(gè)部分組成：“單詞詞典”和“倒排文件”

推薦一個(gè)鏈接：
https://developer.51cto.com/art/201904/594615.htm

5夜畴、ES國(guó)內(nèi)外使用優(yōu)秀案例

1） 2013年初拖刃，GitHub拋棄了Solr，采取ElasticSearch 來(lái)做PB級(jí)的搜索贪绘。 “GitHub使用ElasticSearch搜索20TB的數(shù)據(jù)兑牡，包括13億文件和1300億行代碼”。
2）維基百科：?jiǎn)?dòng)以elasticsearch為基礎(chǔ)的核心搜索架構(gòu)税灌。
3）SoundCloud：“SoundCloud使用ElasticSearch為1.8億用戶提供即時(shí)而精準(zhǔn)的音樂(lè)搜索服務(wù)”均函。
4）百度：百度目前廣泛使用ElasticSearch作為文本數(shù)據(jù)分析，采集百度所有服務(wù)器上的各類指標(biāo)數(shù)據(jù)及用戶自定義數(shù)據(jù)菱涤，通過(guò)對(duì)各種數(shù)據(jù)進(jìn)行多維分析展示苞也，輔助定位分析實(shí)例異常或業(yè)務(wù)層面異常狸窘。

最后編輯于：2021.03.04 10:12:29

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末墩朦，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子翻擒，更是在濱河造成了極大的恐慌氓涣，老刑警劉巖，帶你破解...
沈念sama閱讀 218,122評(píng)論 6贊 505
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件陋气，死亡現(xiàn)場(chǎng)離奇詭異劳吠，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)巩趁，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,070評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)痒玩，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人议慰，你說(shuō)我怎么就攤上這事蠢古。” “怎么了别凹？”我有些...
開(kāi)封第一講書(shū)人閱讀 164,491評(píng)論 0贊 354
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵草讶，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我炉菲，道長(zhǎng)堕战，這世上最難降的妖魔是什么坤溃？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,636評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮嘱丢，結(jié)果婚禮上薪介，老公的妹妹穿的比我還像新娘。我一直安慰自己越驻，他們只是感情好汁政，可當(dāng)我...
茶點(diǎn)故事閱讀 67,676評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著伐谈，像睡著了一般烂完。火紅的嫁衣襯著肌膚如雪试疙。梳的紋絲不亂的頭發(fā)上诵棵，一...
開(kāi)封第一講書(shū)人閱讀 51,541評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音祝旷，去河邊找鬼履澳。笑死，一個(gè)胖子當(dāng)著我的面吹牛怀跛，可吹牛的內(nèi)容都是我干的距贷。我是一名探鬼主播，決...
沈念sama閱讀 40,292評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼吻谋，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼忠蝗！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起漓拾，我...
開(kāi)封第一講書(shū)人閱讀 39,211評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤阁最，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后骇两，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體速种，經(jīng)...
沈念sama閱讀 45,655評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,846評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年低千，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了配阵。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,965評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡示血，死狀恐怖棋傍，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情难审，我是刑警寧澤瘫拣，帶...
沈念sama閱讀 35,684評(píng)論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站剔宪，受9級(jí)特大地震影響拂铡，放射性物質(zhì)發(fā)生泄漏壹无。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,295評(píng)論 3贊 329
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一感帅、第九天我趴在偏房一處隱蔽的房頂上張望斗锭。院中可真熱鬧，春花似錦失球、人聲如沸岖是。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,894評(píng)論 0贊 22
一樁弒父案实苞，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)豺撑。三九已至，卻和暖如春黔牵，著一層夾襖步出監(jiān)牢的瞬間聪轿，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,012評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工猾浦，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留陆错，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,126評(píng)論 3贊 370
代替公主和親
正文我出身青樓金赦，卻偏偏與公主長(zhǎng)得像音瓷，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子夹抗，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,914評(píng)論 2贊 355