(一)Elasticsearch簡介

前言

? ? ? ?我們建立一個(gè)網(wǎng)站或者一個(gè)應(yīng)用通常都會有搜索的功能吓妆,如果我們做的只是用戶量很少的內(nèi)網(wǎng)項(xiàng)目寞焙,并且搜索的字段都是一些內(nèi)容很簡短的字段,比如名字熔掺,編號之類的,那完全可以用數(shù)據(jù)庫like語句

? ? ? ?但是非剃,數(shù)據(jù)庫like查詢性能非常低置逻,如果搜索的請求多,或者需要搜索的是大文本類型的內(nèi)容(全文搜索)备绽,那么這種搜索的方案是不可取的券坞。

? ? ? ?那既然我們要做性能高的全文搜索,這個(gè)需求又不能依賴數(shù)據(jù)庫肺素,只能有我們自己來實(shí)現(xiàn)了恨锚,但是令我們很受打擊的是全文搜索是很難實(shí)現(xiàn)的,我們不僅希望能全文搜索倍靡,還希望它足夠穩(wěn)定足夠快猴伶,希望我們的搜索結(jié)果有關(guān)鍵字高亮,并且能按各種匹配分?jǐn)?shù)來排序塌西,希望它能切換不同的分詞算法來滿足各種分詞需求他挎。所以說,我們想要做一個(gè)功能完善雨让,性能強(qiáng)大的全文搜索真的不是那么簡單,而全文搜索又是一個(gè)常見的需求忿等,所以市面上已經(jīng)有一些現(xiàn)成的解決方案了栖忠。

? ? ? ?這些現(xiàn)成的解決方案開源出來,獲得大量的社區(qū)開發(fā)者支持,不斷為其開發(fā)插件庵寞,使其不斷優(yōu)化和完善狸相,這就成了我們所說的搜索引擎了。
? ? ? ?這些搜索引擎正是我們需要的捐川,它可以解決我們遇到的痛點(diǎn)脓鹃,我們可以直接拿這些開源的搜索引擎來使用,無需關(guān)心它如何實(shí)現(xiàn)古沥,我們只需要專注我們業(yè)務(wù)的開發(fā)就行了瘸右,這樣的話也避免了我們出現(xiàn)重復(fù)造輪子的現(xiàn)象了,而且這還是一個(gè)很麻煩的輪子岩齿。

? ? ? ?在這些開源的搜索引擎中有一個(gè)特別優(yōu)秀太颤,市場占有量最大,他就是Lucene盹沈。但是隨著分布式應(yīng)用,微服務(wù)應(yīng)用乞封,云計(jì)算做裙,大數(shù)據(jù)這些技術(shù)的興起,像搜索這樣的非常消耗系統(tǒng)性能的服務(wù)也應(yīng)該把它抽取出來獨(dú)立部署為一個(gè)服務(wù)系統(tǒng)肃晚,甚至是一個(gè)大型的云服務(wù)锚贱。然后根據(jù)訪問的壓力,可以橫向擴(kuò)展做搜索服務(wù)的集群陷揪,集群中的每個(gè)節(jié)點(diǎn)的數(shù)據(jù)都能以一個(gè)接近實(shí)時(shí)的速度來同步數(shù)據(jù)惋鸥,并把請求按多種不同的算法來分發(fā)到具體的服務(wù)節(jié)點(diǎn)。而服務(wù)化了的搜索引擎能支持RESTful方式請求悍缠,并且交互的數(shù)據(jù)以json這種輕量數(shù)據(jù)格式卦绣。如果我們想讓我們的全文搜索具備以上所提到的這些能力,那只使用Lucene是顯然不夠的飞蚓,我們還得圍繞著Lucene做大量的事情滤港,這樣的工作量和工作難度可能大多數(shù)中小型企業(yè)難以承受。但是趴拧,往往世界上就有那么一群人溅漾,他們很有能力,并且富有分享精神著榴,他們以Lucene為核心構(gòu)建了一套強(qiáng)大的搜索服務(wù)器添履,當(dāng)然這些搜索服務(wù)器不但具備著搜索引擎本該有的一整套搜索相關(guān)的功能,還具備著我們上面所說的這些能力脑又,最重要的是:它們是開源共享的暮胧。而它們中最有名氣的就是elasticsearch和solr锐借。其中,elasticsearch就是我們要深入探討的技術(shù)往衷。

Elasticsearch是什么

? ? ? ?Elasticsearch是一個(gè)基于Lucene搜索引擎為核心構(gòu)建的開源钞翔,分布式,RESTful搜索服務(wù)器席舍。設(shè)計(jì)用于云計(jì)算中布轿,能夠達(dá)到實(shí)時(shí)搜索,穩(wěn)定来颤,可靠汰扭,快速,安裝使用方便脚曾,輕松擴(kuò)展服務(wù)節(jié)點(diǎn)东且。
Elasticsearch是用Java開發(fā)的,但它卻不是只支持Java語言本讥,因?yàn)樗С諶ESTful方式調(diào)用珊泳,那理論上它是支持所有開發(fā)語言的,除此之外拷沸,如果你不想使用RESTful方式調(diào)用Elasticsearch服務(wù)器色查,那Elasticsearch還提供了各種語言的api供我們使用。
我們通過以下這張分析圖來看看elasticsearch是如何工作的:

ES服務(wù)器工作示意圖.png

相關(guān)概念

接近實(shí)時(shí)(NRT):
? ? ? ?Elasticsearch 是一個(gè)接近實(shí)時(shí)的搜索平臺撞芍。這意味著秧了,從索引一個(gè)文檔直到這個(gè)文檔能夠被搜索到有一個(gè)很小的延遲,包括如果做了集群的話序无,集群中的各個(gè)節(jié)點(diǎn)數(shù)據(jù)同步也是接近實(shí)時(shí)的验毡。

集群(cluster):
? ? ? ?elasticsearch一個(gè)很大的優(yōu)勢是它可以很方便的做集群,在一個(gè)elasticsearch的集群中帝嗡,有很多的節(jié)點(diǎn)(node)晶通,其中有一個(gè)為主節(jié)點(diǎn),這個(gè)主節(jié)點(diǎn)是可以通過選舉產(chǎn)生的哟玷,主從節(jié)點(diǎn)是對于集群內(nèi)部來說的狮辽。es的一個(gè)概念就是去中心化,字面上理解就是無中心節(jié)點(diǎn)巢寡,這是對于集群外部來說的喉脖,因?yàn)閺耐獠縼砜磂s集群,在邏輯上是個(gè)整體抑月,你與任何一個(gè)節(jié)點(diǎn)的通信和與整個(gè)es集群通信是等價(jià)的树叽。

節(jié)點(diǎn)(node):
? ? ? ?節(jié)點(diǎn)(node)其實(shí)就是一個(gè)elasticsearch服務(wù)器的實(shí)例,節(jié)點(diǎn)(node)主要有3種類型谦絮,第一種類型是client_node题诵,主要是起到請求分發(fā)的作用须误,類似路由。第二種類型是master_node仇轻,是主的節(jié)點(diǎn),所有的新增奶甘,刪除篷店,數(shù)據(jù)分片都是由主節(jié)點(diǎn)操作(elasticsearch底層是沒有更新數(shù)據(jù)操作的,上層對外提供的更新實(shí)際上是刪除了再新增)臭家,當(dāng)然也能承擔(dān)搜索操作疲陕。第三種類型是date_node,該類型的節(jié)點(diǎn)只能做搜索操作钉赁,具體會分配到哪個(gè)date_node蹄殃,就是由client_node決定,而data_node的數(shù)據(jù)都是從master_node同步過來的你踩。

索引(index):
? ? ? ?ElasticSearch將它的數(shù)據(jù)存儲在一個(gè)或多個(gè)索引(index)中诅岩。用SQL領(lǐng)域的術(shù)語來類比,索引就像數(shù)據(jù)庫带膜,可以向索引寫入文檔或者從索引中讀取文檔吩谦。

文檔類型(type):
? ? ? ?文檔類型(type)是用來規(guī)定文檔的各個(gè)字段內(nèi)容的數(shù)據(jù)類型和其他的一些約束,相當(dāng)于關(guān)系型數(shù)據(jù)庫中的表膝藕,一個(gè)索引(index)可以有多個(gè)文檔類型(type)式廷。

文檔(document):
? ? ? ?在Elasticsearch中,文檔(document)是存儲數(shù)據(jù)的載體芭挽,包含一個(gè)或多個(gè)字段滑废。一個(gè)文檔(document)相當(dāng)于關(guān)系型數(shù)據(jù)庫中的一行數(shù)據(jù)。

? ? ? ?這些就是elasticsearch的一些比較重要的概念袜爪,還有其他的概念我們就不一一列舉了蠕趁,但是大家通過以上的概念可能發(fā)現(xiàn),elasticsearch的設(shè)計(jì)跟關(guān)系型數(shù)據(jù)庫的設(shè)計(jì)還是挺像的饿敲,我們可以通過關(guān)系型數(shù)據(jù)庫的概念來類比著學(xué)習(xí)elasticsearch妻导,所以來看看以下這張對比圖:


MySQL和elasticsearch概念對比.png

? ? ? ?那么關(guān)于Elasticsearch的介紹就先講到這里,下個(gè)章節(jié)我們就來把Elasticsearch安裝起來使用怀各。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末倔韭,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子瓢对,更是在濱河造成了極大的恐慌寿酌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件硕蛹,死亡現(xiàn)場離奇詭異醇疼,居然都是意外死亡硕并,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進(jìn)店門秧荆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來倔毙,“玉大人,你說我怎么就攤上這事乙濒∩略撸” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵颁股,是天一觀的道長么库。 經(jīng)常有香客問我,道長甘有,這世上最難降的妖魔是什么诉儒? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮亏掀,結(jié)果婚禮上忱反,老公的妹妹穿的比我還像新娘。我一直安慰自己滤愕,他們只是感情好缭受,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著该互,像睡著了一般米者。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上宇智,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天蔓搞,我揣著相機(jī)與錄音,去河邊找鬼随橘。 笑死喂分,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的机蔗。 我是一名探鬼主播蒲祈,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼萝嘁!你這毒婦竟也來了梆掸?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤牙言,失蹤者是張志新(化名)和其女友劉穎酸钦,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咱枉,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡卑硫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年徒恋,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片欢伏。...
    茶點(diǎn)故事閱讀 40,096評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡入挣,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出硝拧,到底是詐尸還是另有隱情财岔,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布河爹,位于F島的核電站,受9級特大地震影響桐款,放射性物質(zhì)發(fā)生泄漏咸这。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一魔眨、第九天 我趴在偏房一處隱蔽的房頂上張望媳维。 院中可真熱鬧,春花似錦遏暴、人聲如沸侄刽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽州丹。三九已至,卻和暖如春杂彭,著一層夾襖步出監(jiān)牢的瞬間墓毒,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工亲怠, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留所计,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓团秽,卻偏偏與公主長得像主胧,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子习勤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容