2019-11-12

有哪些大廠商在使用elasticsearch昼扛?


1.?維基百科使用Elasticsearch提供全文搜索并高亮關鍵字涯肩,以及輸入實時搜索(search-as-you-type)和搜索糾錯(did-youmean)

等搜索建議功能。

2.?英國衛(wèi)報使用Elasticsearch結合用戶日志和社交網(wǎng)絡數(shù)據(jù)提供給他們的編輯以實時的反饋,以便及時了解公眾對新發(fā)表

的文章的回應

3.?StackOverflow結合全文搜索與地理位置查詢,以及more-like-this功能來找到相關的問題和答案翎碑。

4.?Github使用Elasticsearch檢索1300億行的代碼。


為了搜索


Elasticsearch是一個基于Apache Lucene(TM)的開源搜索引擎之斯。無論在開源還是專有領域日杈,Lucene可以被認為是迄今為止最

先進、性能最好的佑刷、功能最全的搜索引擎庫莉擒。


安裝監(jiān)控工具marvel


安裝方法:todo


集群和節(jié)點


節(jié)點(node)是一個運行著的Elasticsearch實例

集群(cluster)是一組具有相同 cluster.name 的節(jié)點集合


和傳統(tǒng)關系型數(shù)據(jù)庫概念對比


Relational DB -> Databases -> Tables -> Rows -> Columns

Elasticsearch -> Indices -> Types -> Documents -> Fields

查詢操作:

查詢、過濾瘫絮、全文搜索涨冀、短語搜索、高亮麦萤、相關性評分鹿鳖、分析(聚合)


集群健康狀態(tài)


green 所有主要分片和復制分片都可用

yellow 所有主要分片可用扁眯,但不是所有復制分片都可用

red 不是所有的主要分片都可用


分片概念


分片就是一個Lucene實例。節(jié)點栓辜、主分片(一開始就確定)恋拍、復制分片

默認情況下,一個索引被分配5個主分片藕甩、


ES集群命令


查看集群狀態(tài):curl 'http://127.0.0.1:9200/_cluster/health?pretty'

更多命令:todo



版本控制


外部版本號與之前說的內(nèi)部版本號在處理的時候有些不同施敢。它不再檢查當前最新的 _version 是否與請求中指定的一致,而是檢查是否小

于指定的版本狭莱。如果請求成功僵娃,外部版本號就會被存儲到 _version 中。


ES腳本


Groovy


檢索多個文檔


mget


批量操作


mget 允許我們一次性檢索多個文檔一樣腋妙, bulk API允許我們使用單一請求來實現(xiàn)多個文檔

POST /_bulk

{ "delete": { "_index": "website", "_type": "blog", "_id": "123" }}

{ "create": { "_index": "website", "_type": "blog", "_id": "123" }}

{ "title": "My first blog post" }

{ "index": { "_index": "website", "_type": "blog" }}

{ "title": "My second blog post" }

{ "update": { "_index": "website", "_type": "blog", "_id": "123", "_retry_on_conflict" : 3} }

{ "doc" : {"title" : "My updated blog post"} }

整個批量請求需要被加載到接受我們請求節(jié)點的內(nèi)存里默怨,所以請求越大,給其它請求可用的內(nèi)存就越小骤素。有一個最佳

的 bulk 請求大小匙睹。超過這個大小,性能不再提升而且可能降低济竹。

最佳大小痕檬,當然并不是一個固定的數(shù)字。它完全取決于你的硬件送浊、你文檔的大小和復雜度以及索引和搜索的負載梦谜。幸運的

是,這個最佳點(sweetspot)還是容易找到的:

試著批量索引標準的文檔袭景,隨著大小的增長唁桩,當性能開始降低,說明你每個批次的大小太大了耸棒。開始的數(shù)量可以在

1000~5000個文檔之間荒澡,如果你的文檔非常大,可以使用較小的批次与殃。

通常著眼于你請求批次的物理大小是非常有用的仰猖。一千個1kB的文檔和一千個1MB的文檔大不相同。一個好的批次最好保持

在5-15MB大小間奈籽。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市鸵赫,隨后出現(xiàn)的幾起案子衣屏,更是在濱河造成了極大的恐慌,老刑警劉巖辩棒,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件狼忱,死亡現(xiàn)場離奇詭異膨疏,居然都是意外死亡,警方通過查閱死者的電腦和手機钻弄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門佃却,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人窘俺,你說我怎么就攤上這事饲帅。” “怎么了瘤泪?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵灶泵,是天一觀的道長。 經(jīng)常有香客問我对途,道長赦邻,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任实檀,我火速辦了婚禮惶洲,結果婚禮上,老公的妹妹穿的比我還像新娘膳犹。我一直安慰自己恬吕,他們只是感情好,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布镣奋。 她就那樣靜靜地躺著币呵,像睡著了一般。 火紅的嫁衣襯著肌膚如雪侨颈。 梳的紋絲不亂的頭發(fā)上余赢,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機與錄音哈垢,去河邊找鬼妻柒。 笑死,一個胖子當著我的面吹牛耘分,可吹牛的內(nèi)容都是我干的举塔。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼求泰,長吁一口氣:“原來是場噩夢啊……” “哼央渣!你這毒婦竟也來了?” 一聲冷哼從身側響起渴频,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤芽丹,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后卜朗,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拔第,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡咕村,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了蚊俺。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片懈涛。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖泳猬,靈堂內(nèi)的尸體忽然破棺而出批钠,到底是詐尸還是另有隱情,我是刑警寧澤暂殖,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布价匠,位于F島的核電站,受9級特大地震影響呛每,放射性物質(zhì)發(fā)生泄漏踩窖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一晨横、第九天 我趴在偏房一處隱蔽的房頂上張望洋腮。 院中可真熱鬧,春花似錦手形、人聲如沸啥供。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽伙狐。三九已至,卻和暖如春瞬欧,著一層夾襖步出監(jiān)牢的瞬間贷屎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工艘虎, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留唉侄,地道東北人。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓野建,卻偏偏與公主長得像属划,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子候生,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容