ElasticSearch7.6.x總結(jié)-(前篇)

ElasticSearch(簡(jiǎn)稱ES)的由來

基于Lucene(java)開發(fā)升級(jí)而來凛忿。ElasticSearch是基于Lucene做了一些封裝和增強(qiáng),是一個(gè)開源的高擴(kuò)展的分布式全文搜索引擎湿蛔,它可以近乎實(shí)時(shí)的存儲(chǔ)、檢索數(shù)據(jù)县爬,它是通過簡(jiǎn)單的RESTful API來隱藏Lucene的復(fù)雜性阳啥,讓全文搜索更加簡(jiǎn)單。

誰在使用:

維基百科财喳,Stack Overflow察迟,GitHub等等

ELK技術(shù)=ES+logStash(采集日志)+Kibana 用于-日志數(shù)據(jù)分析

ES斩狱、Solr、Lucene的關(guān)聯(lián)與區(qū)別:

  • Solr也是基于Lucene開發(fā)而來扎瓶,
  • ES可以使用RestFul所踊,性能方面的提升。
  • es開箱即用概荷,solr安裝復(fù)雜秕岛;
  • solr利用Zookeeper進(jìn)行分布式管理,ES用的是自身帶有分布式的功能误证;
  • solr支持更多的數(shù)據(jù)格式:json继薛,xml,csv雷厂,es只支持json惋增,但是已經(jīng)足夠我們使用;

<mark style="box-sizing: border-box;">注意:JDK1.8是最低要求改鲫!</mark>

正文開始:

官網(wǎng)下載地址:https://www.elastic.co/cn/elasticsearch/

7.6.2版本:https://www.elastic.co/downloads/past-releases/elasticsearch-7-6-2

ELK三劍客,都是解壓即用.(環(huán)境:需要node)

Windows安裝:下載安裝包后,解壓新建目錄

目錄:

  • bin-啟動(dòng)文件
  • config-配置文件
    • log4j2 日志配置文件
    • jvm.options jvm配置
    • elasticsearch.yml es的配置文件,默認(rèn)9200端口

啟動(dòng):

bin目錄直接啟動(dòng):elasticsearch.bat文件

訪問:9200端口:頁面顯示

{
  "name" : "LAPTOP-NML71DV4",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "wXf0oB0CS22VXSy_aDP2cg",
  "version" : {
    "number" : "7.6.2",
    "build_flavor" : "default",
    "build_type" : "zip",
    "build_hash" : "ef48eb35cf30adf4db14086e8aabd07ef6fb113f",
    "build_date" : "2020-03-26T06:34:37.794943Z",
    "build_snapshot" : false,
    "lucene_version" : "8.4.0",
    "minimum_wire_compatibility_version" : "6.8.0",
    "minimum_index_compatibility_version" : "6.0.0-beta1"
  },
  "tagline" : "You Know, for Search"
}


安裝可視化界面:es head插件(需要node環(huán)境)

下載地址:https://github.com/mobz/elasticsearch-head

解壓目錄:安裝D:\Java\elasticsearch\elasticsearch-head-master

進(jìn)入目錄后:cnpm install

運(yùn)行:npm run start (注意:由于master是9100端口,而es為9200端口,會(huì)有跨域問題)

解決跨域:修改elasticsearch.yml,添加如下兩行
http.cors.enabled: true
http.cors.allow-origin: "*"

訪問:localhost:9100

-索引就是數(shù)據(jù)庫,當(dāng)成數(shù)據(jù)庫頁面來看
(注意:此時(shí)cmd可能會(huì)鎖定,導(dǎo)致手動(dòng)添加索引卡住,點(diǎn)一下回車鍵即可)
-就當(dāng)作數(shù)據(jù)庫navicat來看,關(guān)注-概覽,索引,數(shù)據(jù)瀏覽即可,后面的查詢我們用kibana去做

Kibana(需要版本對(duì)應(yīng)es)

Kibana是一個(gè)針對(duì)es的開源分析及可視化平臺(tái),用來搜索,查看交互存儲(chǔ)再es索引中的數(shù)據(jù),可以通過各種圖標(biāo)進(jìn)行高級(jí)數(shù)據(jù)分析及展示.

解壓后:啟動(dòng)測(cè)試:bin-kibana.bat

默認(rèn)端口:http://localhost:5601

漢化:打開config/kibana.yml 修改#i18n.locale: "en"為i18n.locale: "zh-CN"


ES核心概念

ES是一個(gè)面向文檔

MySQL ES
數(shù)據(jù)庫 索引
types(將被棄用)
documents文檔
字段 fields

物理設(shè)計(jì):ES默認(rèn)在后臺(tái)把每個(gè)索引劃分成多個(gè)片,每分分片可以在集群中的不同服務(wù)器間遷移,一個(gè)人就是一個(gè)集群,默認(rèn)集群名字是elasticsearch.

文檔 --一條條數(shù)據(jù)

索引 --數(shù)據(jù)庫

score-權(quán)重-即命中數(shù)


IK分詞器

何為分詞? 分詞就是把一段種文或者別的劃分成一個(gè)個(gè)關(guān)鍵字,我們搜索的時(shí)候就會(huì)把自己的信息進(jìn)行分詞,會(huì)把數(shù)據(jù)庫中或者索引庫中的數(shù)據(jù)進(jìn)行分詞,然后匹配,中文是把每個(gè)字堪稱一個(gè)詞.中文建議使用IK分詞器.

IK提供了2個(gè)分詞器:ik_smartik_max_word,ik_smart為最少切分,ik_max_word為最細(xì)粒度劃分.

下載IK分詞器(注意與es同版本):https://github.com/medcl/elasticsearch-analysis-ik

下載完后解壓放入es目錄下的plugins目錄下

重啟es

使用Kibana分詞器測(cè)試:打開頁面->工具頁面

分別測(cè)試2個(gè)分詞器
GET _analyze
{
  "analyzer":"ik_smart",
  "text": "超級(jí)喜歡晏子噠噠"
}

GET _analyze
{
  "analyzer":"ik_max_word",
  "text": "超級(jí)喜歡晏子噠噠"
}

比如'超級(jí)喜歡晏子噠噠',這時(shí)候晏子噠噠會(huì)被分成4個(gè)詞,而不是我想要的,此時(shí)需要自己配置詞,加入到分詞器的字典中!

IK分詞器增加自己配置: config->IKAnalyzer.cfg.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 擴(kuò)展配置</comment>
    <!--用戶可以在這里配置自己的擴(kuò)展字典 -->
    <entry key="ext_dict">test.dic</entry>
     <!--用戶可以在這里配置自己的擴(kuò)展停止詞字典-->
    <entry key="ext_stopwords"></entry>
    <!--用戶可以在這里配置遠(yuǎn)程擴(kuò)展字典 -->
    <!-- <entry key="remote_ext_dict">words_location</entry> -->
    <!--用戶可以在這里配置遠(yuǎn)程擴(kuò)展停止詞字典-->
    <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

新建test.dic:

晏子噠噠

保存完重啟es測(cè)試.

未完待續(xù)...

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末诈皿,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子像棘,更是在濱河造成了極大的恐慌稽亏,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缕题,死亡現(xiàn)場(chǎng)離奇詭異截歉,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)烟零,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門瘪松,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人锨阿,你說我怎么就攤上這事宵睦。” “怎么了墅诡?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵壳嚎,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我末早,道長(zhǎng)烟馅,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任然磷,我火速辦了婚禮郑趁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘姿搜。我一直安慰自己寡润,他們只是感情好缺脉,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著悦穿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪业踢。 梳的紋絲不亂的頭發(fā)上栗柒,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音知举,去河邊找鬼瞬沦。 笑死,一個(gè)胖子當(dāng)著我的面吹牛雇锡,可吹牛的內(nèi)容都是我干的逛钻。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼锰提,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼曙痘!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起立肘,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤边坤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后谅年,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體茧痒,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年融蹂,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了旺订。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡超燃,死狀恐怖区拳,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情淋纲,我是刑警寧澤劳闹,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站洽瞬,受9級(jí)特大地震影響本涕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜伙窃,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一菩颖、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧为障,春花似錦晦闰、人聲如沸放祟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽跪妥。三九已至,卻和暖如春声滥,著一層夾襖步出監(jiān)牢的瞬間眉撵,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來泰國打工落塑, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留纽疟,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓憾赁,卻偏偏與公主長(zhǎng)得像污朽,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子龙考,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容