ElasticSearch學(xué)習(xí)筆記3--IK分詞器插件

3.1 下載IK分詞器插件

https://github.com/medcl/elasticsearch-analysis-ik/releases

image.png

找到與自己ElasticSearch對應(yīng)版本的進(jìn)行下載宴凉,下載之后解壓委煤,在ElasticSearch目錄中的plugins目錄下新建一個名為的ik文件夾淮捆,將解壓后文件夾中的所有內(nèi)容復(fù)制到ik文件夾下
捕獲.PNG

如果你的ElasticSearch部署了多個節(jié)點(diǎn)碉哑,則別忘了在每個節(jié)點(diǎn)都要重復(fù)上述操作熬荆,即將ik文件夾下的所有文件復(fù)制到其他節(jié)點(diǎn)鸵赫。
在linux環(huán)境下:

[elastic@node1 plugins]$ scp -r ik elastic@node2:/opt/elasticsearch-6.2.3/plugins/

3.2 重啟ElasticSearch

捕獲.PNG

可以在倒數(shù)第三行的可以看出炬太,ik分詞器插件已經(jīng)被加載拆讯。

3.3 測試IK中文分詞器的基本功能

(1)ik_smart
其中pretty本意”漂亮的”屏富,表示以美觀的形式打印出JSON格式響應(yīng)晴竞。

GET _analyze?pretty
{
  "analyzer": "ik_smart",
  "text":"安徽省長江流域"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "安徽省",
      "start_offset": 0,
      "end_offset": 3,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "長江流域",
      "start_offset": 3,
      "end_offset": 7,
      "type": "CN_WORD",
      "position": 1
    }
  ]
}
20180106185937040.png

(2)ik_max_word

GET _analyze?pretty
{
  "analyzer": "ik_max_word",
  "text":"安徽省長江流域"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "安徽省",
      "start_offset": 0,
      "end_offset": 3,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "安徽",
      "start_offset": 0,
      "end_offset": 2,
      "type": "CN_WORD",
      "position": 1
    },
    {
      "token": "省長",
      "start_offset": 2,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 2
    },
    {
      "token": "長江流域",
      "start_offset": 3,
      "end_offset": 7,
      "type": "CN_WORD",
      "position": 3
    },
    {
      "token": "長江",
      "start_offset": 3,
      "end_offset": 5,
      "type": "CN_WORD",
      "position": 4
    },
    {
      "token": "江流",
      "start_offset": 4,
      "end_offset": 6,
      "type": "CN_WORD",
      "position": 5
    },
    {
      "token": "流域",
      "start_offset": 5,
      "end_offset": 7,
      "type": "CN_WORD",
      "position": 6
    }
  ]
}
20180106185937040.png

(3)新詞

GET _analyze?pretty
{
  "analyzer": "ik_smart",
  "text": "王者榮耀"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "王者",
      "start_offset": 0,
      "end_offset": 2,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "榮耀",
      "start_offset": 2,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 1
    }
  ]
}

3.4 擴(kuò)展字典

(1)查看已有詞典
已有詞典在ik文件夾下的config下


171159280704hik.png

自定義詞典:
linux環(huán)境下:

[es@node1 analysis-ik]$ mkdir custom
[es@node1 analysis-ik]$ vi custom/new_word.dic
[es@node1 analysis-ik]$ cat custom/new_word.dic 
老鐵
王者榮耀
洪荒之力
共有產(chǎn)權(quán)房
一帶一路
[es@node1 analysis-ik]$ 

在windows環(huán)境下只需要在對應(yīng)文件夾下創(chuàng)建對應(yīng)字典文件(xxxx.dic)即可
(3)更新配置

[es@node1 analysis-ik]$ vi IKAnalyzer.cfg.xml 
[es@node1 analysis-ik]$ cat IKAnalyzer.cfg.xml 
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 擴(kuò)展配置</comment>
    <!--用戶可以在這里配置自己的擴(kuò)展字典 -->
    <entry key="ext_dict">custom/new_word.dic</entry>
     <!--用戶可以在這里配置自己的擴(kuò)展停止詞字典-->
    <entry key="ext_stopwords"></entry>
    <!--用戶可以在這里配置遠(yuǎn)程擴(kuò)展字典 -->
    <!-- <entry key="remote_ext_dict">words_location</entry> -->
    <!--用戶可以在這里配置遠(yuǎn)程擴(kuò)展停止詞字典-->
    <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
[es@node1 analysis-ik]$

(4)重啟elasticsearch
(5)重啟Kibana
重啟Kibana后,從新執(zhí)行下面命令:

GET _analyze?pretty
{
  "analyzer": "ik_smart",
  "text":"王者榮耀"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "王者榮耀",
      "start_offset": 0,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 0
    }
  ]
}
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末狠半,一起剝皮案震驚了整個濱河市噩死,隨后出現(xiàn)的幾起案子颤难,更是在濱河造成了極大的恐慌,老刑警劉巖已维,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件行嗤,死亡現(xiàn)場離奇詭異,居然都是意外死亡垛耳,警方通過查閱死者的電腦和手機(jī)栅屏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來堂鲜,“玉大人栈雳,你說我怎么就攤上這事〉蘖” “怎么了哥纫?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長痴奏。 經(jīng)常有香客問我蛀骇,道長,這世上最難降的妖魔是什么读拆? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任擅憔,我火速辦了婚禮,結(jié)果婚禮上檐晕,老公的妹妹穿的比我還像新娘暑诸。我一直安慰自己,他們只是感情好棉姐,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布屠列。 她就那樣靜靜地躺著啦逆,像睡著了一般伞矩。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上夏志,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天乃坤,我揣著相機(jī)與錄音,去河邊找鬼沟蔑。 笑死湿诊,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的瘦材。 我是一名探鬼主播厅须,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼食棕!你這毒婦竟也來了朗和?” 一聲冷哼從身側(cè)響起错沽,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎眶拉,沒想到半個月后千埃,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡忆植,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年放可,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片朝刊。...
    茶點(diǎn)故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡耀里,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出坞古,到底是詐尸還是另有隱情备韧,我是刑警寧澤,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布痪枫,位于F島的核電站织堂,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏奶陈。R本人自食惡果不足惜易阳,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吃粒。 院中可真熱鬧潦俺,春花似錦、人聲如沸徐勃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽僻肖。三九已至肖爵,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間臀脏,已是汗流浹背劝堪。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留揉稚,地道東北人秒啦。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像搀玖,于是被迫代替她去往敵國和親余境。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內(nèi)容