ElasticSearch學(xué)習(xí)筆記3--IK分詞器插件

3.1 下載IK分詞器插件

https://github.com/medcl/elasticsearch-analysis-ik/releases

image.png

找到與自己ElasticSearch對應(yīng)版本的進(jìn)行下載宴凉，下載之后解壓委煤，在ElasticSearch目錄中的plugins目錄下新建一個名為的ik文件夾淮捆，將解壓后文件夾中的所有內(nèi)容復(fù)制到ik文件夾下

捕獲.PNG

如果你的ElasticSearch部署了多個節(jié)點(diǎn)碉哑，則別忘了在每個節(jié)點(diǎn)都要重復(fù)上述操作熬荆，即將ik文件夾下的所有文件復(fù)制到其他節(jié)點(diǎn)鸵赫。
在linux環(huán)境下：

[elastic@node1 plugins]$ scp -r ik elastic@node2:/opt/elasticsearch-6.2.3/plugins/

3.2 重啟ElasticSearch

捕獲.PNG

可以在倒數(shù)第三行的可以看出炬太，ik分詞器插件已經(jīng)被加載拆讯。

3.3 測試IK中文分詞器的基本功能

（1）ik_smart
其中pretty本意”漂亮的”屏富，表示以美觀的形式打印出JSON格式響應(yīng)晴竞。

GET _analyze?pretty
{
  "analyzer": "ik_smart",
  "text":"安徽省長江流域"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "安徽省",
      "start_offset": 0,
      "end_offset": 3,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "長江流域",
      "start_offset": 3,
      "end_offset": 7,
      "type": "CN_WORD",
      "position": 1
    }
  ]
}

20180106185937040.png

（2）ik_max_word

GET _analyze?pretty
{
  "analyzer": "ik_max_word",
  "text":"安徽省長江流域"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "安徽省",
      "start_offset": 0,
      "end_offset": 3,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "安徽",
      "start_offset": 0,
      "end_offset": 2,
      "type": "CN_WORD",
      "position": 1
    },
    {
      "token": "省長",
      "start_offset": 2,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 2
    },
    {
      "token": "長江流域",
      "start_offset": 3,
      "end_offset": 7,
      "type": "CN_WORD",
      "position": 3
    },
    {
      "token": "長江",
      "start_offset": 3,
      "end_offset": 5,
      "type": "CN_WORD",
      "position": 4
    },
    {
      "token": "江流",
      "start_offset": 4,
      "end_offset": 6,
      "type": "CN_WORD",
      "position": 5
    },
    {
      "token": "流域",
      "start_offset": 5,
      "end_offset": 7,
      "type": "CN_WORD",
      "position": 6
    }
  ]
}

20180106185937040.png

（3）新詞

GET _analyze?pretty
{
  "analyzer": "ik_smart",
  "text": "王者榮耀"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "王者",
      "start_offset": 0,
      "end_offset": 2,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "榮耀",
      "start_offset": 2,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 1
    }
  ]
}

3.4 擴(kuò)展字典

（1）查看已有詞典
已有詞典在ik文件夾下的config下

171159280704hik.png

自定義詞典：
linux環(huán)境下：

[es@node1 analysis-ik]$ mkdir custom
[es@node1 analysis-ik]$ vi custom/new_word.dic
[es@node1 analysis-ik]$ cat custom/new_word.dic 
老鐵
王者榮耀
洪荒之力
共有產(chǎn)權(quán)房
一帶一路
[es@node1 analysis-ik]$

在windows環(huán)境下只需要在對應(yīng)文件夾下創(chuàng)建對應(yīng)字典文件(xxxx.dic)即可
（3）更新配置

[es@node1 analysis-ik]$ vi IKAnalyzer.cfg.xml 
[es@node1 analysis-ik]$ cat IKAnalyzer.cfg.xml 
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
    <comment>IK Analyzer 擴(kuò)展配置</comment>
    <!--用戶可以在這里配置自己的擴(kuò)展字典 -->
    <entry key="ext_dict">custom/new_word.dic</entry>
     <!--用戶可以在這里配置自己的擴(kuò)展停止詞字典-->
    <entry key="ext_stopwords"></entry>
    <!--用戶可以在這里配置遠(yuǎn)程擴(kuò)展字典 -->
    <!-- <entry key="remote_ext_dict">words_location</entry> -->
    <!--用戶可以在這里配置遠(yuǎn)程擴(kuò)展停止詞字典-->
    <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
[es@node1 analysis-ik]$

（4）重啟elasticsearch
（5）重啟Kibana
重啟Kibana后，從新執(zhí)行下面命令：

GET _analyze?pretty
{
  "analyzer": "ik_smart",
  "text":"王者榮耀"
}

分詞結(jié)果

{
  "tokens": [
    {
      "token": "王者榮耀",
      "start_offset": 0,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 0
    }
  ]
}

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末狠半，一起剝皮案震驚了整個濱河市噩死，隨后出現(xiàn)的幾起案子颤难，更是在濱河造成了極大的恐慌，老刑警劉巖已维，帶你破解...
沈念sama閱讀 211,948評論 6贊 492
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件行嗤，死亡現(xiàn)場離奇詭異，居然都是意外死亡垛耳，警方通過查閱死者的電腦和手機(jī)栅屏，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,371評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來堂鲜，“玉大人栈雳，你說我怎么就攤上這事〉蘖” “怎么了哥纫？”我有些...
開封第一講書人閱讀 157,490評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長痴奏。經(jīng)常有香客問我蛀骇，道長，這世上最難降的妖魔是什么读拆？我笑而不...
開封第一講書人閱讀 56,521評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任擅憔，我火速辦了婚禮，結(jié)果婚禮上檐晕，老公的妹妹穿的比我還像新娘暑诸。我一直安慰自己，他們只是感情好棉姐，可當(dāng)我...
茶點(diǎn)故事閱讀 65,627評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布屠列。她就那樣靜靜地躺著啦逆，像睡著了一般伞矩。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上夏志，一...
開封第一講書人閱讀 49,842評論 1贊 290
城市分裂傳說
那天乃坤，我揣著相機(jī)與錄音，去河邊找鬼沟蔑。笑死湿诊，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的瘦材。我是一名探鬼主播厅须，決...
沈念sama閱讀 38,997評論 3贊 408
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼食棕！你這毒婦竟也來了朗和？” 一聲冷哼從身側(cè)響起错沽，我...
開封第一講書人閱讀 37,741評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎眶拉，沒想到半個月后千埃，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,203評論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡忆植，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,534評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年放可，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片朝刊。...
茶點(diǎn)故事閱讀 38,673評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡耀里，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出坞古，到底是詐尸還是另有隱情备韧，我是刑警寧澤，帶...
沈念sama閱讀 34,339評論 4贊 330
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布痪枫，位于F島的核電站织堂，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏奶陈。R本人自食惡果不足惜易阳，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,955評論 3贊 313
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望吃粒。院中可真熱鬧潦俺，春花似錦、人聲如沸徐勃。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,770評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽僻肖。三九已至肖爵，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間臀脏，已是汗流浹背劝堪。一陣腳步聲響...
開封第一講書人閱讀 32,000評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留揉稚，地道東北人秒啦。一個月前我還...
沈念sama閱讀 46,394評論 2贊 360
代替公主和親
正文我出身青樓，卻偏偏與公主長得像搀玖，于是被迫代替她去往敵國和親余境。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,562評論 2贊 349

ElasticSearch學(xué)習(xí)筆記3--IK分詞器插件

3.1 下載IK分詞器插件

3.2 重啟ElasticSearch

3.3 測試IK中文分詞器的基本功能

3.4 擴(kuò)展字典

推薦閱讀更多精彩內(nèi)容