Windows10下淺識Luke索引

最近學(xué)校課程在做搜索引擎相關(guān)研究,在數(shù)據(jù)構(gòu)建索引方面老師推薦了Luke.于是利用周末的時間,快速品嘗一下Luke.


目錄
1.Luke簡介
2.Luke下載/安裝
3.Luke使用
--3.1打開Luke/索引信息初始化
--3.2體驗Luke功能
-----3.2.1索引文件查看
-----3.2.2索引文件操作
-----3.2.3索引插件管理
4.總結(jié)


1.Luke簡介(摘自Luke/GitHub)


Luke在GitHub的地址:

https://github.com/DmitryKey/luke

Luke is the GUI tool for introspecting your Lucene / Solr / Elasticsearch index. It allows:

  • Viewing your documents and analyzing their field contents (for stored fields)
  • Searching in the index
  • Performing index maintenance: index health checking, index optimization (take a backup before running this!)
  • Reading index from hdfs
  • Exporting the index or portion of it into an xml format
  • Testing your custom Lucene analyzers
  • Creating your own plugins!
    Search engines luke can deal with

Search engines luke can deal with:

  • Apache Lucene. Most certainly luke can open lucene index produced by pure Lucene. Do people make pure Lucene these days?
  • Apache Solr. Solr and Lucene share the same code base, so it is natural that luke can open Lucene Index produced by Solr.
  • Elasticsearch. Elasticsearch uses Lucene as its lowest-level search engine base. So luke can open its index too!

我們的搜索引擎項目是基于solr進行的,Luke可以配合solr進行更多更好更方便的開發(fā)工作,看來老師推薦Luke是有道理的!

2.Luke下載/安裝

下載和安裝也是順其自然的事
下載當然是在github的luke官網(wǎng):

https://github.com/DmitryKey/luke/releases


不同的Lucene版本要對應(yīng)其相對應(yīng)的Luke版本,所以在下載Luke的時候要選擇合適于自己所安裝的Lucene的版本.這里我們選擇最新版6.5.0

安裝在指引文檔中也有說明:

1.Clone the repository.
2.Run mvn install from the project directory. (Make sure you have Java and Maven installed before doing this)
3.Use luke.sh or luke.bat for launching luke from the command line based on the OS you are in.

簡單的來說,下載與安裝只需要在GitHub上克隆Luke到本地,然后雙擊luke.shluke.bat啟動即可.

3.Luke使用

3.1打開Luke/索引信息初始化
在Windows系統(tǒng)下,我們通過雙擊 luke.bat打開Luke的可視化界面:


系統(tǒng)提示我們寫入我們索引的路徑.我們可以直接寫入之前索引存放的路徑,也可以在luke目錄下面新建一個文件夾,將之前的索引文件復(fù)制過來.由于我們的項目是跑在服務(wù)器上的,所以為了方便我們將服務(wù)器上生成的索引文件復(fù)制一份到我們寫入的路徑中去.

拷貝索引文件到目標路徑

注意:如果路徑中沒有索引文件的話會報錯:

啟動成功!


啟動成功

3.2體驗Luke功能

索引文件查看
在luke中,我們能夠很方便的查看索引的數(shù)量,索引的fields等索引的總體信息,也能夠細致入微的查看當前索引中某一個item的具體信息,包括某一個字段的屬性/內(nèi)容/大小等等.


overview選項卡中,我們能夠看到index name,number of fields,number of terms等總體信息
也能看到所有的fields信息,包括其name,term count,decoder等等信息
當然了,我們也能看到索引出來的信息,包括rank,field等等.

Documents選項卡中,我們也能在選項卡下方看到具體的每一個item所包含的所有fields信息,我們也能點開下方的Show按鈕查看某一個field的具體信息


索引文件操作

在Luke中我們也能對索引的items進行操作,包括增/刪/查/改操作

add操作,
reconstruct & edit操作
delete操作
browse by term為'查'操作,當然了在search選項卡中有更為具體的操作

當然了,至于具體的按鈕是怎么操作的我們在這里按住不表,有興趣的同學(xué)自行去嘗試一下~


索引插件管理

plugins選項卡里面,我們能夠看到若干個Luke自帶的插件


簡單介紹一下這幾款自帶的插件:

  • Analyzer Tool : 分詞器工具,可以選擇分詞器并對分詞器分詞的效果進行展示
  • Hadoop Plugin: 支持對Hadoop任何文件系統(tǒng)的索引
  • Scripting Luke: 提供了一個JavaScript的交互式Shell
  • Custom Similarity: 設(shè)計自定義相似性的插件
  • Vocabulary Analysisi Tool: 一個表示索引詞匯增長的工具
  • Zipf distribution:顯示術(shù)語流行度發(fā)行的工具

4.總結(jié)

luke對于solr來說毫無疑問是對其索引功能的豐富.雖然solr有一個自帶的web管理頁面,但是作為擴展其索引功能的工具Luke,搭配solr我們能夠更方便的實現(xiàn)索引的相關(guān)操作.
通過luke,我們能夠簡單直接的查看索引的具體信息;我們也能夠在luke上直接對其索引內(nèi)容進行相關(guān)操作;當然了,luke提供了強大的可擴展性功能,能夠讓我們用戶能夠擁有自定義的個性化需求.最重要的是,我們能夠通過luke對索引的語句進行檢驗,分析查詢效率,對查詢進行優(yōu)化,這顯然能夠幫助我們構(gòu)建更好更優(yōu)秀的搜索引擎.


相關(guān)推薦
Solr6.5.1環(huán)境搭建+相關(guān)命令+索引查詢

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末放坏,一起剝皮案震驚了整個濱河市坷檩,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌移袍,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,270評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件毯炮,死亡現(xiàn)場離奇詭異边翼,居然都是意外死亡,警方通過查閱死者的電腦和手機阱当,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,489評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來糜工,“玉大人弊添,你說我怎么就攤上這事“颇荆” “怎么了油坝?”我有些...
    開封第一講書人閱讀 165,630評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長刨裆。 經(jīng)常有香客問我澈圈,道長,這世上最難降的妖魔是什么帆啃? 我笑而不...
    開封第一講書人閱讀 58,906評論 1 295
  • 正文 為了忘掉前任瞬女,我火速辦了婚禮,結(jié)果婚禮上努潘,老公的妹妹穿的比我還像新娘诽偷。我一直安慰自己,他們只是感情好疯坤,可當我...
    茶點故事閱讀 67,928評論 6 392
  • 文/花漫 我一把揭開白布报慕。 她就那樣靜靜地躺著,像睡著了一般压怠。 火紅的嫁衣襯著肌膚如雪眠冈。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,718評論 1 305
  • 那天菌瘫,我揣著相機與錄音蜗顽,去河邊找鬼玄柠。 笑死,一個胖子當著我的面吹牛诫舅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播宫患,決...
    沈念sama閱讀 40,442評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼刊懈,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了娃闲?” 一聲冷哼從身側(cè)響起虚汛,我...
    開封第一講書人閱讀 39,345評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎皇帮,沒想到半個月后卷哩,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,802評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡属拾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,984評論 3 337
  • 正文 我和宋清朗相戀三年将谊,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片渐白。...
    茶點故事閱讀 40,117評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡尊浓,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出纯衍,到底是詐尸還是另有隱情栋齿,我是刑警寧澤,帶...
    沈念sama閱讀 35,810評論 5 346
  • 正文 年R本政府宣布襟诸,位于F島的核電站瓦堵,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏歌亲。R本人自食惡果不足惜菇用,卻給世界環(huán)境...
    茶點故事閱讀 41,462評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望应结。 院中可真熱鬧刨疼,春花似錦、人聲如沸鹅龄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,011評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扮休。三九已至迎卤,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間玷坠,已是汗流浹背蜗搔。 一陣腳步聲響...
    開封第一講書人閱讀 33,139評論 1 272
  • 我被黑心中介騙來泰國打工劲藐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人樟凄。 一個月前我還...
    沈念sama閱讀 48,377評論 3 373
  • 正文 我出身青樓聘芜,卻偏偏與公主長得像,于是被迫代替她去往敵國和親缝龄。 傳聞我的和親對象是個殘疾皇子汰现,可洞房花燭夜當晚...
    茶點故事閱讀 45,060評論 2 355

推薦閱讀更多精彩內(nèi)容