對Lucene的一點點認識

01Lucene支持類似操作數(shù)據(jù)庫一樣的建庫和索引的機制谭贪,這里建庫成為“寫入”,索引成為“讀出”锦担。

02寫入流程:

Writer包含Analyzer俭识,將所需記錄加入庫中,填充其字段洞渔,添加所需字段的索引套媚,進行存儲。

03讀出流程:

Reader(同樣包含Analyzer)根據(jù)關鍵詞磁椒,訪問庫的所有Document, 提取所需的字段堤瘤,構造生成文檔。

04Analyzer

Analyzer提供去冗余浆熔、去無效詞的機制本辐,實現(xiàn)分詞管理,其過濾基于語義医增。

05數(shù)據(jù)結構

A慎皱、term是一個文本類,包含關鍵詞和關鍵詞的字段叶骨。

B茫多、filed是字段,可這樣設置邓萨,類似于“關鍵詞所在文章的標題”地梨、“所在文章的正文”菊卷、“所在文章的最后修改時間”

C、tocken繼承了term的特性宝剖,另外也包含term的起止偏移點洁闰,以及一個類型字符串。tocken標記了關鍵詞實例的位置万细,而term僅僅是詞語的一個class扑眉,同種關鍵詞若位置不同則使用不同的tocken。

D赖钞、Segment

Segment是Document的子文件腰素,Document具備分割性和組成特性。

06 Luncene全面支持token安全令牌的規(guī)約雪营,對庫的安全查詢提供支持弓千。

07 一個簡單的代碼實例

IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true);//在路徑“/data/index/”上創(chuàng)建writer,包含analyzer

Document doc = new Document();//新建數(shù)據(jù)庫文檔

doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED));

doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED));//在document里面創(chuàng)建字段title\lucene intro\content\lucene work well

writer.addDocument(doc);//將doc導入writer寫入器献起,doc相當于數(shù)據(jù)庫的一行

writer.optimize();//字符去冗余

writer.close();//關閉writer

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末洋访,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子谴餐,更是在濱河造成了極大的恐慌姻政,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,311評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件岂嗓,死亡現(xiàn)場離奇詭異汁展,居然都是意外死亡,警方通過查閱死者的電腦和手機厌殉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評論 2 382
  • 文/潘曉璐 我一進店門食绿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人公罕,你說我怎么就攤上這事炫欺。” “怎么了熏兄?”我有些...
    開封第一講書人閱讀 152,671評論 0 342
  • 文/不壞的土叔 我叫張陵品洛,是天一觀的道長。 經(jīng)常有香客問我摩桶,道長桥状,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,252評論 1 279
  • 正文 為了忘掉前任硝清,我火速辦了婚禮辅斟,結果婚禮上,老公的妹妹穿的比我還像新娘芦拿。我一直安慰自己士飒,他們只是感情好查邢,可當我...
    茶點故事閱讀 64,253評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著酵幕,像睡著了一般扰藕。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上芳撒,一...
    開封第一講書人閱讀 49,031評論 1 285
  • 那天邓深,我揣著相機與錄音,去河邊找鬼笔刹。 笑死芥备,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的舌菜。 我是一名探鬼主播萌壳,決...
    沈念sama閱讀 38,340評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼日月!你這毒婦竟也來了讶凉?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,973評論 0 259
  • 序言:老撾萬榮一對情侶失蹤山孔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后荷憋,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體台颠,經(jīng)...
    沈念sama閱讀 43,466評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,937評論 2 323
  • 正文 我和宋清朗相戀三年勒庄,在試婚紗的時候發(fā)現(xiàn)自己被綠了串前。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,039評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡实蔽,死狀恐怖荡碾,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情局装,我是刑警寧澤坛吁,帶...
    沈念sama閱讀 33,701評論 4 323
  • 正文 年R本政府宣布,位于F島的核電站铐尚,受9級特大地震影響拨脉,放射性物質發(fā)生泄漏。R本人自食惡果不足惜宣增,卻給世界環(huán)境...
    茶點故事閱讀 39,254評論 3 307
  • 文/蒙蒙 一玫膀、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧爹脾,春花似錦帖旨、人聲如沸箕昭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽落竹。三九已至,卻和暖如春瓮钥,著一層夾襖步出監(jiān)牢的瞬間筋量,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工碉熄, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留桨武,地道東北人。 一個月前我還...
    沈念sama閱讀 45,497評論 2 354
  • 正文 我出身青樓锈津,卻偏偏與公主長得像呀酸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子琼梆,可洞房花燭夜當晚...
    茶點故事閱讀 42,786評論 2 345

推薦閱讀更多精彩內(nèi)容