9凸丸、自定義評分(lucene筆記)

這里我們是工程lucene_analyzer04

  • 1.自定義評分思路
    • 創(chuàng)建一個(gè)類繼承于CustomScoreQuery
    • 覆蓋里面的方法getCustomScoreProvider()
    • 創(chuàng)建一個(gè)類CustomScoreProvider
    • 覆蓋CustomScoreProvider中的方法customScore(),在這個(gè)方法中創(chuàng)建評分規(guī)則纸淮。
  • 2.首先看一個(gè)示例
    我們在FileIndexUtil.java中定義一個(gè)隨機(jī)數(shù)平斩,這個(gè)隨機(jī)數(shù)作為一個(gè)評分。
// 創(chuàng)建索引
public static void index(boolean hasNew) {
    IndexWriter writer = null;
    try {
        writer = new IndexWriter(directory, new IndexWriterConfig(
                Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));
        if (hasNew) {
            writer.deleteAll();//如果我們要新建索引萎馅,那么將之前創(chuàng)建的刪除
        }
        File file = new File("E:/myeclipse/Lucene/somefile");

        Document document = null;
        Random random = new Random();
        for (File f : file.listFiles()) {
            //將每個(gè)索引的評分設(shè)置成一個(gè)隨機(jī)數(shù)
            int score = random.nextInt(600);
            document = new Document();
            document.add(new Field("content", new FileReader(f)));
            document.add(new Field("filename", f.getName(),
                    Field.Store.YES, Field.Index.NOT_ANALYZED));
            document.add(new Field("path", f.getAbsolutePath(),
                    Field.Store.YES, Field.Index.NOT_ANALYZED));
            document.add(new NumericField("date", Field.Store.YES, true)
                    .setLongValue(f.lastModified()));
            // 最后我們將字節(jié)數(shù)轉(zhuǎn)換成kb
            document.add(new NumericField("size", Field.Store.YES, true)
                    .setIntValue((int) (f.length())));
            //這里我們使用score評分來創(chuàng)建索引双戳,沒有存儲,搜索出來的時(shí)候?yàn)閚ull
            //這里我自己隨機(jī)設(shè)置的一個(gè)評分
            document.add(new NumericField("score", Field.Store.NO, true).setIntValue(score));
            writer.addDocument(document);
        }
    } catch (CorruptIndexException e) {
        e.printStackTrace();
    } catch (LockObtainFailedException e) {
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        if (writer != null) {
            try {
                writer.close();
            } catch (CorruptIndexException e) {
                e.printStackTrace();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

說明:定義隨機(jī)評分之后再次生成索引糜芳。

  • 3.自定義評分規(guī)則
    MyScoreQuery.java
public void searchByScoreQuery(){
        try {
            IndexSearcher searcher = new IndexSearcher(IndexReader.open(FileIndexUtil.getDirectory()));
            Query q = new TermQuery(new Term("content", "json"));
            //1、創(chuàng)建一個(gè)評分域
            FieldScoreQuery fsq = new FieldScoreQuery("score", Type.INT);//如果是字符串選擇BYTE類型魄衅,這里是int類型
            //2峭竣、根據(jù)評分域和原有的Query創(chuàng)建自定義的Query對象
            MyCustomScoreQuery query = new MyCustomScoreQuery(q, fsq);
            
            TopDocs tds = null;
            tds = searcher.search(query, 20);//使用自定義的query
            SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
            for (ScoreDoc sd : tds.scoreDocs) {
                Document doc = searcher.doc(sd.doc);
                System.out.println("id:" + sd.doc + ",評分:" + sd.score 
                        + "晃虫,名稱:" + doc.get("filename") + "皆撩,路徑:" + doc.get("path")
                        + ",文件大姓芤:" + doc.get("size") + "扛吞,日期:"
                        + sdf.format(new Date(Long.valueOf(doc.get("date")))));
            }
            searcher.close();
        } catch (CorruptIndexException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
private class MyCustomScoreQuery extends CustomScoreQuery{
        //subQuery表示原有的Query,valSrcQuery用于做評分的Query
        //CustomScoreQuery其實(shí)有很多構(gòu)造方法荆责,我們可以一次性傳入很多評分規(guī)則
        public MyCustomScoreQuery(Query subQuery, ValueSourceQuery valSrcQuery) {
            super(subQuery, valSrcQuery);
        }
        
        //3滥比、覆蓋此方法
        @Override
        protected CustomScoreProvider getCustomScoreProvider(IndexReader reader)
                throws IOException {
            //默認(rèn)情況實(shí)現(xiàn)的評分是通過   原有的評分*傳入    進(jìn)來的評分域得到最后的評分
            //而這種評分算法很顯然是滿足不了我們的要求的,于是我們自己為了根據(jù)不同的需求需要
            //自己進(jìn)行評分設(shè)定
            /*
             * 自定義評分的步驟
             * (1)創(chuàng)建一個(gè)類繼承于CustomScoreProvider
             * (2)覆蓋CustomScoreProvider中的方法customScore()
             * */
            return new MyCustomScoreProvider(reader);
        }
    }
    
    private class MyCustomScoreProvider extends CustomScoreProvider{

        public MyCustomScoreProvider(IndexReader reader) {
            super(reader);
        }
        
        //此方法中subQueryScore表示默認(rèn)文檔的打分做院,valSrcScore表示的是評分域的打分
        @Override
        public float customScore(int doc, float subQueryScore, float valSrcScore)
                throws IOException {

            //這是按評分的降序排盲泛,之前默認(rèn)的是subQueryScore * valSrcScore
            return subQueryScore / valSrcScore;
        }
    }

說明:

  • 1.這里我們是利用之前創(chuàng)建的那個(gè)隨機(jī)評分,首先當(dāng)然是創(chuàng)建評分域FieldScoreQuery 键耕,這里我們選擇的是score域寺滚。然后是根據(jù)評分域和原有的Query創(chuàng)建自定義的Query對象。
    自定義的Query對象MyCustomScoreQuery 必須繼承CustomScoreQuery對象屈雄,然后需要一個(gè)構(gòu)造方法村视,同時(shí)覆寫getCustomScoreProvider方法,當(dāng)然此方法中我們需要自定義評分規(guī)則類MyCustomScoreProvider酒奶,此類需要繼承CustomScoreProvider蚁孔,也是需要一個(gè)構(gòu)造方法,同時(shí)覆寫customScore方法讥蟆,而我們真正的自定義評分規(guī)則就在這個(gè)方法中定義勒虾。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市瘸彤,隨后出現(xiàn)的幾起案子修然,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件愕宋,死亡現(xiàn)場離奇詭異玻靡,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)中贝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評論 3 399
  • 文/潘曉璐 我一進(jìn)店門囤捻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人邻寿,你說我怎么就攤上這事蝎土。” “怎么了绣否?”我有些...
    開封第一講書人閱讀 168,130評論 0 360
  • 文/不壞的土叔 我叫張陵誊涯,是天一觀的道長。 經(jīng)常有香客問我蒜撮,道長暴构,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,648評論 1 297
  • 正文 為了忘掉前任段磨,我火速辦了婚禮取逾,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘苹支。我一直安慰自己砾隅,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評論 6 397
  • 文/花漫 我一把揭開白布沐序。 她就那樣靜靜地躺著琉用,像睡著了一般。 火紅的嫁衣襯著肌膚如雪策幼。 梳的紋絲不亂的頭發(fā)上邑时,一...
    開封第一講書人閱讀 52,268評論 1 309
  • 那天,我揣著相機(jī)與錄音特姐,去河邊找鬼晶丘。 笑死,一個(gè)胖子當(dāng)著我的面吹牛唐含,可吹牛的內(nèi)容都是我干的浅浮。 我是一名探鬼主播,決...
    沈念sama閱讀 40,835評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼捷枯,長吁一口氣:“原來是場噩夢啊……” “哼滚秩!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起淮捆,我...
    開封第一講書人閱讀 39,740評論 0 276
  • 序言:老撾萬榮一對情侶失蹤郁油,失蹤者是張志新(化名)和其女友劉穎本股,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體桐腌,經(jīng)...
    沈念sama閱讀 46,286評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡拄显,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了案站。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片躬审。...
    茶點(diǎn)故事閱讀 40,505評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖蟆盐,靈堂內(nèi)的尸體忽然破棺而出承边,到底是詐尸還是另有隱情,我是刑警寧澤石挂,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布炒刁,位于F島的核電站,受9級特大地震影響誊稚,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜罗心,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評論 3 333
  • 文/蒙蒙 一里伯、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧渤闷,春花似錦疾瓮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至弦蹂,卻和暖如春肩碟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背凸椿。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評論 1 272
  • 我被黑心中介騙來泰國打工削祈, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人脑漫。 一個(gè)月前我還...
    沈念sama閱讀 48,921評論 3 376
  • 正文 我出身青樓髓抑,卻偏偏與公主長得像,于是被迫代替她去往敵國和親优幸。 傳聞我的和親對象是個(gè)殘疾皇子吨拍,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法,類相關(guān)的語法网杆,內(nèi)部類的語法羹饰,繼承相關(guān)的語法伊滋,異常的語法,線程的語...
    子非魚_t_閱讀 31,664評論 18 399
  • 構(gòu)建索引過程 文檔是Lucene索引和被搜索的最小單位严里,一個(gè)文檔包含一個(gè)或者多個(gè)域新啼,而域則包含了真正 被搜索 的內(nèi)...
    RagPanda閱讀 3,489評論 0 2
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)刹碾,斷路器燥撞,智...
    卡卡羅2017閱讀 134,701評論 18 139
  • 又是一年清明日, 山花爛漫踏青時(shí)迷帜。 稚子湖邊嘻戲水物舒, 不負(fù)春光好時(shí)節(jié)。
    Ekin_huang閱讀 198評論 0 0
  • Reality is merely an illusion , albeit a very persisten...
    契德千字閱讀 154評論 0 0