搜索學習--Lucene中搜索的排序掏婶、范圍區(qū)間搜索啃奴、分頁搜索、多條件搜索

依賴

     <!-- Lucene核心 -->
            <dependency>
                <groupId>org.apache.lucene</groupId>
                <artifactId>lucene-core</artifactId>
                <version>4.7.2</version>
            </dependency>

        <!-- Lucene搜索查詢相關 -->
        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-queryparser</artifactId>
            <version>4.7.2</version>
        </dependency>

        <!-- Lucene分詞器相關 -->
        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-analyzers-common</artifactId>
            <version>4.7.2</version>
        </dependency>

        <!--高亮-->
        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-highlighter</artifactId>
            <version>4.7.2</version>
        </dependency>

建立索引

本次增加了Float雄妥、Int類型的域

package top.yuyufeng.learn.lucene.demo2;

/**
 * @author yuyufeng
 * @date 2017/11/21
 */

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.*;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.LockObtainFailedException;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Version;

import java.io.File;
import java.io.IOException;

/**
 * @author yuyufeng
 * @date 2017/11/21
 */
public class LuceneIndexDemo {
    public static void main(String[] args) {
        // 建立5條索引
        String content = "10月11日杭州云棲大會上最蕾,馬云表達了對新建成的阿里巴巴全球研究院—阿里巴巴達摩院的愿景,希望達摩院二十年內成為世界第一大經濟體老厌,服務世界二十億人瘟则,創(chuàng)造一億個工作崗位。";
        Long createTime = System.currentTimeMillis();
        String id = createTime + "";
        int readCount =10;
        float score =9.5f;
        index(content, createTime, id, readCount, score);


        content = "中國互聯(lián)網界梅桩,阿里巴巴被認為是技術實力最弱的公司壹粟。我確實不懂技術拜隧,承認不懂技術不丟人宿百,不懂裝懂才丟人。";
        createTime = System.currentTimeMillis();
        id = createTime + "";
        readCount =3;
        score =9.7f;
        index(content, createTime, id, readCount, score);

        content = "阿里巴巴未來二十年的目標是打造世界第五大經濟體洪添,不是我們狂妄垦页,而是世界需要這么一個經濟體,也一定會有這么一個經濟體干奢。";
        createTime = System.currentTimeMillis();
        id = createTime + "";
        readCount =69;
        score =5.6f;
        index(content, createTime, id, readCount, score);

        content = "達摩院一定也必須要超越英特爾痊焊,必須超越微軟,必須超越IBM忿峻,因為我們生于二十一世紀薄啥,我們是有機會后發(fā)優(yōu)勢的。";
        createTime = System.currentTimeMillis();
        id = createTime + "";
        readCount =38;
        score =4.7f;
        index(content, createTime, id, readCount, score);

        content = "阿里巴巴有很多爭議逛尚,似乎無處不在垄惧,我還真想不出有什么東西是我們不做的〈履互聯(lián)網是一種思想到逊,是一種技術革命铣口,不應該有界限【鹾跨界樂趣無窮脑题。我覺得阿里巴巴的跨界還不錯";
        createTime = System.currentTimeMillis();
        id = createTime + "";
        readCount =73;
        score =1.7f;
        index(content, createTime, id, readCount, score);

    }

    private static void index(String content, Long createTime, String id, int readCount, float score) {
        // 實例化IKAnalyzer分詞器
        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_47);

        Directory directory = null;
        IndexWriter iwriter;
        try {
            // 索引目錄
            directory = new SimpleFSDirectory(new File("D://test/lucene_index_blog"));

            // 配置IndexWriterConfig
            IndexWriterConfig iwConfig = new IndexWriterConfig(Version.LUCENE_47, analyzer);
            iwConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);
            iwriter = new IndexWriter(directory, iwConfig);
            // 寫入索引
            Document doc = new Document();

            doc.add(new StringField("ID", id, Field.Store.YES));
            doc.add(new TextField("content", content, Field.Store.YES));
            doc.add(new LongField("createTime", createTime, Field.Store.YES));
            doc.add(new IntField("readCount", readCount, Field.Store.YES));
            doc.add(new FloatField("score", score, Field.Store.YES));
            iwriter.addDocument(doc);
            iwriter.close();
            System.out.println("建立索引成功:" + id);
        } catch (CorruptIndexException e) {
            e.printStackTrace();
        } catch (LockObtainFailedException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (directory != null) {
                try {
                    directory.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

搜索排序

package top.yuyufeng.learn.lucene.demo2;

/**
 * @author yuyufeng
 * @date 2017/11/21
 */
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Version;

import java.io.File;
import java.io.IOException;

/**
 * created by yuyufeng on 2017/11/13.
 */
public class LuceneSearchDemo {
    public static void main(String[] args) {

        String content = "content";
        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_47);
        Directory directory = null;
        IndexReader ireader = null;
        IndexSearcher isearcher;

        try {
            //索引目錄
            directory = new SimpleFSDirectory(new File("D://test/lucene_index_blog"));
            // 配置IndexWriterConfig
            IndexWriterConfig iwConfig = new IndexWriterConfig(Version.LUCENE_47, analyzer);
            iwConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);

            // 實例化搜索器
            ireader = DirectoryReader.open(directory);
            isearcher = new IndexSearcher(ireader);

            //查詢所有
            Query query = new MatchAllDocsQuery();
            System.out.println("Query = " + query);

         
            // 排序的關鍵地方
            SortField sortField = new SortField("score",SortField.Type.FLOAT,true);
            Sort sort = new Sort(sortField);
            TopDocs topDocs = isearcher.search(query, 5,sort);
            System.out.println("命中:" + topDocs.totalHits);
            // 遍歷輸出結果
            ScoreDoc[] scoreDocs = topDocs.scoreDocs;
            for (int i = 0; i < topDocs.totalHits; i++) {
                Document targetDoc = isearcher.doc(scoreDocs[i].doc);
                System.out.println("內容:" + targetDoc.toString());
            }




        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (ireader != null) {
                try {
                    ireader.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
            if (directory != null) {
                try {
                    directory.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }

    }
}

范圍搜索

查詢score范圍在1~5之間的文檔,對于上面的代碼中的Query進行改造

Query query = NumericRangeQuery.newFloatRange("score",1f,5f,true,true);

對搜索結果的分頁

package top.yuyufeng.learn.lucene.demo2;

/**
 * @author yuyufeng
 * @date 2017/11/21
 */

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.AtomicReaderContext;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Bits;
import org.apache.lucene.util.Version;

import java.io.File;
import java.io.IOException;

/**
 * created by yuyufeng on 2017/11/13.
 */
public class LuceneSearchDemo {
    public static void main(String[] args) {
        page(2, 3);

    }

    private static void page(int page, int size) {
        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_47);
        Directory directory = null;
        IndexReader ireader = null;
        IndexSearcher isearcher;

        try {
            //索引目錄
            directory = new SimpleFSDirectory(new File("D://test/lucene_index_blog"));
            // 配置IndexWriterConfig
            IndexWriterConfig iwConfig = new IndexWriterConfig(Version.LUCENE_47, analyzer);
            iwConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);

            // 實例化搜索器
            ireader = DirectoryReader.open(directory);
            isearcher = new IndexSearcher(ireader);

            //查詢所有

            Query query = new MatchAllDocsQuery();

            TopDocs topDocs = isearcher.search(query, 100);
            int total = topDocs.totalHits;
            System.out.println("命中:" + topDocs.totalHits);
            // 遍歷輸出結果
            ScoreDoc[] scoreDocs = topDocs.scoreDocs;
            for (int i = (page - 1) * size; i < ((page - 1) * size + size > total ? total : (page - 1) * size + size); i++) {
                Document targetDoc = isearcher.doc(scoreDocs[i].doc);
                System.out.println("內容:" + targetDoc.toString());
            }


        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            if (ireader != null) {
                try {
                    ireader.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
            if (directory != null) {
                try {
                    directory.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

多條件查詢

package top.yuyufeng.learn.lucene.demo2;

/**
 * @author yuyufeng
 * @date 2017/11/21
 */
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.SimpleFSDirectory;
import org.apache.lucene.util.Version;

import java.io.File;
import java.io.IOException;

/**
 * created by yuyufeng on 2017/11/13.
 */
public class LuceneSearchDemo {
    public static void main(String[] args) {

        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_47);
        Directory directory = null;
        IndexReader ireader = null;
        IndexSearcher isearcher;

        try {
            //索引目錄
            directory = new SimpleFSDirectory(new File("D://test/lucene_index_blog"));
            // 配置IndexWriterConfig
            IndexWriterConfig iwConfig = new IndexWriterConfig(Version.LUCENE_47, analyzer);
            iwConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);

            // 實例化搜索器
            ireader = DirectoryReader.open(directory);
            isearcher = new IndexSearcher(ireader);


            BooleanQuery booleanQuery = new BooleanQuery();
            String keyword = "達摩院";
            // 條件一
            QueryParser qp = new QueryParser(Version.LUCENE_47, "content", analyzer);
            Query query = qp.parse(keyword);
            booleanQuery.add(query,BooleanClause.Occur.MUST);

            //條件二
            query = NumericRangeQuery.newFloatRange("score",1f,5f,true,true);
            booleanQuery.add(query,BooleanClause.Occur.MUST);



            TopDocs topDocs = isearcher.search(booleanQuery,100);
            System.out.println("命中:" + topDocs.totalHits);
            // 遍歷輸出結果
            ScoreDoc[] scoreDocs = topDocs.scoreDocs;
            for (int i = 0; i < topDocs.totalHits; i++) {
                Document targetDoc = isearcher.doc(scoreDocs[i].doc);
                System.out.println("內容:" + targetDoc.toString());
            }


        } catch (IOException e) {
            e.printStackTrace();
        } catch (ParseException e) {
            e.printStackTrace();
        } finally {
            if (ireader != null) {
                try {
                    ireader.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
            if (directory != null) {
                try {
                    directory.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }

    }
}

BooleanClause.Occur
| 組合方式| 結果 |
| ------------- |-------------|
|MUST和MUST | 取得連個查詢子句的交集铜靶。|
|MUST和MUST_NOT| 表示查詢結果中不能包含MUST_NOT所對應得查詢子句的檢索結果叔遂。|
|SHOULD與MUST_NOT|連用時,功能同MUST和MUST_NOT旷坦。|
|SHOULD與MUST|結果為MUST子句的檢索結果,但是SHOULD可影響排序|
|SHOULD與SHOULD|表示“或”關系掏熬,最終檢索結果為所有檢索子句的并集|
|MUST_NOT和MUST_NOT|無意義,檢索無結果|

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末秒梅,一起剝皮案震驚了整個濱河市旗芬,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌捆蜀,老刑警劉巖疮丛,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異辆它,居然都是意外死亡誊薄,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進店門锰茉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來呢蔫,“玉大人,你說我怎么就攤上這事飒筑∑酰” “怎么了?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵协屡,是天一觀的道長俏脊。 經常有香客問我,道長肤晓,這世上最難降的妖魔是什么爷贫? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮补憾,結果婚禮上漫萄,老公的妹妹穿的比我還像新娘。我一直安慰自己盈匾,他們只是感情好腾务,可當我...
    茶點故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著威酒,像睡著了一般窑睁。 火紅的嫁衣襯著肌膚如雪挺峡。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天担钮,我揣著相機與錄音橱赠,去河邊找鬼。 笑死箫津,一個胖子當著我的面吹牛狭姨,可吹牛的內容都是我干的。 我是一名探鬼主播苏遥,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼饼拍,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了田炭?” 一聲冷哼從身側響起师抄,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎教硫,沒想到半個月后叨吮,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡瞬矩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年茶鉴,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片景用。...
    茶點故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡涵叮,死狀恐怖,靈堂內的尸體忽然破棺而出伞插,到底是詐尸還是另有隱情割粮,我是刑警寧澤,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布蜂怎,位于F島的核電站穆刻,受9級特大地震影響置尔,放射性物質發(fā)生泄漏杠步。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一榜轿、第九天 我趴在偏房一處隱蔽的房頂上張望幽歼。 院中可真熱鬧,春花似錦谬盐、人聲如沸甸私。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽皇型。三九已至诬烹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間弃鸦,已是汗流浹背绞吁。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留唬格,地道東北人家破。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像购岗,于是被迫代替她去往敵國和親汰聋。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,612評論 2 350

推薦閱讀更多精彩內容