elasticsearch插件分析(2)-elasticsearch-sql

嗯师郑，最近實(shí)在是閑的有點(diǎn)不知所措了

背景介紹

elasticsearch-sql插件是之前發(fā)現(xiàn)的一款可以用sql來代替es本身令人頭疼的語法的插件寥院。es的查詢一般來說是使用curl去訪問它的rest接口，大部分情況下如果我需要查詢一些數(shù)據(jù)我都必須打開head插件然后小心謹(jǐn)慎的編寫json查詢字符串嗡靡，時(shí)不時(shí)的還要判斷自己時(shí)不時(shí)多了少了大括號逗號冀宴，其中苦悶可想而知李皇；并且es的查詢語法畢竟也沒有到像sql一樣可以熟練祟印，每次查詢的時(shí)候還是要去復(fù)制以前的模板過來修改肴沫。我個(gè)人為了工作是有收藏一些常用的查詢語句拿來改的，但該插件可以使用sql語句去查詢es索引蕴忆，方便之余便也想探究它的源碼颤芬。

依賴介紹

elasticsearch5.6.10(快速構(gòu)造集群方法可以參考我之前的文章使用docker-compose構(gòu)建elasticsearch集群)
idea (當(dāng)然你可以使用別的ide)
elasticsearch-sql插件5.6.10.0

過程分析

搭建環(huán)境

首先還是一樣，訪問elasticsearch-sql的github地址套鹅，很意外的看到這是在NLPchina賬號的倉庫下站蝠，居然是國產(chǎn)的作品！那么更值得去分析一下了卓鹿。下方的readme也提示了不同版本之間的對應(yīng)關(guān)系菱魔，目前支持的最新版本是6.3.0.不過我最近在測試的是5.6.10版本。所以到本地目錄做如下操作

git clone xxxx
git tag
git check 5.6.10.0

OK吟孙，我們成功check到5.6.10版本的源代碼澜倦。接下來打開IDEA進(jìn)行Import。導(dǎo)入過程中無腦next就完事了杰妓≡逯危看文件目錄的文件有pom文件所以可以很清晰的確認(rèn)該項(xiàng)目是由maven管理，剩下的就按照平時(shí)管理maven項(xiàng)目的方式進(jìn)行處理就可以了巷挥。

總體分析

首先可以看下工程的整個(gè)大致目錄結(jié)構(gòu)

├── BUILDING.md
├── LICENSE
├── README.md
├── doc
│   └── features.md
├── elasticsearch-sql.iml
├── open-source.pom.xml
├── pom.xml
├── src
│   ├── _site
│   ├── assembly
│   ├── main
│   ├── site-server
│   └── test
└── target
    ├── classes
    ├── generated-sources
    ├── generated-test-sources
    └── test-classes

對整個(gè)工程會(huì)有一個(gè)大致的了解栋艳，然后打開pom文件瀏覽整個(gè)工程的依賴構(gòu)成。稍微會(huì)關(guān)注幾個(gè)依賴句各，比如es依賴包的版本是否正確吸占。但這個(gè)時(shí)候看到一個(gè)比較出乎我意料的依賴

        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>druid</artifactId>
            <version>1.0.15</version>
        </dependency>

我個(gè)人因?yàn)楣ぷ鞯年P(guān)系和關(guān)系型數(shù)據(jù)庫們打的交道不多，但是這個(gè)大名鼎鼎的產(chǎn)品我還是知道的

Druid是一個(gè)JDBC組件庫凿宾，包括數(shù)據(jù)庫連接池矾屯、SQL Parser等組件。DruidDataSource是最好的數(shù)據(jù)庫連接池

我第一反應(yīng)是為什么它會(huì)存在初厚，這個(gè)插件主要是在和es集群互動(dòng)件蚕，實(shí)際上不會(huì)使用到mysql驅(qū)動(dòng)，并不會(huì)使用到JDBC這個(gè)組件产禾，為什么pom文件中會(huì)有它的出現(xiàn)呢排作？其實(shí)往后看就明白了。

初步嘗試

再回看上面的目錄樹亚情，可以看到src目錄下的幾個(gè)子目錄妄痪，有幾個(gè)目錄名字都是見名思義，這也是我覺得java圈子中一些規(guī)范的好處楞件，約定大于配置衫生。比如assembly目錄下一定回事打包配置文件裳瘪，main目錄下有源碼的根包罪针，test目錄下會(huì)有單元測試代碼彭羹。所以順利成章的我會(huì)去先通過單元測試來了解整個(gè)插件的源代碼。

├── AggregationTest.java
├── CSVResultsExtractorTests.java
├── DeleteTest.java
├── ExplainTest.java
├── JDBCTests.java
├── JoinTests.java
├── MainTestSuite.java
├── MethodQueryTest.java
├── MultiQueryTests.java
├── MyTest.java
├── QueryTest.java
├── SQLFunctionsTest.java
├── ShowTest.java
├── SourceFieldTest.java
├── SqlParserTests.java
├── TestsConstants.java
├── UtilTests.java
└── WktToGeoJsonConverterTests.java

上面是test目錄下的文件結(jié)構(gòu)泪酱，其中MyTest文件是我加的派殷。
從文件名上可以猜測出對應(yīng)es各個(gè)操作的測試以及一些其他的測試，比如AggregationTest就很容易猜測說它是聚合操作的相關(guān)測試墓阀，我們初來乍到愈腾，找一個(gè)最簡單的測試，QueryTest.java岂津。

    @Test
    public void searchTypeTest() throws IOException, SqlParseException, SQLFeatureNotSupportedException{
        SearchHits response = query(String.format("SELECT * FROM %s/phrase LIMIT 1000", TEST_INDEX));
        Assert.assertEquals(4, response.getTotalHits());
    }

上面是QueryTest類的第一個(gè)測試方法，看樣子也很簡單悦即，做一次
SELECT * FROM TEST_INDEX LIMIT 1000的查詢吮成，結(jié)果如果等于4的話單元測試通過

tips:Assert是斷言的意思，當(dāng)然我知道你已經(jīng)知道辜梳。

無腦直接運(yùn)行粱甫，即使我知道我什么配置文件都沒配置過。

java.lang.NullPointerException
    at org.nlpcn.es4sql.QueryTest.query(QueryTest.java:942)
    at org.nlpcn.es4sql.QueryTest.searchTypeTest(QueryTest.java:48)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:47)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:44)
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17)
    at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:271)
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:70)
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:50)
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:238)
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:63)
    at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:236)
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:53)
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:229)
    at org.junit.runners.ParentRunner.run(ParentRunner.java:309)
    at org.junit.runner.JUnitCore.run(JUnitCore.java:160)
    at com.intellij.junit4.JUnit4IdeaTestRunner.startRunnerWithArgs(JUnit4IdeaTestRunner.java:68)
    at com.intellij.rt.execution.junit.IdeaTestRunner$Repeater.startRunnerWithArgs(IdeaTestRunner.java:47)
    at com.intellij.rt.execution.junit.JUnitStarter.prepareStreamsAndStart(JUnitStarter.java:242)
    at com.intellij.rt.execution.junit.JUnitStarter.main(JUnitStarter.java:70)

毫不意外地收到報(bào)錯(cuò)作瞄，但是為什么是空指針異常茶宵？我原來的猜測是肯定會(huì)跳出找不到集群，然后我跟隨去配置集群地址就好宗挥。根據(jù)錯(cuò)誤棧我來到了這個(gè)query方法

    private SearchHits query(String query) throws SqlParseException, SQLFeatureNotSupportedException, SQLFeatureNotSupportedException {
        SearchDao searchDao = MainTestSuite.getSearchDao();
        SqlElasticSearchRequestBuilder select = (SqlElasticSearchRequestBuilder) searchDao.explain(query).explain();
        return ((SearchResponse)select.get()).getHits();
    }

該方法并沒有@Test的注解乌庶，不是單元測試方法，異常出現(xiàn)在SearchDao searchDao = MainTestSuite.getSearchDao();searchDao是null契耿，那么為什么會(huì)是null呢瞒大？繼續(xù)跟蹤到MainTestSuite類中，然后發(fā)現(xiàn)了新天地搪桂。其實(shí)這邊也有約定大于配置的好處透敌，看到TestSuite就知道這是個(gè)批量測試的類了。類中有兩個(gè)注解@BeforeClass @AfterClass踢械，剛才的原因就找到了酗电，剛才直接獲取searchDao沒有經(jīng)過預(yù)加載，所以是null内列。那么新的問題來了撵术，我不想要運(yùn)行整個(gè)TestSuite，我只想要運(yùn)行一個(gè)測試方法话瞧，要怎么辦呢荷荤？這時(shí)候需要稍微修改下代碼了退渗，回到QueryTest.java中，添加以下兩個(gè)方法

    @Before
    public void setup() throws Exception {
        MainTestSuite.setUp();
    }

    @After
    public void end() throws InterruptedException {
        MainTestSuite.tearDown();
    }

同時(shí)有一個(gè)地方要注意蕴纳，除非你通過外部參數(shù)傳入你的es的ip和端口会油，否則可以在MainTestSuite中做以下修改

    protected static InetSocketTransportAddress getTransportAddress() throws UnknownHostException {
        String host = System.getenv("ES_TEST_HOST");
        String port = System.getenv("ES_TEST_PORT");

        if(host == null) {
            host = "localhost";
            System.out.println("ES_TEST_HOST enviroment variable does not exist. choose default 'localhost'");
        }

        if(port == null) {
            port = "9302";
            System.out.println("ES_TEST_PORT enviroment variable does not exist. choose default '9300'");
        }

        System.out.println(String.format("Connection details: host: %s. port:%s.", host, port));
        return new InetSocketTransportAddress(InetAddress.getByName(host), Integer.parseInt(port));
    }

將你的ip和端口直接修改。
接下來就可以直接在測試方法上右鍵運(yùn)行了古毛。

淺嘗輒止

我并沒有特別細(xì)致的閱讀完整個(gè)源代碼翻翩，我只想要找到我關(guān)注的點(diǎn)去仔細(xì)閱讀。而在我拿到這份源代碼的時(shí)候我有兩點(diǎn)特別感興趣

通過什么方式來封裝sql語句為es的請求
有沒有什么比較干凈優(yōu)雅的抽象方式
這里我不再細(xì)致的列出我怎么翻到的步驟稻薇，而是上最終結(jié)果嫂冻，同時(shí)也解答了前面為什么會(huì)有druid的疑惑。
直接看看以下這個(gè)類DefaultQueryAction.java的explain方法

    @Override
    public SqlElasticSearchRequestBuilder explain() throws SqlParseException {
        this.request = client.prepareSearch();
        setIndicesAndTypes();

        setFields(select.getFields());

        setWhere(select.getWhere());
        setSorts(select.getOrderBys());
        setLimit(select.getOffset(), select.getRowCount());

        boolean usedScroll = useScrollIfNeeded(select.isOrderdSelect());
        if (!usedScroll) {
            request.setSearchType(SearchType.DFS_QUERY_THEN_FETCH);
        }
        updateRequestWithIndexAndRoutingOptions(select, request);
        updateRequestWithHighlight(select, request);
        updateRequestWithCollapse(select, request);

        SqlElasticSearchRequestBuilder sqlElasticRequestBuilder = new SqlElasticSearchRequestBuilder(request);

        return sqlElasticRequestBuilder;
    }

對于es的api熟悉的人看到這個(gè)就明白了this.request = client.prepareSearch();
在這里類中創(chuàng)建了一個(gè)request請求塞椎，將select對象中已經(jīng)把sql語句解析出來的結(jié)果以各種方式轉(zhuǎn)換成request中的參數(shù)桨仿，最后直接發(fā)送這個(gè)request整個(gè)封裝過程就結(jié)束了。那么這個(gè)select結(jié)果如何獲得呢案狠？我們看這個(gè)類ESActionFactory.java

    public static QueryAction create(Client client, String sql) throws SqlParseException, SQLFeatureNotSupportedException {
        sql = sql.replaceAll("\n"," ");
        String firstWord = sql.substring(0, sql.indexOf(' '));
        switch (firstWord.toUpperCase()) {
            case "SELECT":
                SQLQueryExpr sqlExpr = (SQLQueryExpr) toSqlExpr(sql);
                if(isMulti(sqlExpr)){
                    MultiQuerySelect multiSelect = new SqlParser().parseMultiSelect((SQLUnionQuery) sqlExpr.getSubQuery().getQuery());
                    handleSubQueries(client,multiSelect.getFirstSelect());
                    handleSubQueries(client,multiSelect.getSecondSelect());
                    return new MultiQueryAction(client, multiSelect);
                }
                else if(isJoin(sqlExpr,sql)){
                    JoinSelect joinSelect = new SqlParser().parseJoinSelect(sqlExpr);
                    handleSubQueries(client, joinSelect.getFirstTable());
                    handleSubQueries(client, joinSelect.getSecondTable());
                    return ESJoinQueryActionFactory.createJoinAction(client, joinSelect);
                }
                else {
                    Select select = new SqlParser().parseSelect(sqlExpr);
                    handleSubQueries(client, select);
                    return handleSelect(client, select);
                }
            case "DELETE":
                SQLStatementParser parser = createSqlStatementParser(sql);
                SQLDeleteStatement deleteStatement = parser.parseDeleteStatement();
                Delete delete = new SqlParser().parseDelete(deleteStatement);
                return new DeleteQueryAction(client, delete);
            case "SHOW":
                return new ShowQueryAction(client,sql);
            default:
                throw new SQLFeatureNotSupportedException(String.format("Unsupported query: %s", sql));
        }
    }

其中最關(guān)鍵的SQLQueryExpr sqlExpr = (SQLQueryExpr) toSqlExpr(sql);
SQLQueryExpr是druid中用來描述sql語句的類服傍，不需要再自己重新封裝，只需要利用阿里的工作成果即可~高
走到這里突然想到骂铁，其實(shí)druid是一個(gè)對于數(shù)據(jù)源的管理方式和工具吹零，并不一定是結(jié)構(gòu)數(shù)據(jù)庫，如果說把es也看成一個(gè)數(shù)據(jù)源拉庵，是不是更好理解了呢灿椅？

結(jié)束

不過說到底這個(gè)插件我用的還是不多，不靈活钞支，以及前期已經(jīng)投入了很多對于es語法的學(xué)習(xí)成本茫蛹，還有一點(diǎn)是，熟悉es的語法對于使用原生的javaAPI時(shí)很有幫助烁挟。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末麻惶，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子信夫，更是在濱河造成了極大的恐慌窃蹋，老刑警劉巖，帶你破解...
沈念sama閱讀 222,183評論 6贊 516
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件静稻，死亡現(xiàn)場離奇詭異警没，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)振湾，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,850評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門杀迹，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人押搪，你說我怎么就攤上這事树酪∏衬耄” “怎么了？”我有些...
開封第一講書人閱讀 168,766評論 0贊 361
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵续语，是天一觀的道長垂谢。經(jīng)常有香客問我，道長疮茄，這世上最難降的妖魔是什么滥朱？我笑而不...
開封第一講書人閱讀 59,854評論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮力试，結(jié)果婚禮上徙邻，老公的妹妹穿的比我還像新娘。我一直安慰自己畸裳，他們只是感情好缰犁，可當(dāng)我...
茶點(diǎn)故事閱讀 68,871評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著怖糊，像睡著了一般帅容。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上蓬抄，一...
開封第一講書人閱讀 52,457評論 1贊 311
城市分裂傳說
那天，我揣著相機(jī)與錄音夯到，去河邊找鬼嚷缭。笑死，一個(gè)胖子當(dāng)著我的面吹牛耍贾，可吹牛的內(nèi)容都是我干的阅爽。我是一名探鬼主播，決...
沈念sama閱讀 40,999評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼荐开，長吁一口氣：“原來是場噩夢啊……” “哼付翁！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起晃听，我...
開封第一講書人閱讀 39,914評論 0贊 277
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤百侧，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后能扒，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體佣渴，經(jīng)...
沈念sama閱讀 46,465評論 1贊 319
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,543評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年初斑，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辛润。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,675評論 1贊 353
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡见秤，死狀恐怖砂竖，靈堂內(nèi)的尸體忽然破棺而出真椿，到底是詐尸還是另有隱情，我是刑警寧澤乎澄，帶...
沈念sama閱讀 36,354評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布突硝，位于F島的核電站，受9級特大地震影響三圆，放射性物質(zhì)發(fā)生泄漏狞换。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 42,029評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一舟肉、第九天我趴在偏房一處隱蔽的房頂上張望修噪。院中可真熱鬧，春花似錦路媚、人聲如沸黄琼。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,514評論 0贊 25
一樁弒父案整慎，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽脏款。三九已至，卻和暖如春裤园，著一層夾襖步出監(jiān)牢的瞬間撤师，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,616評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工拧揽，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留剃盾，地道東北人。一個(gè)月前我還...
沈念sama閱讀 49,091評論 3贊 378
代替公主和親
正文我出身青樓淤袜，卻偏偏與公主長得像痒谴，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子铡羡，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,685評論 2贊 360