neo4j自定義中文分詞插件

新建maven項目

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xmlns="http://maven.apache.org/POM/4.0.0"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <packaging>jar</packaging>
    <groupId>com.gtja</groupId>
    <artifactId>gtja-analyzer</artifactId>
    <version>1.0-SNAPSHOT</version>
    <properties>
        <neo4j.version>4.0.5</neo4j.version>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.neo4j</groupId>
            <artifactId>neo4j</artifactId>
            <version>${neo4j.version}</version>
            <scope>provided</scope>
        </dependency>
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_seg</artifactId>
            <version>5.1.1</version>
        </dependency>
        <dependency>
            <groupId>org.ansj</groupId>
            <artifactId>ansj_lucene7_plug</artifactId>
            <version>5.1.5.2</version>
        </dependency>

    </dependencies>
    <build>
        <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <configuration>
                    <source>11</source>
                    <target>11</target>
                </configuration>
            </plugin>
            <plugin>
                <artifactId>maven-shade-plugin</artifactId>
                <configuration>
                    <createDependencyReducedPom>false</createDependencyReducedPom>
                </configuration>
                <executions>
                    <execution>
                        <phase>package</phase>
                        <goals>
                            <goal>shade</goal>
                        </goals>
                        <configuration>
                            <transformers>
                                <transformer
                                        implementation="org.apache.maven.plugins.shade.resource.ServicesResourceTransformer"/>
                            </transformers>
                        </configuration>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>
</project>

編寫核心類

package org.neo4j.kernel.api.impl.fulltext.analyzer.providers;

import org.ansj.lucene7.AnsjAnalyzer;
import org.apache.lucene.analysis.Analyzer;
import org.neo4j.graphdb.schema.AnalyzerProvider;

public class AnsjAnalyzerProvider extends AnalyzerProvider {

    public AnsjAnalyzerProvider() {
        super("ansj");
    }

    @Override
    public String description() {
        return "中文索引工具";
    }

    public Analyzer createAnalyzer() {
        return new AnsjAnalyzer(AnsjAnalyzer.TYPE.index_ansj);
    }

}

  • 自定義分詞器必須繼承AnalyzerProvider 接口.
  • 該類必須有默認的構(gòu)造方法,使用開發(fā)工具在糾錯的時候生成的構(gòu)造方法可能是是protected.這樣會導(dǎo)致插件安裝失敗,需要注意
  • 注意使用的分詞器中依賴的lucene和neo4j中依賴的Lucene,要避免版本沖突.

配置加載服務(wù)

新建resources/META-INF/services/目錄,創(chuàng)建文件org.neo4j.graphdb.schema.AnalyzerProvider,內(nèi)容:

org.neo4j.kernel.api.impl.fulltext.analyzer.providers.AnsjAnalyzerProvider

打包到插件目錄

執(zhí)行 mvn package生成jar文件,復(fù)制該文件到neo4j的plugin目錄下面,然后重啟neo4j服務(wù).

執(zhí)行下面的命令查看插件是否安裝正確:

call db.index.fulltext.listAvailableAnalyzers

如果結(jié)果集中出現(xiàn)我們定義的分詞器的名稱,則安裝成功.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末拄踪,一起剝皮案震驚了整個濱河市泉孩,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖贸辈,帶你破解...
    沈念sama閱讀 217,907評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件柿顶,死亡現(xiàn)場離奇詭異芒珠,居然都是意外死亡琅拌,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,987評論 3 395
  • 文/潘曉璐 我一進店門婚度,熙熙樓的掌柜王于貴愁眉苦臉地迎上來缰趋,“玉大人,你說我怎么就攤上這事陕见∶匮” “怎么了?”我有些...
    開封第一講書人閱讀 164,298評論 0 354
  • 文/不壞的土叔 我叫張陵评甜,是天一觀的道長灰粮。 經(jīng)常有香客問我,道長忍坷,這世上最難降的妖魔是什么粘舟? 我笑而不...
    開封第一講書人閱讀 58,586評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮佩研,結(jié)果婚禮上柑肴,老公的妹妹穿的比我還像新娘。我一直安慰自己旬薯,他們只是感情好晰骑,可當我...
    茶點故事閱讀 67,633評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著绊序,像睡著了一般硕舆。 火紅的嫁衣襯著肌膚如雪秽荞。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,488評論 1 302
  • 那天抚官,我揣著相機與錄音扬跋,去河邊找鬼。 笑死凌节,一個胖子當著我的面吹牛钦听,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播倍奢,決...
    沈念sama閱讀 40,275評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼朴上,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了娱挨?” 一聲冷哼從身側(cè)響起余指,我...
    開封第一講書人閱讀 39,176評論 0 276
  • 序言:老撾萬榮一對情侶失蹤捕犬,失蹤者是張志新(化名)和其女友劉穎跷坝,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體碉碉,經(jīng)...
    沈念sama閱讀 45,619評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡柴钻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,819評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了垢粮。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贴届。...
    茶點故事閱讀 39,932評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖蜡吧,靈堂內(nèi)的尸體忽然破棺而出毫蚓,到底是詐尸還是另有隱情,我是刑警寧澤昔善,帶...
    沈念sama閱讀 35,655評論 5 346
  • 正文 年R本政府宣布元潘,位于F島的核電站,受9級特大地震影響君仆,放射性物質(zhì)發(fā)生泄漏翩概。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,265評論 3 329
  • 文/蒙蒙 一返咱、第九天 我趴在偏房一處隱蔽的房頂上張望钥庇。 院中可真熱鬧,春花似錦咖摹、人聲如沸评姨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,871評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽参咙。三九已至龄广,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蕴侧,已是汗流浹背择同。 一陣腳步聲響...
    開封第一講書人閱讀 32,994評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留净宵,地道東北人敲才。 一個月前我還...
    沈念sama閱讀 48,095評論 3 370
  • 正文 我出身青樓,卻偏偏與公主長得像择葡,于是被迫代替她去往敵國和親紧武。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,884評論 2 354