java調(diào)用solr的分詞查詢結(jié)果

一序无、修改 solr-7.3.1\server\solr\articles【創(chuàng)建的core的名稱】\conf\managed-schema文件

1、增加中文的分詞器:

<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">

? ? <analyzer type="index">

? ? ? <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>

? ? </analyzer>

? ? <analyzer type="query">

? ? ? <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>

? ? </analyzer>

? </fieldType>

2、增加字段名烟勋,指定text_cn類型:<field name="cnname" type="text_cn" indexed="true" stored="true" required="true" multiValued="false" />

3启摄、pom引入jiar

<dependency>

? ? ? <groupId>org.springframework.data</groupId>

? ? ? <artifactId>spring-data-solr</artifactId>

? ? </dependency>

二、java代碼如下:


package com.silverbox.solr;

import java.io.IOException;

import java.util.ArrayList;

import java.util.Iterator;

import java.util.List;

import org.apache.solr.client.solrj.SolrClient;

import org.apache.solr.client.solrj.SolrServerException;

import org.apache.solr.client.solrj.impl.HttpSolrClient;

import org.apache.solr.client.solrj.request.FieldAnalysisRequest;

import org.apache.solr.client.solrj.response.AnalysisResponseBase.AnalysisPhase;

import org.apache.solr.client.solrj.response.AnalysisResponseBase.TokenInfo;

import org.apache.solr.client.solrj.response.FieldAnalysisResponse;

/**

* @Author:sks

* @Description:利用solr分詞組件進(jìn)行分詞

* @Date:Created in 14:07 2017/12/14

* @Modified by:

**/

public class splitwords {

? ? public static void main(String []args) throws SolrServerException, IOException{

? ? ? ? String urlString = "http://localhost:6789/solr/mote";

? ? ? ? Init(urlString);

? ? ? ? String txt = "全黨同志一定要登高望遠(yuǎn)实束、居安思危奥秆,勇于變革、勇于創(chuàng)新咸灿,永不僵化构订、永不停滯,團(tuán)結(jié)帶領(lǐng)全國各族人民決勝全面建成小康社會(huì)避矢,奮力奪取新時(shí)代中國特色社會(huì)主義偉大勝利";

? ? ? ? List<String> results = getAnalysis(txt);

? ? ? ? for(String word :results){

? ? ? ? ? ? System.out.println(word);

? ? ? ? }

? ? }

? ? private static SolrClient solr;

? ? /**

? ? * @Author:sks

? ? * @Description:初始化solr客戶端

? ? * @Date:

? ? */

? ? public static void Init(String urlString){

? ? ? // solr = new HttpSolrClient.Builder(urlString).build();


? ? ? ? //HttpSolrClient solr = null;

? ? ? ? solr = new HttpSolrClient(urlString);


? ? }

? ? /**

? ? * @Author:sks

? ? * @Description:分詞統(tǒng)計(jì)悼瘾,把字符串分詞并返回分詞列表

? ? * @Date:

? ? */

? ? public static List<String> getAnalysis(String sentence) {

? ? ? ? FieldAnalysisRequest request = new FieldAnalysisRequest(

? ? ? ? ? ? ? ? "/analysis/field");

? ? ? ? request.addFieldName("cnname");// 字段名,隨便指定一個(gè)支持中文分詞的字段

? ? ? ? request.setFieldValue("");// 字段值审胸,可以為空字符串亥宿,但是需要顯式指定此參數(shù)

? ? ? ? request.setQuery(sentence);

? ? ? ? FieldAnalysisResponse response = null;

? ? ? ? try {

? ? ? ? ? ? response = request.process(solr);

? ? ? ? } catch (Exception e) {

? ? ? ? ? ? e.printStackTrace();

? ? ? ? }

? ? ? ? List<String> results = new ArrayList<String>();

? ? ? ? Iterator<AnalysisPhase> it = response.getFieldNameAnalysis("cnname")

? ? ? ? ? ? ? ? .getQueryPhases().iterator();

? ? ? ? while(it.hasNext()) {

? ? ? ? ? ? AnalysisPhase pharse = (AnalysisPhase)it.next();

? ? ? ? ? ? List<TokenInfo> list = pharse.getTokens();

? ? ? ? ? ? for (TokenInfo info : list) {

? ? ? ? ? ? ? ? results.add(info.getText());

? ? ? ? ? ? }

? ? ? ? }

? ? ? ? return results;

? ? }

}


執(zhí)行結(jié)果:

全黨

同志

一定

登高望遠(yuǎn)

,

居安思危

,

勇于

變革

,

勇于

創(chuàng)新

,

永不

僵化

,

永不

停滯

,

團(tuán)結(jié)

帶領(lǐng)

全國

各族

人民

決勝

全面

建成

小康

社會(huì)

,

奮力

奪取

時(shí)代

中國

特色

社會(huì)主義

偉大

勝利

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市砂沛,隨后出現(xiàn)的幾起案子烫扼,更是在濱河造成了極大的恐慌,老刑警劉巖尺上,帶你破解...
    沈念sama閱讀 218,941評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件材蛛,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡怎抛,警方通過查閱死者的電腦和手機(jī)卑吭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來马绝,“玉大人豆赏,你說我怎么就攤上這事「坏荆” “怎么了掷邦?”我有些...
    開封第一講書人閱讀 165,345評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長椭赋。 經(jīng)常有香客問我抚岗,道長,這世上最難降的妖魔是什么哪怔? 我笑而不...
    開封第一講書人閱讀 58,851評(píng)論 1 295
  • 正文 為了忘掉前任宣蔚,我火速辦了婚禮向抢,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘胚委。我一直安慰自己挟鸠,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評(píng)論 6 392
  • 文/花漫 我一把揭開白布亩冬。 她就那樣靜靜地躺著艘希,像睡著了一般。 火紅的嫁衣襯著肌膚如雪硅急。 梳的紋絲不亂的頭發(fā)上覆享,一...
    開封第一講書人閱讀 51,688評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音铜秆,去河邊找鬼淹真。 笑死,一個(gè)胖子當(dāng)著我的面吹牛连茧,可吹牛的內(nèi)容都是我干的核蘸。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼啸驯,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼客扎!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起罚斗,我...
    開封第一講書人閱讀 39,319評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤徙鱼,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后针姿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體袱吆,經(jīng)...
    沈念sama閱讀 45,775評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年距淫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了绞绒。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,096評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡榕暇,死狀恐怖蓬衡,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情彤枢,我是刑警寧澤狰晚,帶...
    沈念sama閱讀 35,789評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站缴啡,受9級(jí)特大地震影響壁晒,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜业栅,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評(píng)論 3 331
  • 文/蒙蒙 一讨衣、第九天 我趴在偏房一處隱蔽的房頂上張望换棚。 院中可真熱鬧式镐,春花似錦反镇、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至你弦,卻和暖如春惊豺,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背禽作。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評(píng)論 1 271
  • 我被黑心中介騙來泰國打工尸昧, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人旷偿。 一個(gè)月前我還...
    沈念sama閱讀 48,308評(píng)論 3 372
  • 正文 我出身青樓烹俗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親萍程。 傳聞我的和親對(duì)象是個(gè)殘疾皇子幢妄,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容