Neo4j全文檢索

全文檢索基本概念

  • 搜索
    搜索這個(gè)行為是用戶與搜索引擎的一次交互過(guò)程,用戶需要找一些數(shù)據(jù),他提供給搜索引擎一些約束條件.搜索引擎通過(guò)約束條件抽取一些結(jié)果給用戶
  • 搜索引擎
    搜索引擎存在的目的是存儲(chǔ),查找和獲取數(shù)據(jù).Neo4j用的搜索引擎是Lucene
  • 文檔
    在搜索軟件中,文檔是一等公民.存儲(chǔ),搜索,顯示都是以文檔為核心.文檔簡(jiǎn)單可以理解為數(shù)據(jù)庫(kù)中的一行數(shù)據(jù),但是這行數(shù)據(jù)包括了field name.
  • 倒排索引
    倒排索引是搜索引擎中核心數(shù)據(jù)結(jié)構(gòu).簡(jiǎn)而言之,它將所有文檔變成像是一本書后面詞匯表的東西. 通過(guò)這種數(shù)據(jù)結(jié)構(gòu)能夠快速的從一個(gè)單詞找到文檔
  • Lucene搜索語(yǔ)法
Query implementation Purpose Example
TermQuery 單詞匹配 neo4j
PhraseQuery 短語(yǔ)匹配 "graph database"
RangeQuery 范圍匹配 [A TO Z] {A TO Z}
WildcardQuery 正則匹配 g*p?, d??abase
PrefixQuery 前綴匹配 algo*
FuzzyQuery 后綴匹配 cipher~
BooleanQuery 查詢條件聚合 graph AND "shortest path"

環(huán)境準(zhǔn)備

  • 容器啟動(dòng)Neo4j
    docker run -p 17687:7687 -p 17474:7474 --name=neo4j-test neo4j:3.5.3
  • 創(chuàng)建數(shù)據(jù), 使用測(cè)試數(shù)據(jù).
    :play northwind-graph

Neo4j全文檢索

Neo4j全文檢索有以下特性,不過(guò)用下來(lái)最重要的我感覺(jué)是創(chuàng)建索引的語(yǔ)句實(shí)際上只是創(chuàng)建于給命名控件. Neo4j從2.2.x時(shí)代開始就默認(rèn)開啟node_auto_indexing=true. 倒排索引在數(shù)據(jù)插入時(shí)候已經(jīng)創(chuàng)建了. 創(chuàng)建索引/刪除索引代價(jià)是非常小的

  • 支持關(guān)系與節(jié)點(diǎn)的索引
  • 支持常用analyzers擴(kuò)展
  • 可以使用lucene query語(yǔ)句
  • 可以返回查詢結(jié)果評(píng)分
  • 對(duì)索引自動(dòng)更新
  • 單索引文檔數(shù)量不限

索引創(chuàng)建與刪除

建立兩個(gè)索引, 一個(gè)是Product的該標(biāo)簽的索引. 另外一個(gè)全數(shù)據(jù)庫(kù)全文檢索的索引

call db.index.fulltext.createNodeIndex("all",['Product', 'Category', 'Supplier'],['reorderLevel', 'unitsInStock', 'unitPrice', 'supplierID', 'productID', 'discontinued', 'quantityPerUnit', 'categoryID', 'unitsOnOrder', 'productName', 'description', 'categoryName', 'picture', 'country', 'address', 'contactTitle', 'city', 'phone', 'contactName', 'postalCode', 'companyName', 'fax', 'region', 'homePage'])

call db.index.fulltext.createNodeIndex("product",['Product'],['reorderLevel', 'unitsInStock', 'unitPrice', 'supplierID', 'productID', 'quantityPerUnit', 'discontinued', 'productName', 'unitsOnOrder', 'categoryID'])

刪除索引

call db.index.fulltext.drop("all")

可以通過(guò)函數(shù)獲取所有標(biāo)簽和屬性

call db.propertyKeys
call db.labels

查詢

這里面的查詢非常簡(jiǎn)單.只要記住一個(gè)語(yǔ)句就能應(yīng)付大多數(shù)場(chǎng)景

call db.index.fulltext.queryNodes(
    'all',        //這里索引名
    'Av'          // lucene查詢語(yǔ)句
) yield node
where node.address contains "12"   // where語(yǔ)句
return node 
order by node.address  // order skip limit
skip 0
limit 1
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子挖胃,更是在濱河造成了極大的恐慌雷袋,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件密似,死亡現(xiàn)場(chǎng)離奇詭異焙矛,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)残腌,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門村斟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人抛猫,你說(shuō)我怎么就攤上這事蟆盹。” “怎么了闺金?”我有些...
    開封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵逾滥,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我败匹,道長(zhǎng)寨昙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任掀亩,我火速辦了婚禮舔哪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘槽棍。我一直安慰自己尸红,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著外里,像睡著了一般怎爵。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上盅蝗,一...
    開封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天鳖链,我揣著相機(jī)與錄音,去河邊找鬼墩莫。 笑死芙委,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的狂秦。 我是一名探鬼主播灌侣,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼裂问!你這毒婦竟也來(lái)了侧啼?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤堪簿,失蹤者是張志新(化名)和其女友劉穎痊乾,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體椭更,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡哪审,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了虑瀑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片湿滓。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖舌狗,靈堂內(nèi)的尸體忽然破棺而出茉稠,到底是詐尸還是另有隱情,我是刑警寧澤把夸,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布而线,位于F島的核電站,受9級(jí)特大地震影響恋日,放射性物質(zhì)發(fā)生泄漏膀篮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一岂膳、第九天 我趴在偏房一處隱蔽的房頂上張望誓竿。 院中可真熱鬧,春花似錦谈截、人聲如沸筷屡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)毙死。三九已至燎潮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間扼倘,已是汗流浹背确封。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留再菊,地道東北人爪喘。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像纠拔,于是被迫代替她去往敵國(guó)和親秉剑。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • Solr&ElasticSearch原理及應(yīng)用 一稠诲、綜述 搜索 http://baike.baidu.com/it...
    樓外樓V閱讀 7,291評(píng)論 1 17
  • 1. 案例分析:什么時(shí)全文檢索侦鹏,如何實(shí)現(xiàn)全文檢索 ? 1.1 案例 ? 實(shí)現(xiàn)一個(gè)文件的搜索功能,通過(guò)關(guān)鍵字搜索文件...
    東方舵手閱讀 1,181評(píng)論 0 1
  • 1. Lucene 官網(wǎng) 1). 概述 Lucene是一款高性能的吕粹、可擴(kuò)展的信息檢索(IR)工具庫(kù)。信息檢索是指文...
    _凌浩雨閱讀 931評(píng)論 0 1
  • 目錄結(jié)構(gòu):1.全文檢索 2.Lucene入門3.Lucene進(jìn)階 全文檢索 一, 生活中的搜索:1.Win...
    CoderZS閱讀 1,678評(píng)論 0 12
  • 原文鏈接# Lucene學(xué)習(xí)總結(jié)之一:全文檢索的基本原理岗仑,這是我遇見(jiàn)最好的入門匹耕,近10年前的文章如今讀來(lái)依然讓人耳...
    囧雪啥都不知道閱讀 877評(píng)論 4 0