二 數(shù)據(jù)輸入:文檔和索引

數(shù)據(jù)輸入: 文檔和索引 edit

Elasticsearch 是一個(gè)分布式文檔存儲(chǔ)颤霎,它并不是將數(shù)據(jù)存儲(chǔ)為行或者列,而是將復(fù)雜數(shù)據(jù)序列化為json文檔進(jìn)行存儲(chǔ)治拿。當(dāng)你在集群中配置了多個(gè)Elasticsearch 節(jié)點(diǎn)時(shí)摩泪,存儲(chǔ)的文檔通過(guò)集群進(jìn)行存儲(chǔ),并且可以通過(guò)任何一個(gè)節(jié)點(diǎn)實(shí)時(shí)訪問(wèn)劫谅。
當(dāng)一個(gè)文檔被存儲(chǔ)以后见坑,它將在1秒內(nèi)被索引和實(shí)現(xiàn)完全的查詢(?)。Elasticsearch 使用一種倒排索引的數(shù)據(jù)結(jié)構(gòu)支持快速的全文檢索捏检。倒排索引列出在任何文檔中出現(xiàn)的每個(gè)唯一單詞荞驴,并標(biāo)識(shí)每個(gè)單詞出現(xiàn)的所有文檔。
索引可以被視為一種優(yōu)化的文檔的集合贯城,并且每個(gè)文檔都是字段(field)的集合,是一種包含了你的數(shù)據(jù)的鍵值對(duì)熊楼。默認(rèn)情況下,Elasticsearch會(huì)為field中的所有數(shù)據(jù)制作索引能犯,并且每個(gè)索引話的字段都有自己獨(dú)特的鲫骗,優(yōu)化過(guò)的數(shù)據(jù)結(jié)構(gòu)。例如:文本數(shù)據(jù)被存儲(chǔ)為倒排索引踩晶,數(shù)字和地理信息字段被存儲(chǔ)為 BKD 樹(shù)形結(jié)構(gòu)(?)执泰。這種使用per-field數(shù)據(jù)結(jié)構(gòu)的來(lái)組裝(?)和返回搜索結(jié)果的能力讓Elasticsearch 超級(jí)快。
This default behavior makes it easy to index and explore your data—?just start indexing documents and Elasticsearch will detect and map booleans, floating point and integer values, dates, and strings to the appropriate Elasticsearch datatypes.
Elasticsearch也有無(wú)模式的能力渡蜻,這就意味著無(wú)需配置如何處理文檔中出現(xiàn)的所有可能出現(xiàn)的field(這個(gè)好像是專有名詞一類的東西)术吝,文檔就可以被索引化。當(dāng)動(dòng)態(tài)映射被開(kāi)啟之后茸苇,Elasticsearch可以自動(dòng)檢測(cè)并添加新的field到索引中排苍。這種默認(rèn)行為讓Elasticsearch 可以非常容易的索引和瀏覽你的數(shù)據(jù)——只需開(kāi)始索引文檔,Elasticsearch就可以將檢測(cè)并將Boolean, Float, Integer, Date和String映射到相應(yīng)的Elasticsearch中合適的數(shù)據(jù)類型学密。

但是淘衙,最終還是你本人比ElasticSearch更了解你的數(shù)據(jù)和如何正確的使用。你可以自己定義規(guī)則來(lái)控制動(dòng)態(tài)映射腻暮,明確的定義映射(?)來(lái)控制field如何被存儲(chǔ)和索引幔翰。

定義你自己的映射規(guī)則可以讓你

  • 區(qū)分full-text字符串字段和精確值字符串字段
  • 執(zhí)行特定語(yǔ)言的文本分析(中英文的區(qū)分漩氨,中文使用IK分詞器?遗增?)
  • 優(yōu)化字段用于部分匹配
  • 使用自定義的日期格式
  • Use data types such as geo_point and geo_shape that cannot be automatically detected
  • 使用類似geo_point and geo_shape 的這種無(wú)法被西東檢測(cè)的數(shù)據(jù)類型

通常相同的字段,為了不同的目的款青,使用不同的方式進(jìn)行索引是非常有用的做修。例如,您可能希望將字符串field索引為全文搜索的文本字段和用于排序或聚合數(shù)據(jù)的關(guān)鍵字字段抡草∈渭埃或者,你也可以選擇使用不止一種語(yǔ)言分析器來(lái)處理包含用戶輸入的字符串字段的內(nèi)容康震。
The analysis chain that is applied to a full-text field during indexing is also used at search time. When you query a full-text field, the query text undergoes the same analysis before the terms are looked up in the index.
在索引的時(shí)候應(yīng)用于全文字段(full-text field)的分析鏈燎含,在搜索的時(shí)候也被使用。當(dāng)你查詢?nèi)淖侄螘r(shí)腿短,查詢文本會(huì)在索引中查找之前進(jìn)行相同的分析屏箍。
【就是說(shuō)查詢文本 和 文檔建立的索引 執(zhí)行的是相同的規(guī)則,完全匹配橘忱,提高命中率高赴魁,這么理解我覺(jué)得沒(méi)毛病?】

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市钝诚,隨后出現(xiàn)的幾起案子颖御,更是在濱河造成了極大的恐慌,老刑警劉巖凝颇,帶你破解...
    沈念sama閱讀 222,807評(píng)論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件潘拱,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡拧略,警方通過(guò)查閱死者的電腦和手機(jī)芦岂,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,284評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)辑鲤,“玉大人盔腔,你說(shuō)我怎么就攤上這事≡氯欤” “怎么了弛随?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,589評(píng)論 0 363
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)宁赤。 經(jīng)常有香客問(wèn)我舀透,道長(zhǎng),這世上最難降的妖魔是什么决左? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,188評(píng)論 1 300
  • 正文 為了忘掉前任愕够,我火速辦了婚禮走贪,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘惑芭。我一直安慰自己坠狡,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,185評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布遂跟。 她就那樣靜靜地躺著逃沿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪幻锁。 梳的紋絲不亂的頭發(fā)上凯亮,一...
    開(kāi)封第一講書(shū)人閱讀 52,785評(píng)論 1 314
  • 那天,我揣著相機(jī)與錄音哄尔,去河邊找鬼假消。 笑死,一個(gè)胖子當(dāng)著我的面吹牛岭接,可吹牛的內(nèi)容都是我干的富拗。 我是一名探鬼主播,決...
    沈念sama閱讀 41,220評(píng)論 3 423
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼亿傅,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼媒峡!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起葵擎,我...
    開(kāi)封第一講書(shū)人閱讀 40,167評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤谅阿,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后酬滤,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體签餐,經(jīng)...
    沈念sama閱讀 46,698評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,767評(píng)論 3 343
  • 正文 我和宋清朗相戀三年盯串,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了氯檐。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,912評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡体捏,死狀恐怖冠摄,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情几缭,我是刑警寧澤河泳,帶...
    沈念sama閱讀 36,572評(píng)論 5 351
  • 正文 年R本政府宣布,位于F島的核電站年栓,受9級(jí)特大地震影響拆挥,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜某抓,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,254評(píng)論 3 336
  • 文/蒙蒙 一纸兔、第九天 我趴在偏房一處隱蔽的房頂上張望惰瓜。 院中可真熱鬧,春花似錦汉矿、人聲如沸崎坊。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,746評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)流强。三九已至,卻和暖如春呻待,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背队腐。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,859評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工蚕捉, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人柴淘。 一個(gè)月前我還...
    沈念sama閱讀 49,359評(píng)論 3 379
  • 正文 我出身青樓迫淹,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親为严。 傳聞我的和親對(duì)象是個(gè)殘疾皇子敛熬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,922評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容