結(jié)構(gòu)化數(shù)據(jù)如日期铐料、電話號(hào)渐裂、賬戶余額、產(chǎn)品名稱等钠惩,嚴(yán)格遵循數(shù)據(jù)格式與長度規(guī)范柒凉、易于由二維表結(jié)構(gòu)進(jìn)行邏輯表達(dá)和實(shí)現(xiàn),與之相反妻柒,非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整扛拨、缺乏預(yù)定義數(shù)據(jù)模型耘分、格式多種多樣举塔,比如文檔绑警、圖片、音頻央渣、視頻计盒、社交媒體記錄等,往往呈現(xiàn)出雜亂無章的特點(diǎn)芽丹。
針對(duì)結(jié)構(gòu)化數(shù)據(jù)北启,市面上有大量成熟的分析工具可用來實(shí)現(xiàn)數(shù)據(jù)洞察,但非結(jié)構(gòu)化數(shù)據(jù)難以標(biāo)準(zhǔn)化和理解拔第,處理難度較大咕村,對(duì)其價(jià)值挖掘尚處于發(fā)展階段。
關(guān)于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)蚊俺,目前業(yè)內(nèi)主要有擅長存儲(chǔ)海量文件的NAS文件存儲(chǔ)和對(duì)象存儲(chǔ)兩種選項(xiàng)懈涛。
文件存儲(chǔ)
以文件和文件夾為操作對(duì)象,基于文件夾/文件的路徑訪問數(shù)據(jù)泳猬。這是一種比較接地氣的形式批钠,我們?nèi)粘T陔娔X里先打開父文件夾,再層層點(diǎn)開父文件夾嵌套的子文件夾得封,最后找到子文件夾里的某個(gè)文件埋心,這一套流程就是文件存儲(chǔ)的體驗(yàn)。
作為數(shù)據(jù)存儲(chǔ)老手忙上,文件存儲(chǔ)已經(jīng)被廣泛應(yīng)用十幾年拷呆,它能兼顧多個(gè)應(yīng)用和多個(gè)用戶訪問,突出優(yōu)勢(shì)是方便文件共享晨横。
對(duì)象存儲(chǔ)
是近些年的存儲(chǔ)網(wǎng)紅洋腮,它以對(duì)象(object,不是搞對(duì)象的對(duì)象)為操作對(duì)象手形。不同于文件存儲(chǔ)的樹狀嵌套分層結(jié)構(gòu)啥供,對(duì)象存儲(chǔ)架構(gòu)更為扁平化,它將數(shù)據(jù)及其元數(shù)據(jù)打包放到一個(gè)超大的資源池库糠,用戶可根據(jù)唯一的元數(shù)據(jù)快速定位文件伙狐。
有這么一個(gè)比喻,同樣到商場存包瞬欧,文件存儲(chǔ)這個(gè)商場里贷屎,你要記住自己的物品放在哪間儲(chǔ)存室的哪排柜子的第幾號(hào),而在對(duì)象存儲(chǔ)商場艘虎,存包員會(huì)給你一張憑條唉侄,你只需將憑條交給存包員即可取包,無需記住數(shù)據(jù)以什么形式存在了哪里野建。
對(duì)象存儲(chǔ)的靈活性和扁平架構(gòu)決定了它可以通過擴(kuò)展來存儲(chǔ)海量數(shù)據(jù)属划,其容量通程裉荆可達(dá)到EB級(jí)以上,從理論上講對(duì)象存儲(chǔ)的容量和對(duì)象數(shù)量可以無限擴(kuò)充同眯。
文件存儲(chǔ)還是對(duì)象存儲(chǔ)绽昼?
既然文件存儲(chǔ)和對(duì)象存儲(chǔ)的都適用于海量非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),那么用戶什么時(shí)候選擇文件存儲(chǔ)须蜗,什么時(shí)候選擇對(duì)象存儲(chǔ)呢硅确?
有兩個(gè)主要指標(biāo),一看數(shù)據(jù)規(guī)模明肮,二看應(yīng)用場景菱农。
01 數(shù)據(jù)規(guī)模
文件存儲(chǔ)通過將數(shù)據(jù)劃分為類別、目錄和文件夾來獲取非結(jié)構(gòu)化數(shù)據(jù)并將其結(jié)構(gòu)化柿估,由此用戶可以快速輕松地查詢搜索大莫。
但是文件存儲(chǔ)中,一旦文件數(shù)達(dá)到數(shù)千萬級(jí)別官份,目錄樹越建越深只厘,就會(huì)造成性能瓶頸,不僅查詢效率嚴(yán)重下降舅巷,而且超多超大文件管理困難羔味,嚴(yán)重影響業(yè)務(wù)效率。
對(duì)于幾乎無形中可以添加更多空間钠右、彈性擴(kuò)容的對(duì)象存儲(chǔ)來說赋元,爆炸性膨脹的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)簡直是小菜一碟。
因此飒房,如果組織要處理的非結(jié)構(gòu)化數(shù)據(jù)量有限搁凸,文件存儲(chǔ)是最佳選擇。若組織需要處理大量數(shù)據(jù)狠毯,那么選擇對(duì)象存儲(chǔ)是更明智的決定护糖。
02 應(yīng)用場景
對(duì)象存儲(chǔ)之所以成為近些年的存儲(chǔ)頂流,除了其容量無限制嚼松、強(qiáng)擴(kuò)展的特性嫡良,還在于其天然擁抱云和互聯(lián)網(wǎng)的特質(zhì)。
在對(duì)象存儲(chǔ)中献酗,用戶若想修改文件寝受,只能先下載、修改罕偎,再將修改后的文件上傳很澄,這一特性決定了它非常適合讀取多寫入少的場景——比如網(wǎng)站視頻播放、網(wǎng)盤應(yīng)用、機(jī)器學(xué)習(xí)的數(shù)據(jù)訓(xùn)練甩苛、物聯(lián)網(wǎng)數(shù)據(jù)傳輸忙干、云原生等,對(duì)于這些現(xiàn)代化應(yīng)用浪藻,對(duì)象存儲(chǔ)大有可為。
此外乾翔,對(duì)象存儲(chǔ)也被稱為云存儲(chǔ)爱葵,如今已成為云服務(wù)公司的一項(xiàng)基礎(chǔ)業(yè)務(wù),全球各知名廠商紛紛推出基于對(duì)象存儲(chǔ)的云存儲(chǔ)服務(wù)反浓,憑借其事實(shí)上的語言——AWS S3 API萌丈,對(duì)象存儲(chǔ)可以在內(nèi)部部署/私有云環(huán)境與公有云存儲(chǔ)之間進(jìn)行無縫訪問和移動(dòng)。
因此雷则,對(duì)于人工智能辆雾、物聯(lián)網(wǎng)、云原生等新興應(yīng)用月劈,對(duì)象存儲(chǔ)將是不錯(cuò)的選擇度迂。
————————————————
來源:https://blog.csdn.net/younger_china/article/details/127924452