分布式存儲

認識分布式存儲

分布式存儲系統(tǒng)懂盐，是通過網(wǎng)絡(luò)將數(shù)據(jù)分散存儲在多臺獨立的設(shè)備上牙躺。

分布式存儲系統(tǒng)的特性

可擴展
分布式存儲系統(tǒng)可以擴展到甚至幾千臺的集群規(guī)模佩迟，而且隨著集群規(guī)模的增長酬诀，系統(tǒng)整體性能表現(xiàn)為線性增長磺芭。分布式存儲的水平擴展有以下幾個特性：
??
?? 1）節(jié)點擴展后有梆，舊數(shù)據(jù)會自動遷移到新節(jié)點是尖，實現(xiàn)負載均衡，避免單點過熱的情況出現(xiàn)泥耀；
??
?? 2）水平擴展只需要將新節(jié)點和原有集群連接到同一網(wǎng)絡(luò)饺汹，整個過程不會對業(yè)務(wù)造成影響；
??
?? 3）當(dāng)節(jié)點被添加到集群痰催，集群系統(tǒng)的整體容量和性能也隨之線性擴展兜辞，伺候新節(jié)點的資源就會被管理平臺接管，被用于分配或者回收
??
低成本
分布式存儲系統(tǒng)的自動容錯夸溶、自動負載均衡機制使其可以構(gòu)建在普通的PC機之上弦疮。另外，線性擴展能力也使得增加蜘醋、減少機器非常方便胁塞，可以實現(xiàn)自動運維。
??
??
高性能
無論是針對整個集群還是單臺服務(wù)器，都要求分布式存儲系統(tǒng)具備高性能啸罢。
??
??
易用
分布式存儲系統(tǒng)需要能夠提供易用的對外接口编检，另外，也要求具備完善的監(jiān)控扰才、運維工具允懂，并能夠與其他系統(tǒng)集成。
??
易管理
可通過一個簡單的WEB界面就可以對整個系統(tǒng)進行配置管理衩匣，運維簡便蕾总，極低的管理成本。
??
??
分布式存儲系統(tǒng)的挑戰(zhàn)主要在于數(shù)據(jù)琅捏、狀態(tài)信息的持久化生百，要求在自動遷移、自動容錯柄延、并發(fā)讀寫的過程中保證數(shù)據(jù)的一致性蚀浆，分布式存儲涉及的技術(shù)主要來自兩個領(lǐng)域，分布式系統(tǒng)以及數(shù)據(jù)庫搜吧。

存儲分類
??
本地存儲本地的文件系統(tǒng),不能放在網(wǎng)絡(luò)上用.
??ext3??ext4??xfs??ntfs
??
網(wǎng)絡(luò)存儲---網(wǎng)絡(luò)文件系統(tǒng)市俊、共享的都是文件系統(tǒng)
????nfs??????網(wǎng)絡(luò)文件系統(tǒng)
????hdfs??????分布式網(wǎng)絡(luò)文件系統(tǒng)
????glusterfs????分布式網(wǎng)絡(luò)文件系統(tǒng)
??
共享的是裸設(shè)備
??塊存儲 cinder ??ceph（塊存儲??對象存儲??網(wǎng)絡(luò)文件系統(tǒng)-分布式）
??SAN（存儲區(qū)域網(wǎng)）
??
分布式
??集群
??

分布式存儲分類介紹

Hadoop HDFS(大數(shù)據(jù)分布式文件系統(tǒng))

HDFS(Hadoop Distributed File System)是一個分布式文件系統(tǒng)，是hadoop生態(tài)系統(tǒng)的一個重要組成部分滤奈，是hadoop中的存儲組件摆昧、HDFS是一個高度容錯性的系統(tǒng)、HDFS能提供高吞吐量的數(shù)據(jù)訪問蜒程，非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用据忘。
??
??
HDFS的優(yōu)點：
??1.高容錯性
??????數(shù)據(jù)自動保存多個副本
??????副本丟失后,自動恢復(fù)
??2.良好的數(shù)據(jù)訪問機制
??????一次寫入,多次讀取,保證數(shù)據(jù)一致性
??3.適合大數(shù)據(jù)文件的存儲
??????TB甚至PB級數(shù)據(jù)
??????擴展能力很強
?
HDFS的缺點：
??1.低延遲數(shù)據(jù)訪問
??????難以應(yīng)付毫秒級以下的應(yīng)用
??2.海量小文件存取
??????占用NameNode大量內(nèi)存
??3.一個文件只能有一個寫入者
??????僅支持append(追加)
?

OpenStack的對象存儲Swift

OpenStack object Storage(swift)是openStack開源云計算項目的子項目之一。Swift的目的是使用普通硬件來構(gòu)建冗余的搞糕、可擴展的分布式對象存儲集群勇吊，存儲容量可達PB級。Swift的是用Python開發(fā)
??
其主要特點為：
1窍仰、各個存儲的節(jié)點完全對等汉规，是對稱的系統(tǒng)架構(gòu)。
2驹吮、開發(fā)者通過一個RESTful HTTP API與對象存儲系統(tǒng)相互作用针史。
3、無單點故障：Swift的元數(shù)據(jù)存儲是完全均勻隨機分布的碟狞，并且與對象文件存儲一樣啄枕，元數(shù)據(jù)也會存儲多份。整個Swift集群中族沃，也沒有一個角色是單點的频祝。
4泌参、在不影響性能的情況下，集群通過增加外部節(jié)點進行擴展常空。
5沽一、無限的可擴展性：這里的擴展性分兩方便，一是數(shù)據(jù)存儲容量無線可擴展漓糙；二是Swift性能（如QPS铣缠、吞吐量等）可線性提升，擴容只需要簡單地新增機制昆禽，系統(tǒng)會自動完成數(shù)據(jù)遷移等工作蝗蛙，使各存儲節(jié)點重新達到平衡狀態(tài)。
6醉鳖、極高的數(shù)據(jù)持久性
??
??
??
Swift可以用一下用途捡硅；
圖片、文檔存儲
長期保存的日志文件
存儲媒體庫（照片辐棒、音樂、視頻等）
視頻監(jiān)控文件的存檔
總結(jié)：Swift適合用來存儲大量的牍蜂、長期的漾根、需要備份的對象。

公有云對象存儲

公有云大都只有對象存儲鲫竞。例如辐怕，谷歌云存儲是一個極速，具有可擴展性和高可用性的對象存儲从绘。

Amazon類似產(chǎn)品就是S3寄疏； http://aws.amazon.com/s3;
??
微軟類似產(chǎn)品Azure Bolb： http://azure.microsoft.com/en-us/documentation/articles/storage-dotnet-how-to-use-blobs/;
??
阿里類似的oss： https://ww.aliyun.com/product/oss/;
??
阿里云對象存儲oss
阿里云對象存儲服務(wù)（object Storage Service，簡稱OSS）僵井，是阿里云提供的海量陕截、安全、低成本批什、高可靠的云存儲服務(wù)
?
?
存儲類型（storage class）
OSS提供標(biāo)準(zhǔn)农曲、低頻訪問、歸檔三種存儲類型驻债，其中標(biāo)準(zhǔn)存儲類型提供高可靠乳规、高可用、高性能的對象存儲服務(wù)合呐，能夠支持頻繁的數(shù)據(jù)訪問暮的；低頻訪問存儲類型適合長期保存不經(jīng)常訪問的數(shù)據(jù)（平均每月訪問頻率1到2次），存儲單價低于標(biāo)準(zhǔn)類型淌实；歸檔存儲類型適合需要長期保存（建議半年以上）的歸檔數(shù)據(jù)冻辩，在三種存儲類型中單價最低猖腕。
??
??
應(yīng)用場景
1、圖片和音視頻等應(yīng)用的海量存儲
??OSS可用于圖片微猖、音視頻谈息、日志等海量文件的存儲
2、云端數(shù)據(jù)處理
??上傳到OSS后凛剥，可以配合媒體處理服務(wù)和圖片處理服務(wù)進行云端的數(shù)據(jù)處理侠仇。
3、網(wǎng)頁或者移動應(yīng)用的靜態(tài)和動態(tài)資源分離
??利用海量互聯(lián)網(wǎng)帶寬犁珠，OSS可以實現(xiàn)海量數(shù)據(jù)的互聯(lián)網(wǎng)并發(fā)下載逻炊。

GlusterFS分布式文件系統(tǒng)

GlusterFS （GNU ClusterFile System）是一種全對稱的開源分布式文件系統(tǒng)，所謂全對稱是指GlusterFS采用彈性哈希算法犁享，沒有中心節(jié)點余素，所謂節(jié)點全部平等。GlusterFS配置方便炊昆，穩(wěn)定性好桨吊，可輕松達到PB級容量，數(shù)千個節(jié)點凤巨，2011年被紅帽收購视乐。
??
PB級容量 ??高可用性??基于文件系統(tǒng)級別共享??分布式??去中心化
??
GlusterFS存儲卷的類型
??
基本類型：條帶，復(fù)制敢茁，哈希
復(fù)合卷
復(fù)合卷就是分布式復(fù)制佑淀，分布式條帶，分布式條帶復(fù)制卷彰檬，像分布式復(fù)制伸刃，分布式條帶這兩個是比較常用的，像分布式條帶復(fù)制三種揉一塊兒的比較少逢倍。
??
各種卷的整理
分布卷：存儲數(shù)據(jù)時捧颅，將文件隨機存儲到各個GlusterFS機器上
????優(yōu)點：存儲數(shù)據(jù)時，讀取速度快
????缺點：一個birck壞掉较雕，文件就會丟失
復(fù)制卷：存儲數(shù)據(jù)時隘道，所有文件分別存儲到每臺glusterfs機器上
????優(yōu)點：對文件進行的多次備份，一個brick壞掉郎笆，文件不會丟失谭梗，其他機器上的brick上面有備份
????缺點：占用資源
條帶卷：存數(shù)據(jù)時，一個文件分開存到每臺glusterfs機器上
????優(yōu)點：對大文件宛蚓，讀寫速度快
????缺點：一個birck壞掉激捏，文件就會壞掉

最常見的GPFS和HDFS有什么區(qū)別？

GPFS和Hadoop的HDFS系統(tǒng)對比凄吏，它涉及用于在商用硬件上存儲類似或更大的數(shù)據(jù)
???&emsp
HDFS還將文件分割成塊远舅，并將它們存儲在不同的文件系統(tǒng)節(jié)點內(nèi)闰蛔。
???&emsp
HDFS對磁盤可靠性依賴并不高，它可以在不通的節(jié)點內(nèi)存儲塊的副本图柏。保存單一副本塊的一個節(jié)點出現(xiàn)故障可以再復(fù)制該組其他的有效塊內(nèi)的副本序六。相較而言，雖然GPFS支持故障節(jié)點恢復(fù)蚤吹，但它是一個更嚴重的時間例诀，它可能包括數(shù)據(jù)（暫時性）丟失的高風(fēng)險
???&emsp
GPFS支持完整的Posix文件系統(tǒng)語義。HDFS和GFS（谷歌文件系統(tǒng)）并不支持完整的Posix語義裁着。
???&emsp
GPFS跨文件系統(tǒng)分布它的目錄索引和其他元數(shù)據(jù)繁涂。相反，Hadoop將它們保留在主要和次要Namenode中二驰，大型服務(wù)器必須在RAM內(nèi)存儲所有的索引信息扔罪。
???&emsp
GPFS將文件分割成小塊，Hadoop HDFS喜歡64MB甚至更多的塊桶雀，因為這降低了Namenode的儲存需求矿酵。小塊或很多小的文件會快速填充文件系統(tǒng)的索引，因此限制了文件系統(tǒng)的大小矗积。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末全肮，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子漠魏，更是在濱河造成了極大的恐慌倔矾，老刑警劉巖妄均，帶你破解...
沈念sama閱讀 218,682評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件柱锹，死亡現(xiàn)場離奇詭異，居然都是意外死亡丰包，警方通過查閱死者的電腦和手機禁熏，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,277評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來邑彪，“玉大人瞧毙，你說我怎么就攤上這事〖闹ⅲ” “怎么了宙彪？”我有些...
開封第一講書人閱讀 165,083評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長有巧。經(jīng)常有香客問我释漆，道長，這世上最難降的妖魔是什么篮迎？我笑而不...
開封第一講書人閱讀 58,763評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任男图，我火速辦了婚禮示姿，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘逊笆。我一直安慰自己栈戳，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,785評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布难裆。她就那樣靜靜地躺著子檀，像睡著了一般。火紅的嫁衣襯著肌膚如雪差牛。梳的紋絲不亂的頭發(fā)上命锄，一...
開封第一講書人閱讀 51,624評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音偏化，去河邊找鬼脐恩。笑死，一個胖子當(dāng)著我的面吹牛侦讨，可吹牛的內(nèi)容都是我干的驶冒。我是一名探鬼主播，決...
沈念sama閱讀 40,358評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼韵卤，長吁一口氣：“原來是場噩夢啊……” “哼骗污！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起沈条，我...
開封第一講書人閱讀 39,261評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤需忿，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后蜡歹，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體屋厘，經(jīng)...
沈念sama閱讀 45,722評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年月而，在試婚紗的時候發(fā)現(xiàn)自己被綠了汗洒。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,030評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡父款，死狀恐怖溢谤，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情憨攒，我是刑警寧澤世杀，帶...
沈念sama閱讀 35,737評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站肝集，受9級特大地震影響瞻坝，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜包晰，卻給世界環(huán)境...
茶點故事閱讀 41,360評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一湿镀、第九天我趴在偏房一處隱蔽的房頂上張望炕吸。院中可真熱鬧，春花似錦勉痴、人聲如沸赫模。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,941評論 0贊 22
一樁弒父案蒸矛，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽瀑罗。三九已至，卻和暖如春雏掠，著一層夾襖步出監(jiān)牢的瞬間斩祭，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,057評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工乡话，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留摧玫，地道東北人。一個月前我還...
沈念sama閱讀 48,237評論 3贊 371
代替公主和親
正文我出身青樓绑青，卻偏偏與公主長得像诬像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子闸婴，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,976評論 2贊 355

分布式存儲

認識分布式存儲

分布式存儲系統(tǒng)的特性

分布式存儲分類介紹

Hadoop HDFS(大數(shù)據(jù)分布式文件系統(tǒng))

OpenStack的對象存儲Swift

公有云對象存儲

GlusterFS分布式文件系統(tǒng)

最常見的GPFS和HDFS有什么區(qū)別？

推薦閱讀更多精彩內(nèi)容