日志文件系統(tǒng)(journaling file systems)可防止系統(tǒng)崩潰時導(dǎo)致的數(shù)據(jù)不一致問題。對文件系統(tǒng)元數(shù)據(jù)(metadata)的更改都被保存在一份單獨的日志里梧兼,當(dāng)發(fā)生系統(tǒng)崩潰時可以根據(jù)日志正確地恢復(fù)數(shù)據(jù)放吩。除此之外,日志使系統(tǒng)重新啟動時不必進(jìn)行文件系統(tǒng)的檢查羽杰,從而縮短了恢復(fù)時間渡紫。
所以說元數(shù)據(jù)就是數(shù)據(jù)的數(shù)據(jù)到推。
任何文件系統(tǒng)中的數(shù)據(jù)分為數(shù)據(jù)和元數(shù)據(jù)。數(shù)據(jù)是指普通文件中的實際數(shù)據(jù)惕澎,而元
數(shù)據(jù)指用來描述一個文件的特征的系統(tǒng)數(shù)據(jù)莉测,諸如訪問權(quán)限、文件擁有者以及文件數(shù)據(jù)
塊的分布信息(inode...)等等唧喉。在集群文件系統(tǒng)中捣卤,分布信息包括文件在磁盤上的位置以及磁盤在集群中的位置。用戶需要操作一個文件必須首先得到它的元數(shù)據(jù)八孝,才能定位到文件的位置并且得到文件的內(nèi)容或相關(guān)屬性董朝。
2. 元數(shù)據(jù)管理方式
元數(shù)據(jù)管理有兩種方式。集中式管理和分布式管理干跛。集中式管理是指在系統(tǒng)中有一個節(jié)點專門司職元數(shù)據(jù)管理子姜,所有元數(shù)據(jù)都存儲在該節(jié)點的存儲設(shè)備上。所有客戶端對文件的請求前楼入,都要先對該元數(shù)據(jù)管理器請求元數(shù)據(jù)哥捕。分布式管理是指將元數(shù)據(jù)存放在系統(tǒng)的任意節(jié)點并且能動態(tài)的遷移。對元數(shù)據(jù)管理的職責(zé)也分布到各個不同的節(jié)點上嘉熊。大多數(shù)集群文件系統(tǒng)都采用集中式的元數(shù)據(jù)管理遥赚。因為集中式管理實現(xiàn)簡單,一致性維護(hù)容易阐肤,在一定的操作頻繁度內(nèi)可以提供較滿意的性能凫佛。缺點是單一失效點問題,若該服務(wù)器失效孕惜,整個系統(tǒng)將無法正常工作御蒲。而且,當(dāng)對元數(shù)據(jù)的操作過于頻繁時诊赊,集中的元數(shù)據(jù)管理成為整個系統(tǒng)的性能瓶頸。
分布式元數(shù)據(jù)管理的好處是解決了集中式管理的單一失效點問題府瞄,而且性能不會隨著操作頻繁而出現(xiàn)瓶頸碧磅。其缺點是,實現(xiàn)復(fù)雜遵馆,一致性維護(hù)復(fù)雜鲸郊,對性能有一定影響。