inode是一個重要概念蝴光,是理解Unix/Linux文件系統(tǒng)和硬盤儲存的基礎澈蟆。
理解inode,不僅有助于提高系統(tǒng)操作水平英融,還有助于體會Unix設計哲學,即如何把底層的復雜性抽象成一個簡單概念歇式,從而大大簡化用戶接口驶悟。
一、inode是什么材失?
理解inode痕鳍,要從文件儲存說起。
文件儲存在硬盤上龙巨,硬盤的最小存儲單位叫做"扇區(qū)"(Sector)笼呆。每個扇區(qū)儲存512字節(jié)(相當于0.5KB)。
操作系統(tǒng)讀取硬盤的時候旨别,不會一個個扇區(qū)地讀取诗赌,這樣效率太低,而是一次性連續(xù)讀取多個扇區(qū)秸弛,即一次性讀取一個"塊"(block)铭若。這種由多個扇區(qū)組成的"塊"洪碳,是文件存取的最小單位。"塊"的大小叼屠,最常見的是4KB瞳腌,即連續(xù)八個 sector組成一個 block。
文件數據都儲存在"塊"中镜雨,那么很顯然纯趋,我們還必須找到一個地方儲存文件的元信息,比如文件的創(chuàng)建者冷离、文件的創(chuàng)建日期吵冒、文件的大小等等。這種儲存文件元信息的區(qū)域就叫做inode西剥,中文譯名為"索引節(jié)點"痹栖。
每一個文件都有對應的inode,里面包含了與該文件有關的一些信息瞭空。
二揪阿、inode的內容
inode包含文件的元信息,具體來說有以下內容:
-文件的字節(jié)數
-文件擁有者的User ID
-文件的Group ID
-文件的讀咆畏、寫南捂、執(zhí)行權限
-文件的時間戳,共有三個:ctime指inode上一次變動的時間旧找,mtime指文件內容上一次變動的時間溺健,atime指文件上一次打開的時間。
-鏈接數钮蛛,即有多少文件名指向這個inode
-文件數據block的位置
可以用stat命令鞭缭,查看某個文件的inode信息:
stat example.txt
總之,除了文件名以外的所有文件信息魏颓,都存在inode之中岭辣。至于為什么沒有文件名,下文會有詳細解釋甸饱。
三沦童、inode的大小
inode也會消耗硬盤空間,所以硬盤格式化的時候叹话,操作系統(tǒng)自動將硬盤分成兩個區(qū)域偷遗。一個是數據區(qū),存放文件數據渣刷;另一個是inode區(qū)(inode table)鹦肿,存放inode所包含的信息。
每個inode節(jié)點的大小辅柴,一般是128字節(jié)或256字節(jié)箩溃。inode節(jié)點的總數,在格式化時就給定碌嘀,一般是每1KB或每2KB就設置一個inode涣旨。假定在一塊1GB的硬盤中,每個inode節(jié)點的大小為128字節(jié)股冗,每1KB就設置一個inode霹陡,那么inode table的大小就會達到128MB,占整塊硬盤的12.8%止状。
查看每個硬盤分區(qū)的inode總數和已經使用的數量烹棉,可以使用df命令。
df -I
查看每個inode節(jié)點的大小怯疤,可以用如下命令:
sudo dumpe2fs -h /dev/hda | grep "Inode size"
由于每個文件都必須有一個inode浆洗,因此有可能發(fā)生inode已經用光,但是硬盤還未存滿的情況集峦。這時伏社,就無法在硬盤上創(chuàng)建新文件。
四塔淤、inode號碼
每個inode都有一個號碼摘昌,操作系統(tǒng)用inode號碼來識別不同的文件。
這里值得重復一遍高蜂,Unix/Linux系統(tǒng)內部不使用文件名聪黎,而使用inode號碼來識別文件。對于系統(tǒng)來說备恤,文件名只是inode號碼便于識別的別稱或者綽號挺举。
表面上,用戶通過文件名烘跺,打開文件湘纵。實際上,系統(tǒng)內部這個過程分成三步:首先滤淳,系統(tǒng)找到這個文件名對應的inode號碼梧喷;其次,通過inode號碼脖咐,獲取inode信息铺敌;最后,根據inode信息屁擅,找到文件數據所在的block偿凭,讀出數據。
使用ls -i命令派歌,可以看到文件名對應的inode號碼:
ls -I example.txt
五弯囊、目錄文件
Unix/Linux系統(tǒng)中痰哨,目錄(directory)也是一種文件。打開目錄匾嘱,實際上就是打開目錄文件斤斧。
目錄文件的結構非常簡單,就是一系列目錄項(dirent)的列表霎烙。每個目錄項撬讽,由兩部分組成:所包含文件的文件名,以及該文件名對應的inode號碼悬垃。
ls命令只列出目錄文件中的所有文件名:
ls /etc
如果要查看文件的詳細信息游昼,就必須根據inode號碼,訪問inode節(jié)點尝蠕,讀取信息烘豌。ls -l命令列出文件的詳細信息。
ls -l /etc
理解了上面這些知識趟佃,就能理解目錄的權限扇谣。目錄文件的讀權限(r)和寫權限(w),都是針對目錄文件本身闲昭。由于目錄文件內只有文件名和inode號碼罐寨,所以如果只有讀權限,只能獲取文件名序矩,無法獲取其他信息鸯绿,因為其他信息都儲存在inode節(jié)點中,而讀取inode節(jié)點內的信息需要目錄文件的執(zhí)行權限(x)簸淀。
六瓶蝴、硬鏈接
一般情況下,文件名和inode號碼是"一一對應"關系租幕,每個inode號碼對應一個文件名舷手。但是,Unix/Linux系統(tǒng)允許劲绪,多個文件名指向同一個inode號碼男窟。
這意味著,可以用不同的文件名訪問同樣的內容贾富;對文件內容進行修改歉眷,會影響到所有文件名;但是颤枪,刪除一個文件名汗捡,不影響另一個文件名的訪問。這種情況就被稱為"硬鏈接"(hard link)畏纲。
ln命令可以創(chuàng)建硬鏈接:
ln 源文件 目標文件
運行上面這條命令以后扇住,源文件與目標文件的inode號碼相同春缕,都指向同一個inode。inode信息中有一項叫做"鏈接數"台囱,記錄指向該inode的文件名總數淡溯,這時就會增加1读整。
反過來簿训,刪除一個文件名,就會使得inode節(jié)點中的"鏈接數"減1米间。當這個值減到0强品,表明沒有文件名指向這個inode,系統(tǒng)就會回收這個inode號碼屈糊,以及其所對應block區(qū)域的榛。
這里順便說一下目錄文件的"鏈接數"。創(chuàng)建目錄時逻锐,默認會生成兩個目錄項:"."和".."夫晌。前者的inode號碼就是當前目錄的inode號碼,等同于當前目錄的"硬鏈接"昧诱;后者的inode號碼就是當前目錄的父目錄的inode號碼晓淀,等同于父目錄的"硬鏈接"。所以盏档,任何一個目錄的"硬鏈接"總數凶掰,總是等于2加上它的子目錄總數(含隱藏目錄)。
七蜈亩、軟鏈接
除了硬鏈接以外懦窘,還有一種特殊情況。
文件A和文件B的inode號碼雖然不一樣稚配,但是文件A的內容是文件B的路徑畅涂。讀取文件A時,系統(tǒng)會自動將訪問者導向文件B道川。因此午衰,無論打開哪一個文件,最終讀取的都是文件B愤惰。這時苇经,文件A就稱為文件B的"軟鏈接"(soft link)或者"符號鏈接(symbolic link)。
這意味著宦言,文件A依賴于文件B而存在扇单,如果刪除了文件B,打開文件A就會報錯:"No such file or directory"奠旺。這是軟鏈接與硬鏈接最大的不同:文件A指向文件B的文件名蜘澜,而不是文件B的inode號碼施流,文件B的inode"鏈接數"不會因此發(fā)生變化。
ln -s命令可以創(chuàng)建軟鏈接鄙信。
ln -s 源文文件或目錄 目標文件或目錄
八瞪醋、inode的特殊作用
由于inode號碼與文件名分離,這種機制導致了一些Unix/Linux系統(tǒng)特有的現象装诡。
- 有時银受,文件名包含特殊字符,無法正常刪除鸦采。這時宾巍,直接刪除inode節(jié)點,就能起到刪除文件的作用渔伯。
- 移動文件或重命名文件顶霞,只是改變文件名,不影響inode號碼锣吼。
- 打開一個文件以后选浑,系統(tǒng)就以inode號碼來識別這個文件,不再考慮文件名玄叠。因此古徒,通常來說,系統(tǒng)無法從inode號碼得知文件名诸典。
第3點使得軟件更新變得簡單描函,可以在不關閉軟件的情況下進行更新,不需要重啟狐粱。因為系統(tǒng)通過inode號碼舀寓,識別運行中的文件,不通過文件名肌蜻。更新的時候互墓,新版文件以同樣的文件名,生成一個新的inode蒋搜,不會影響到運行中的文件篡撵。等到下一次運行這個軟件的時候,文件名就自動指向新版文件豆挽,舊版文件的inode則被回收育谬。