今天我們來思考一個簡單的問題。在Linux下你用touch
命令新建一個空文件锅必,
touch empty_file.txt
操作完成后梯投,是否要消耗掉我們的一些磁盤空間?需要的話,大概能消耗多少分蓖?嗯尔艇,是的,這個問題簡單的超乎你的想象么鹤,但是不知道你否能給你自己一個滿意的答案终娃。
我前面的幾篇文章都是介紹的磁盤物理層面的構成,但這對于理解文件相關的問題幫助可能還不夠蒸甜。從今天開始讓我們從物理層往上走棠耕,到Linux文件系統(tǒng)原理里去尋找答案。
實踐出真知
我覺得可能先丟開內核原理柠新,直接動手操作來實驗更有意思一些窍荧。你一定知道ls
這個命令你可以查看文件大小,那么讓我們就用它來看一下恨憎。
# touch abcdefghigklmn.txt
# ls -l
total 0
-rw-r--r-- 1 root root 0 Aug 17 17:49 empty.file
額蕊退,ls
命令告訴我這個空文件占用的是0。 文件的大小確實是0憔恳,因為我們還沒有為該文件寫入任何內容瓤荔。但是我們現(xiàn)在要思考的是,一個空文件是否占用磁盤空間钥组。所以直覺告訴我們這絕對不可能输硝,磁盤上多出來一個文件,怎么可能一點空間開銷都沒有程梦!
為了解開這個謎底点把,還需要借助df命令。輸入df –i
# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
......
/dev/sdb1 2147361984 12785019 2134576965 1% /search
這個輸出幫我們展示了我們文件系統(tǒng)中inode的使用情況屿附。注意IUsed是12785019郎逃。我們繼續(xù)新建一個空文件
# touch empty_file2.txt
df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
......
/dev/sdb1 2147361984 12785020 2134576964 1% /search
[@bjzw_46_76 temp]#
這下注意IUsed變成了12785020。
哈哈拿撩,我們的一個結論就出來了衣厘。新建一個空文件會占用一個Inode如蚜。
細說inode
那么inode里都存了哪些和文件相關的信息呢压恒?我們再稍微看一下內核的源代碼。大家可以下載一份linux的源代碼错邦。以ext2文件系統(tǒng)為例探赫,在我下載的linux-2.6里的文件fs/ext2/ext2.h中,可以找到內核對于inode結構體的定義撬呢。該結構體較為復雜伦吠,主要存儲除了文件內容以外的一些其他數(shù)據(jù),我們選一些比較關鍵的截取出來:
struct ext2_inode {
__le16 i_mode; # 文件權限
__le16 i_uid; # 文件所有者ID
__le32 i_size; # 文件字節(jié)數(shù)大小
__le32 i_atime; # 文件上次被訪問的時間
__le32 i_ctime; # 文件創(chuàng)建時間
__le32 i_mtime; # 文件被修改的時間
__le32 i_dtime; # 文件被刪除的時間
__le16 i_gid; # 文件所屬組ID
__le16 i_links_count; # 此文件的inode被連接的次數(shù)
__le32 i_blocks; # 文件的block數(shù)量
......
__le32 i_block[EXT2_N_BLOCKS]; # 指向存儲文件數(shù)據(jù)的塊的數(shù)組
......
可以看到和文件相關的所屬用戶、訪問時間等都是存在inode中的毛仪。另外在include/linux/fs.h中搁嗓,還有個VFS層面的inode的定義,這里咱就不發(fā)散了箱靴。使用stat命令就可以直接看到文件inode中數(shù)據(jù)腺逛。
# stat test
File: `test'
Size: 0 Blocks: 0 IO Block: 1024 regular empty file
Device: 801h/2049d Inode: 26 Links: 1
Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2020-03-01 12:14:31.000000000 +0800
Modify: 2020-03-01 12:14:31.000000000 +0800
Change: 2020-03-01 12:14:31.000000000 +0800
每個inode到底是多大呢?dumpe2fs可以告訴你(XFS的話使用xfs_info)衡怀。
# dumpe2fs -h /dev/mapper/vgroot-lvroot
dumpe2fs 1.41.12 (17-May-2010)
......
Inode size: 256
Inode size表示每個Inode的大小棍矛。我的這臺機器上,每個inode都是256字節(jié)抛杨。兩個inode的大小正好對齊到磁盤扇區(qū)的512字節(jié)够委。
文件名存到哪里了
inode結構體都看完了,搞了半天不知道有沒有發(fā)現(xiàn)一個問題怖现,inode里并沒有存儲文件名W旅薄!那么真竖,文件名到底跑哪兒去了脐雪?
在fs/ext2/ext2.h
中,我找到了如下文件夾相關的結構體
struct ext2_dir_entry {
__le32 inode; /* Inode number */
__le16 rec_len; /* Directory entry length */
__le16 name_len; /* Name length */
char name[]; /* File name, up to EXT2_NAME_LEN */
};
這個結構體就是我們司空見慣的文件夾恢共。沒錯喳整,文件名是存在其所屬的文件夾數(shù)據(jù)結構中的矢沿,就是其中的char name[]
字段。和文件名一起,文件夾里還記錄了該文件的inode等信息雷滚。
結論
- 新建一個空文件需要消耗掉一個inode,用來保存用戶初斑、創(chuàng)建時間等元數(shù)據(jù)宪肖。
- 新建一個空文件還需要消耗掉其所有目錄的block中一定的空間,這些空間用來保存文件名濒生,權限埋泵、時間等信息
所以,看起來新建一個空文件而已罪治,只要你想挖丽声,真的能挖出很多知識的。最后分享一個我們團隊里同學遇到的一個故障觉义。我們的一臺離線任務機直接歇菜了雁社,重啟后排查原因是inode被消耗光了。再追查發(fā)現(xiàn)一個進程創(chuàng)建了太多的空日志文件晒骇。雖然文件都是空文件霉撵,但是inode卻被浪費光了磺浙。后來讓負責的同學修改了創(chuàng)建日志文件的邏輯,刪掉了多出來的空文件徒坡,該機器恢復正常撕氧。
歡迎搜索微信公眾號:開發(fā)內功修煉