如何描述一個(gè)文件
文件在內(nèi)存和磁盤上是如何描述的:每個(gè)文件至少要有一個(gè)數(shù)據(jù)結(jié)構(gòu)存放該文件的信息,包括uid饥脑、gid、flag懦冰、文件長度灶轰、文件內(nèi)容存放位置的數(shù)據(jù)結(jié)構(gòu)等。在Linux中這個(gè)數(shù)據(jù)結(jié)構(gòu)被稱為inode刷钢,本來inode中也應(yīng)該包括文件名稱等信息笋颤,但是由于符號鏈接的存在,導(dǎo)致一個(gè)文件可能存在多個(gè)文件名稱内地,因此把和文件名稱相關(guān)的信息從inode中提出伴澄,專門放到dentry 結(jié)構(gòu)中。dentry通過其成員變量d_inode 指向?qū)?yīng)的inode數(shù)據(jù)結(jié)構(gòu)阱缓。如下圖所示:
另外非凌,inode結(jié)構(gòu)中還包括了成員i_fop,其類型是struct file_operations荆针,其中包括的針對該文件的一些操作接口敞嗡。
根據(jù)路徑名尋找目標(biāo)文件
在Linux中目錄也被作為文件看待并蝗,只是目錄是一種比較特殊的文件。其 特殊之處在于文件的內(nèi)容是該目錄中文件和子目錄的dentry的描述符秸妥,通過這些dentry的描述符可以找到文件或子目錄的dentry滚停,進(jìn)而找到相應(yīng)的inode。
下面我們看看如果根據(jù)絕對路徑尋找一個(gè)文件/tmp/temp/abc的粥惧。
- 首先找到根文件系統(tǒng)的根目錄文件的 dentry 和 inode
- 由這個(gè) inode 提供的操作接口 i_op->lookup()键畴,找到下一層節(jié)點(diǎn) ‘tmp’ 的 dentry 和 inode
- 由 ‘tmp’ 的 inode 找到 ‘temp’ 的 dentry 和 inode
- 最后由 ‘temp’ 的 inode 找到 ‘a(chǎn)bc’ 的 dentry 和 inode
我們再看看如何通過相對路徑尋找文件/tmp/temp/abc,假如我們目前的工作目錄為/tmp/temp/dir_a 中突雪,比如我們通過拷貝命令拷貝該文件:cp ../abc ./
如何通過相對路徑尋找文件呢起惕?我們來看看dentry這個(gè)數(shù)據(jù)結(jié)構(gòu)的成員,其中有一個(gè)是d_parent咏删,數(shù)據(jù)結(jié)構(gòu)定義如下
struct dentry { 刪除了無關(guān)的成員
struct dentry *d_parent; /* parent directory */
struct inode *d_inode; /* Where the name belongs to - NULL is * negative */
unsigned char d_iname[DNAME_INLINE_LEN]; /* small names */
}
d_parent指向了本目錄的父目錄的dentry惹想,這樣就在通過“..”時(shí)就是通過該指針找到的父目錄dentry,找到父母inode督函,進(jìn)而找到父目錄下的所有文件的信息嘀粱。
進(jìn)程中打開的文件
一個(gè)文件可以被多次打開,并且多個(gè)進(jìn)程對一個(gè)文件的訪問權(quán)限可能不同辰狡,因此打開方式就會不同(只讀锋叨、讀寫、可執(zhí)行)宛篇。而dentry 和 inode 只能描述一個(gè)物理的文件娃磺,無法描述“打開”這個(gè)概念。因此有必要引入 file 結(jié)構(gòu)叫倍,來描述一個(gè)“被打開的文件”偷卧。每打開一個(gè)文件,就創(chuàng)建一個(gè) file 結(jié)構(gòu)吆倦。
file 結(jié)構(gòu)中包含以下信息:
- 打開這個(gè)文件的uid听诸,pid
- 打開文件的方式
- 讀寫的方式
- 當(dāng)前在文件中的位置
實(shí)際上,打開文件的過程正是建立file逼庞,dentry蛇更,inode之間的關(guān)聯(lián)的過程。如下圖:
在進(jìn)程中如何和打開的文件相關(guān)聯(lián)呢赛糟,下面來看一下進(jìn)程的數(shù)據(jù)結(jié)構(gòu)
struct task_struct { 只保留了相關(guān)信息
struct files_struct *files; /* open file information */
}
每一個(gè)進(jìn)程的結(jié)構(gòu)體中包含"files"成員派任,其類型為files_struct。如下圖:
進(jìn)程中所有打開的文件的指針都存在了fd_array[]數(shù)組當(dāng)中璧南。
虛擬文件系統(tǒng)
Linux 通過虛擬文件系統(tǒng) (VFS) 來支持不同的具體的文件系統(tǒng)掌逛,從程序員的角度看, VFS 就是一套代碼框架(framework)司倚,它將用戶與具體的文件系統(tǒng)隔離開來豆混。每個(gè)要通過mount 命令掛接到Linux系統(tǒng)的存儲設(shè)備篓像,如磁盤、光盤等(它們各自對應(yīng)具體的文件系統(tǒng))皿伺,每個(gè)設(shè)備對應(yīng)的文件系統(tǒng)都要按照VFS的要求提供一套統(tǒng)一的接口员辩。這樣,用戶就可以使用這些統(tǒng)一的接口在不同的文件系統(tǒng)中拷貝數(shù)據(jù)了鸵鸥。參考下圖:
安裝一個(gè)文件系統(tǒng)奠滑,除了需要“被安裝設(shè)備”外,還要指定一個(gè)“安裝點(diǎn)”妒穴∷嗡埃“安裝點(diǎn)”是已經(jīng)存在的一個(gè)目錄節(jié)點(diǎn)。例如把 /dev/sda1 安裝到 /mnt/win 下讼油,那么 /mnt/win 就是“安裝點(diǎn)”杰赛。
可是文件系統(tǒng)要先安裝后使用。因此矮台,要使用 /mnt/win 這個(gè)“安裝點(diǎn)”乏屯,必然要求它所在文件系統(tǒng)已也經(jīng)被安裝。
也就是說嘿架,安裝一個(gè)文件系統(tǒng)瓶珊,需要另外一個(gè)文件系統(tǒng)已經(jīng)被安裝啸箫。
這是一個(gè)雞生蛋耸彪,蛋生雞的問題:最頂層的文件系統(tǒng)是如何被安裝的?
答案是忘苛,最頂層文件系統(tǒng)的時(shí)候是被安裝在“根安裝點(diǎn)”上的蝉娜,而根安裝點(diǎn)不屬于任何文件系統(tǒng),它對應(yīng)的 dentry 扎唾、inode 是由內(nèi)核在初始化階段憑空構(gòu)造出來的召川。
最頂層的文件系統(tǒng)叫做“根文件系統(tǒng)”。Linux 在啟動的時(shí)候胸遇,要求用戶必須指定一個(gè)“根設(shè)備”荧呐,內(nèi)核在初始化階段,將“根設(shè)備”安裝到“根安裝點(diǎn)”上纸镊,從而有了根文件系統(tǒng)倍阐。這樣,文件系統(tǒng)才算準(zhǔn)備就緒逗威。此后峰搪,用戶就可以通過 mount 命令來安裝新的設(shè)備。
mount設(shè)備(文件系統(tǒng))
我們通過mount命令向Linux系統(tǒng)mount了一個(gè)設(shè)備凯旭。其實(shí)該命令觸發(fā)了兩個(gè)過程概耻,一個(gè)是文件系統(tǒng)注冊過程(當(dāng)然使套,如果文件系統(tǒng)已注冊過的話,就不需要該步驟了)鞠柄,另一個(gè)才是真正意義上的mount設(shè)備的過程侦高。
文件系統(tǒng)注冊過程
Linux內(nèi)核是可加載的,許多模塊是可選的厌杜,只有真正需要使用時(shí)才加載他們矫膨。文件系統(tǒng)注冊過程就是把對應(yīng)某類型文件系統(tǒng)相關(guān)的模塊加載到內(nèi)核,并創(chuàng)建相關(guān)的數(shù)據(jù)結(jié)構(gòu)期奔。每個(gè)文件系統(tǒng)模塊都有一個(gè)初始化例程侧馅,它的作用就是在VFS中進(jìn)行注冊,即填寫一個(gè)叫做file_system_type的數(shù)據(jù)結(jié)構(gòu)呐萌。所有已注冊的文件系統(tǒng)的file_system_type結(jié)構(gòu)形成一個(gè)鏈表馁痴,我們把這個(gè)鏈表稱為注冊鏈表。
每個(gè)設(shè)備在mount時(shí)都要搜索該注冊鏈表肺孤,選擇適合自己設(shè)備文件系統(tǒng)的一項(xiàng)罗晕,并從中取出read_super()函數(shù)獲取設(shè)備的超級塊(存儲在具體設(shè)備上,記錄存儲設(shè)備各種信息的一個(gè)存儲塊)赠堵,并解析其內(nèi)容小渊。因?yàn)槊糠N類型文件系統(tǒng)的超級塊的格式不同,并且各自有特定的信息茫叭,每種文件系統(tǒng)必須使用對應(yīng)的解析函數(shù)酬屉,否則內(nèi)核就因?yàn)椴徽J(rèn)識該文件系統(tǒng)而無法完成安裝。這就是注冊文件系統(tǒng)的意義所在揍愁。
設(shè)備的真正的mount過程呐萨,總體的數(shù)據(jù)結(jié)構(gòu),參考下圖:
- 創(chuàng)建一個(gè)設(shè)備的 vfsmount
- 為“被安裝設(shè)備”創(chuàng)建一個(gè) super_block莽囤,并由具體的文件系統(tǒng)來設(shè)置這個(gè)super_block谬擦。在super_block中包含了該類型設(shè)備操作的各種接口的結(jié)構(gòu)成員s_op,類型為super_operations朽缎。
- 為被安裝設(shè)備的根目錄節(jié)點(diǎn)創(chuàng)建 dentry
- 為被安裝設(shè)備的根目錄節(jié)點(diǎn)創(chuàng)建 inode惨远, 并由 super_block->s_op->read_inode() 來設(shè)置此 inode
- 將 super_block 與“被安裝設(shè)備“根目錄節(jié)點(diǎn) dentry 關(guān)聯(lián)起來
- 將 super_block中的s_root與“被安裝設(shè)備”的根目錄節(jié)點(diǎn) dentry 關(guān)聯(lián)起來如圖6所示,在linux2.4.30中有三條鏈表话肖,文件系統(tǒng)類型結(jié)構(gòu)file_system_type的鏈表頭為file_systems北秽,超級塊結(jié)構(gòu)super_block的鏈表頭為super_blocks,掛接點(diǎn)結(jié)構(gòu)vfsmount的鏈表頭為vfsmntlist狼牺。
在Linux3.3.5中只有兩條鏈表結(jié)構(gòu)羡儿,文件系統(tǒng)類型結(jié)構(gòu)file_system_type的鏈表頭為file_systems,超級塊結(jié)構(gòu)super_block的鏈表頭為super_blocks是钥。數(shù)據(jù)結(jié)構(gòu)vfsmount 的結(jié)構(gòu)定義還存在掠归,但已經(jīng)沒有了mnt_list成員了缅叠。
掛接設(shè)備中查找文件的過程
下面的流程參考了linux3.3.5中的數(shù)據(jù)結(jié)構(gòu)。
例如要打開 /mnt/win/dir1/abc 這個(gè)文件虏冻,就是根據(jù)這個(gè)路徑肤粱,找到目標(biāo)節(jié)點(diǎn) ‘a(chǎn)bc’ 對應(yīng)的 dentry ,進(jìn)而得到 inode 的過程厨相。
尋找過程大致如下:
- 首先找到根文件系統(tǒng)的根目錄節(jié)點(diǎn) dentry 和 inode
- 由這個(gè) inode 提供的操作接口 i_op->lookup()领曼,找到下一層節(jié)點(diǎn) ‘mnt’ 的 dentry 和inode
- 由 ‘mnt’ 的 inode 找到 ‘win’ 的 dentry 和 inode
- 由于 ‘win’ 是個(gè)“安裝點(diǎn)”,因此需要找到“被安裝設(shè)備”/dev/sda1 根目錄節(jié)點(diǎn)的 dentry 和 inode蛮穿∈荆“win”的dentry中有d_sb(超級塊成員),d_sb中有“struct dentry *s_root;”践磅,s_root就是指向“/dev/sda1”的dentry单刁。
- 然后由 /dev/sda1 根目錄節(jié)點(diǎn)的 inode 負(fù)責(zé)找到下一層節(jié)點(diǎn) ‘dir1’ 的 dentry 和 inode
- 由于 dir1 是個(gè)“安裝點(diǎn)”,因此需要借助dir1的dentry->d_sb->s_root找到 /dev/sda2 的根目錄節(jié)點(diǎn) dentry 和 inode
- 最后由這個(gè) inode 負(fù)責(zé)找到 ‘a(chǎn)bc’ 的 dentry 和 inode
可以看到府适,整個(gè)尋找過程是一個(gè)遞歸的過程羔飞。