Linux內(nèi)核之文件系統(tǒng)

如何描述一個(gè)文件

文件在內(nèi)存和磁盤上是如何描述的:每個(gè)文件至少要有一個(gè)數(shù)據(jù)結(jié)構(gòu)存放該文件的信息,包括uid饥脑、gid、flag懦冰、文件長度灶轰、文件內(nèi)容存放位置的數(shù)據(jù)結(jié)構(gòu)等。在Linux中這個(gè)數(shù)據(jù)結(jié)構(gòu)被稱為inode刷钢,本來inode中也應(yīng)該包括文件名稱等信息笋颤,但是由于符號鏈接的存在,導(dǎo)致一個(gè)文件可能存在多個(gè)文件名稱内地,因此把和文件名稱相關(guān)的信息從inode中提出伴澄,專門放到dentry 結(jié)構(gòu)中。dentry通過其成員變量d_inode 指向?qū)?yīng)的inode數(shù)據(jù)結(jié)構(gòu)阱缓。如下圖所示:



另外非凌,inode結(jié)構(gòu)中還包括了成員i_fop,其類型是struct file_operations荆针,其中包括的針對該文件的一些操作接口敞嗡。

根據(jù)路徑名尋找目標(biāo)文件

在Linux中目錄也被作為文件看待并蝗,只是目錄是一種比較特殊的文件。其 特殊之處在于文件的內(nèi)容是該目錄中文件和子目錄的dentry的描述符秸妥,通過這些dentry的描述符可以找到文件或子目錄的dentry滚停,進(jìn)而找到相應(yīng)的inode。
下面我們看看如果根據(jù)絕對路徑尋找一個(gè)文件/tmp/temp/abc的粥惧。

  1. 首先找到根文件系統(tǒng)的根目錄文件的 dentry 和 inode
  2. 由這個(gè) inode 提供的操作接口 i_op->lookup()键畴,找到下一層節(jié)點(diǎn) ‘tmp’ 的 dentry 和 inode
  3. 由 ‘tmp’ 的 inode 找到 ‘temp’ 的 dentry 和 inode
  4. 最后由 ‘temp’ 的 inode 找到 ‘a(chǎn)bc’ 的 dentry 和 inode

我們再看看如何通過相對路徑尋找文件/tmp/temp/abc,假如我們目前的工作目錄為/tmp/temp/dir_a 中突雪,比如我們通過拷貝命令拷貝該文件:cp ../abc ./
如何通過相對路徑尋找文件呢起惕?我們來看看dentry這個(gè)數(shù)據(jù)結(jié)構(gòu)的成員,其中有一個(gè)是d_parent咏删,數(shù)據(jù)結(jié)構(gòu)定義如下

struct dentry { 刪除了無關(guān)的成員
       struct dentry *d_parent; /* parent directory */
       struct inode *d_inode;           /* Where the name belongs to - NULL is      * negative */
       unsigned char d_iname[DNAME_INLINE_LEN];       /* small names */
}

d_parent指向了本目錄的父目錄的dentry惹想,這樣就在通過“..”時(shí)就是通過該指針找到的父目錄dentry,找到父母inode督函,進(jìn)而找到父目錄下的所有文件的信息嘀粱。

進(jìn)程中打開的文件

一個(gè)文件可以被多次打開,并且多個(gè)進(jìn)程對一個(gè)文件的訪問權(quán)限可能不同辰狡,因此打開方式就會不同(只讀锋叨、讀寫、可執(zhí)行)宛篇。而dentry 和 inode 只能描述一個(gè)物理的文件娃磺,無法描述“打開”這個(gè)概念。因此有必要引入 file 結(jié)構(gòu)叫倍,來描述一個(gè)“被打開的文件”偷卧。每打開一個(gè)文件,就創(chuàng)建一個(gè) file 結(jié)構(gòu)吆倦。
file 結(jié)構(gòu)中包含以下信息:

  • 打開這個(gè)文件的uid听诸,pid
  • 打開文件的方式
  • 讀寫的方式
  • 當(dāng)前在文件中的位置

實(shí)際上,打開文件的過程正是建立file逼庞,dentry蛇更,inode之間的關(guān)聯(lián)的過程。如下圖:



在進(jìn)程中如何和打開的文件相關(guān)聯(lián)呢赛糟,下面來看一下進(jìn)程的數(shù)據(jù)結(jié)構(gòu)

struct task_struct { 只保留了相關(guān)信息
       struct files_struct *files; /* open file information */
}

每一個(gè)進(jìn)程的結(jié)構(gòu)體中包含"files"成員派任,其類型為files_struct。如下圖:



進(jìn)程中所有打開的文件的指針都存在了fd_array[]數(shù)組當(dāng)中璧南。

虛擬文件系統(tǒng)

Linux 通過虛擬文件系統(tǒng) (VFS) 來支持不同的具體的文件系統(tǒng)掌逛,從程序員的角度看, VFS 就是一套代碼框架(framework)司倚,它將用戶與具體的文件系統(tǒng)隔離開來豆混。每個(gè)要通過mount 命令掛接到Linux系統(tǒng)的存儲設(shè)備篓像,如磁盤、光盤等(它們各自對應(yīng)具體的文件系統(tǒng))皿伺,每個(gè)設(shè)備對應(yīng)的文件系統(tǒng)都要按照VFS的要求提供一套統(tǒng)一的接口员辩。這樣,用戶就可以使用這些統(tǒng)一的接口在不同的文件系統(tǒng)中拷貝數(shù)據(jù)了鸵鸥。參考下圖:



安裝一個(gè)文件系統(tǒng)奠滑,除了需要“被安裝設(shè)備”外,還要指定一個(gè)“安裝點(diǎn)”妒穴∷嗡埃“安裝點(diǎn)”是已經(jīng)存在的一個(gè)目錄節(jié)點(diǎn)。例如把 /dev/sda1 安裝到 /mnt/win 下讼油,那么 /mnt/win 就是“安裝點(diǎn)”杰赛。
可是文件系統(tǒng)要先安裝后使用。因此矮台,要使用 /mnt/win 這個(gè)“安裝點(diǎn)”乏屯,必然要求它所在文件系統(tǒng)已也經(jīng)被安裝。
也就是說嘿架,安裝一個(gè)文件系統(tǒng)瓶珊,需要另外一個(gè)文件系統(tǒng)已經(jīng)被安裝啸箫。
這是一個(gè)雞生蛋耸彪,蛋生雞的問題:最頂層的文件系統(tǒng)是如何被安裝的?
答案是忘苛,最頂層文件系統(tǒng)的時(shí)候是被安裝在“根安裝點(diǎn)”上的蝉娜,而根安裝點(diǎn)不屬于任何文件系統(tǒng),它對應(yīng)的 dentry 扎唾、inode 是由內(nèi)核在初始化階段憑空構(gòu)造出來的召川。
最頂層的文件系統(tǒng)叫做“根文件系統(tǒng)”。Linux 在啟動的時(shí)候胸遇,要求用戶必須指定一個(gè)“根設(shè)備”荧呐,內(nèi)核在初始化階段,將“根設(shè)備”安裝到“根安裝點(diǎn)”上纸镊,從而有了根文件系統(tǒng)倍阐。這樣,文件系統(tǒng)才算準(zhǔn)備就緒逗威。此后峰搪,用戶就可以通過 mount 命令來安裝新的設(shè)備。

mount設(shè)備(文件系統(tǒng))

我們通過mount命令向Linux系統(tǒng)mount了一個(gè)設(shè)備凯旭。其實(shí)該命令觸發(fā)了兩個(gè)過程概耻,一個(gè)是文件系統(tǒng)注冊過程(當(dāng)然使套,如果文件系統(tǒng)已注冊過的話,就不需要該步驟了)鞠柄,另一個(gè)才是真正意義上的mount設(shè)備的過程侦高。

文件系統(tǒng)注冊過程

Linux內(nèi)核是可加載的,許多模塊是可選的厌杜,只有真正需要使用時(shí)才加載他們矫膨。文件系統(tǒng)注冊過程就是把對應(yīng)某類型文件系統(tǒng)相關(guān)的模塊加載到內(nèi)核,并創(chuàng)建相關(guān)的數(shù)據(jù)結(jié)構(gòu)期奔。每個(gè)文件系統(tǒng)模塊都有一個(gè)初始化例程侧馅,它的作用就是在VFS中進(jìn)行注冊,即填寫一個(gè)叫做file_system_type的數(shù)據(jù)結(jié)構(gòu)呐萌。所有已注冊的文件系統(tǒng)的file_system_type結(jié)構(gòu)形成一個(gè)鏈表馁痴,我們把這個(gè)鏈表稱為注冊鏈表。



每個(gè)設(shè)備在mount時(shí)都要搜索該注冊鏈表肺孤,選擇適合自己設(shè)備文件系統(tǒng)的一項(xiàng)罗晕,并從中取出read_super()函數(shù)獲取設(shè)備的超級塊(存儲在具體設(shè)備上,記錄存儲設(shè)備各種信息的一個(gè)存儲塊)赠堵,并解析其內(nèi)容小渊。因?yàn)槊糠N類型文件系統(tǒng)的超級塊的格式不同,并且各自有特定的信息茫叭,每種文件系統(tǒng)必須使用對應(yīng)的解析函數(shù)酬屉,否則內(nèi)核就因?yàn)椴徽J(rèn)識該文件系統(tǒng)而無法完成安裝。這就是注冊文件系統(tǒng)的意義所在揍愁。
設(shè)備的真正的mount過程呐萨,總體的數(shù)據(jù)結(jié)構(gòu),參考下圖:


  1. 創(chuàng)建一個(gè)設(shè)備的 vfsmount
  2. 為“被安裝設(shè)備”創(chuàng)建一個(gè) super_block莽囤,并由具體的文件系統(tǒng)來設(shè)置這個(gè)super_block谬擦。在super_block中包含了該類型設(shè)備操作的各種接口的結(jié)構(gòu)成員s_op,類型為super_operations朽缎。
  3. 為被安裝設(shè)備的根目錄節(jié)點(diǎn)創(chuàng)建 dentry
  4. 為被安裝設(shè)備的根目錄節(jié)點(diǎn)創(chuàng)建 inode惨远, 并由 super_block->s_op->read_inode() 來設(shè)置此 inode
  5. 將 super_block 與“被安裝設(shè)備“根目錄節(jié)點(diǎn) dentry 關(guān)聯(lián)起來
  6. 將 super_block中的s_root與“被安裝設(shè)備”的根目錄節(jié)點(diǎn) dentry 關(guān)聯(lián)起來如圖6所示,在linux2.4.30中有三條鏈表话肖,文件系統(tǒng)類型結(jié)構(gòu)file_system_type的鏈表頭為file_systems北秽,超級塊結(jié)構(gòu)super_block的鏈表頭為super_blocks,掛接點(diǎn)結(jié)構(gòu)vfsmount的鏈表頭為vfsmntlist狼牺。
    在Linux3.3.5中只有兩條鏈表結(jié)構(gòu)羡儿,文件系統(tǒng)類型結(jié)構(gòu)file_system_type的鏈表頭為file_systems,超級塊結(jié)構(gòu)super_block的鏈表頭為super_blocks是钥。數(shù)據(jù)結(jié)構(gòu)vfsmount 的結(jié)構(gòu)定義還存在掠归,但已經(jīng)沒有了mnt_list成員了缅叠。

掛接設(shè)備中查找文件的過程

下面的流程參考了linux3.3.5中的數(shù)據(jù)結(jié)構(gòu)。
例如要打開 /mnt/win/dir1/abc 這個(gè)文件虏冻,就是根據(jù)這個(gè)路徑肤粱,找到目標(biāo)節(jié)點(diǎn) ‘a(chǎn)bc’ 對應(yīng)的 dentry ,進(jìn)而得到 inode 的過程厨相。
尋找過程大致如下:

  1. 首先找到根文件系統(tǒng)的根目錄節(jié)點(diǎn) dentry 和 inode
  2. 由這個(gè) inode 提供的操作接口 i_op->lookup()领曼,找到下一層節(jié)點(diǎn) ‘mnt’ 的 dentry 和inode
  3. 由 ‘mnt’ 的 inode 找到 ‘win’ 的 dentry 和 inode
  4. 由于 ‘win’ 是個(gè)“安裝點(diǎn)”,因此需要找到“被安裝設(shè)備”/dev/sda1 根目錄節(jié)點(diǎn)的 dentry 和 inode蛮穿∈荆“win”的dentry中有d_sb(超級塊成員),d_sb中有“struct dentry *s_root;”践磅,s_root就是指向“/dev/sda1”的dentry单刁。
  5. 然后由 /dev/sda1 根目錄節(jié)點(diǎn)的 inode 負(fù)責(zé)找到下一層節(jié)點(diǎn) ‘dir1’ 的 dentry 和 inode
  6. 由于 dir1 是個(gè)“安裝點(diǎn)”,因此需要借助dir1的dentry->d_sb->s_root找到 /dev/sda2 的根目錄節(jié)點(diǎn) dentry 和 inode
  7. 最后由這個(gè) inode 負(fù)責(zé)找到 ‘a(chǎn)bc’ 的 dentry 和 inode

可以看到府适,整個(gè)尋找過程是一個(gè)遞歸的過程羔飞。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市檐春,隨后出現(xiàn)的幾起案子逻淌,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異寺庄,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)朋贬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來窜骄,“玉大人,你說我怎么就攤上這事摆屯×诙簦” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵虐骑,是天一觀的道長准验。 經(jīng)常有香客問我,道長廷没,這世上最難降的妖魔是什么糊饱? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮颠黎,結(jié)果婚禮上另锋,老公的妹妹穿的比我還像新娘滞项。我一直安慰自己,他們只是感情好夭坪,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布文判。 她就那樣靜靜地躺著,像睡著了一般室梅。 火紅的嫁衣襯著肌膚如雪戏仓。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天亡鼠,我揣著相機(jī)與錄音赏殃,去河邊找鬼。 笑死间涵,一個(gè)胖子當(dāng)著我的面吹牛嗓奢,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播浑厚,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼股耽,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了钳幅?” 一聲冷哼從身側(cè)響起物蝙,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎敢艰,沒想到半個(gè)月后诬乞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钠导,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年震嫉,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片牡属。...
    茶點(diǎn)故事閱讀 40,424評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡票堵,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出逮栅,到底是詐尸還是另有隱情悴势,我是刑警寧澤,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布措伐,位于F島的核電站特纤,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏侥加。R本人自食惡果不足惜捧存,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧昔穴,春花似錦镰官、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至卿操,卻和暖如春警检,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背害淤。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工扇雕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人窥摄。 一個(gè)月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓镶奉,卻偏偏與公主長得像,于是被迫代替她去往敵國和親崭放。 傳聞我的和親對象是個(gè)殘疾皇子哨苛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容