Git 內(nèi)部
Git是什么呢?不言而喻炫掐,官方回答git是分布式軟件管理系統(tǒng), 如果我們往從計算機學科這些想想魁莉,
我覺得,git首先是一個本地數(shù)據(jù)庫, 再者募胃,git實現(xiàn)了客戶端和遠程通信數(shù)據(jù)交互的功能
數(shù)據(jù)庫能力
想想關系型數(shù)據(jù)庫, 首先提供了對原始數(shù)據(jù)管理的存儲旗唁,管理能力,接著通過表痹束,鍵检疫,鏈接等等這些關系,
實現(xiàn)了數(shù)據(jù)直接的聯(lián)系祷嘶,從而能較完整描述一個系統(tǒng)屎媳。
git實現(xiàn)的是對文件系統(tǒng)的管理,提供了類似快照的功能,通過commit能夠保留歷史信息
blog對象
咱們從底下往上看论巍,比如對于一個文件file.txt, git里面是blob類型對象
git 底層命令是hash-object, 具體細節(jié)可以 git hash-object --help
查看
// 計算文件blob 哈希值
content_size = len(file.txt) // file.txt字節(jié)數(shù)
store = "blob " + content_size + "\u0000" + content(file.txt) //拼接辦法
sha1 = sha1(store) // 計算sha1
// zlib壓縮文件, 字節(jié)流
bytes = zlib.deflate(store)
// 通過底層操作系統(tǒng), 寫入
寫入到 .git/objects/' + sha1[0,2] + '/' + sha1[2,38] 文件里面
tree對象
通過這樣烛谊,文件或者文件夾這些數(shù)據(jù)信息已經(jīng)可以存儲管理了,但是要解決的下一個問題
文件名,還有文件是怎么組織管理嘉汰? git提供了 tree對象
tree對象對應UNIX中的目錄項
一個tree對象包含了一條或多條tree對象記錄(tree entry)丹禀,每條記錄含有一個指向blob對象或者子tree對象的 SHA-1 指針,以及相應的模式鞋怀、類型双泪、文件名信息
底層命令對應的是write-tree/read-tree命令
類似于
commit對象
解決了上述問題,我們進一步看接箫,git 提供的快照功能, 依據(jù)commit id可以檢出指定的一次完整內(nèi)容
git 用commit對象 來解決, commit對象類似于一個指針攒读,當我們執(zhí)行git commit
命令時候,
生成一個 commit 對象朵诫,指向當時tree對象,如圖
底層命令對應的是 commit-tree,通過指定 tree對象 來創(chuàng)建, 也可以附加commit id的父id
舉個例子, 比如master分支 merge feature分支后, 那么, 此時提交后,新生成的commit id(a46163aed00be6700365112ffc5eb4aef2f14dc8)的父id就是master分支最近一次的commit id(397f07151338bff5e7245da35fc41d77f2fe74ff)以及Feature分支的最近一次提交commit id(9424805c3643cf052f0c87221e7a9255bd804ded)
引用 - 分支, tag
進行到這里,其實這個數(shù)據(jù)庫已經(jīng)完全可以使用了职烧,通過指定"id(commit id)", 我們已經(jīng)可以準確找到一次完成的信息記錄倚搬,但實際,我們可以再進一步脱盲,對人使用更友好一點
比如我們記不住ip但是可以記住域名, 我們記不住commit id, 我們可以記住分支信息
git 里面有一種引用邑滨,我們叫做分支, 它指向一次自己分支的最近一次commit 信息.
如圖
顯然分支指向的commit是隨著 提交實時更新的,這個引用是會改變的钱反,不變的有沒有掖看,當然有
那就是tag, tag也是一種引用匣距,不過,這個引用總是執(zhí)行一個固定的commit.
.git目錄分析
到這里, 我們其實把git底層是怎么運轉已經(jīng)弄清楚了, 反應到系統(tǒng)目錄上哎壳,我們可以看到如下組織:
git判斷是不是一個git管理空間毅待,判斷的也就是有沒有 .git
- objects - 所有數(shù)據(jù), 沒壓縮的直接在hash開頭目錄,處理后的文件在pack
- refs - 引用, 包括head归榕,tag尸红,origin, 分支和commit id類似于 key-value
- head - 目前被檢出的分支
- index - 文件保存暫存區(qū)信息
- config - 是項目的配置選項, 比如origin是什么, git便捷命令這些
- info - 全局排除,不希望被記錄在 .gitignore 文件中的忽略模式
- hoos - 服務端或者客戶端鉤子腳本
本地和遠程的數(shù)據(jù)交換刹泄,其實涉及也挺多外里,可以放到下一部分來說了