一彈指六十剎那世舰,一剎那九百生滅庞瘸。 --《仁王經(jīng)》
組件
計(jì)算機(jī)是一種數(shù)據(jù)處理設(shè)備,它由CPU和內(nèi)存以及外部設(shè)備組成许赃。CPU負(fù)責(zé)數(shù)據(jù)處理止喷,內(nèi)存負(fù)責(zé)存儲,外部設(shè)備負(fù)責(zé)數(shù)據(jù)的輸入和輸出混聊,它們之間通過總線連接在一起启盛。CPU內(nèi)部主要由控制器、運(yùn)算器和寄存器組成技羔〗┐常控制器負(fù)責(zé)指令的讀取和調(diào)度,運(yùn)算器負(fù)責(zé)指令的運(yùn)算執(zhí)行藤滥,寄存器負(fù)責(zé)數(shù)據(jù)的存儲鳖粟,它們之間通過CPU內(nèi)的總線連接在一起。每個外部設(shè)備(例如:顯示器拙绊、硬盤向图、鍵盤、鼠標(biāo)标沪、網(wǎng)卡等等)則是由外設(shè)控制器榄攀、I/O端口、和輸入輸出硬件組成金句。外設(shè)控制器負(fù)責(zé)設(shè)備的控制和操作檩赢,I/O端口負(fù)責(zé)數(shù)據(jù)的臨時存儲,輸入輸出硬件則負(fù)責(zé)具體的輸入輸出违寞,它們間也通過外部設(shè)備內(nèi)的總線連接在一起贞瞒。
上面的計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)圖中我們可以看出硬件系統(tǒng)的這種組件化的設(shè)計(jì)思路總是貫徹到各個環(huán)節(jié)。在這套設(shè)計(jì)思想(馮.諾依曼體系架構(gòu))里面趁曼,總是有一部分負(fù)責(zé)控制军浆、一部分負(fù)責(zé)執(zhí)行、一部分則負(fù)責(zé)存儲挡闰,它之間進(jìn)行交互以及接口通信則總是通過總線來完成乒融。這種設(shè)計(jì)思路一樣的可以應(yīng)用在我們的軟件設(shè)計(jì)體系里面:組件和組件之間通信通過事件的方式來進(jìn)行解耦處理,而一個組件內(nèi)部同樣也需要明確好各個部分的職責(zé)(一部分負(fù)責(zé)調(diào)度控制摄悯、一部分負(fù)責(zé)執(zhí)行實(shí)現(xiàn)赞季、一部分負(fù)責(zé)數(shù)據(jù)存儲)。
緩存
一個完整的CPU系統(tǒng)里面有控制部件射众、運(yùn)算部件還有寄存器部件碟摆。其中寄存器部件的作用就是進(jìn)行數(shù)據(jù)的臨時存儲晃财。既然有內(nèi)存作為數(shù)據(jù)存儲的場所叨橱,那么為什么還要有寄存器呢典蜕?答案就是速度和成本。我們知道CPU的運(yùn)算速度是非陈尴矗快的愉舔,如果把運(yùn)算的數(shù)據(jù)都放到內(nèi)存里面的話那將大大降低整個系統(tǒng)的性能。解決的辦法是在CPU內(nèi)部開辟一小塊臨時存儲區(qū)域伙菜,并在進(jìn)行運(yùn)算時先將數(shù)據(jù)從內(nèi)存復(fù)制到這一小塊臨時存儲區(qū)域中轩缤,運(yùn)算時就在這一小快臨時存儲區(qū)域內(nèi)進(jìn)行。我們稱這一小塊臨時存儲區(qū)域?yàn)榧拇嫫鞣啡啤R驗(yàn)榧拇嫫骱瓦\(yùn)算器以及控制器是非常緊密的聯(lián)系在一起的火的,它們的頻率一致,所以運(yùn)算時就不會因?yàn)閿?shù)據(jù)的來回傳輸以及各設(shè)備之間的頻率差異導(dǎo)致系統(tǒng)性能的整體下降淑倾。你可能又會問為什么不把整個內(nèi)存都集成進(jìn)CPU中去呢馏鹤?答案其實(shí)還是成本問題!
因?yàn)镃PU速度很快娇哆,相應(yīng)的寄存器也需要存取很快湃累,二者速度上要匹配,所以這些寄存器的制作難度大碍讨,選材精治力,而且是集成到芯片內(nèi)部,所價(jià)格高勃黍。而內(nèi)存的成本則相對低廉宵统,而且從工藝上來說,我們不可能在CPU內(nèi)部集成大量的存儲單元覆获。
運(yùn)算的問題通過寄存器解決了榜田,但是還存在一個問題:我們知道程序在運(yùn)行時是要將所有可執(zhí)行的二進(jìn)制指令代碼都裝載到內(nèi)存里面去,CPU每執(zhí)行一條指令前都需要從內(nèi)存中將指令讀取到CPU內(nèi)并執(zhí)行锻梳。如果按這樣每次都從內(nèi)存讀取一條指令來依次執(zhí)行的話箭券,那還是存在著CPU和內(nèi)存之間的處理瓶頸問題,從而造成整體性能的下降疑枯。這個問題怎么解決呢辩块?答案就是高速緩存。其實(shí)在CPU內(nèi)部不僅有為解決運(yùn)算問題而設(shè)計(jì)的寄存器荆永,還集成了一個部分高速緩存存儲區(qū)域废亭。高度緩存的制造成本要比寄存器低,但是比內(nèi)存的制造成本高具钥,容量要比寄存器大豆村,但是比內(nèi)存的容量小很多。雖然沒有寄存器和運(yùn)算器之間的距離那么緊密骂删,但是要比內(nèi)存到運(yùn)算器之間的距離要近很多掌动。一般情況下CPU內(nèi)的高速緩存可能只有幾KB或者幾十KB那么大四啰。正是通過高速緩存的引入,當(dāng)程序在運(yùn)行時粗恢,就可以預(yù)先將部分在內(nèi)存中要執(zhí)行的指令代碼以及數(shù)據(jù)復(fù)制到高速緩存中去柑晒,而CPU則不再每次都從內(nèi)存中讀取指令而是直接從高速緩存依次讀取指令來執(zhí)行,從而加快了整體的速度眷射。當(dāng)然要預(yù)讀取哪塊內(nèi)存區(qū)域的指令和數(shù)據(jù)到緩存上以及怎么去讀取這些工作都交給操作系統(tǒng)去調(diào)度完成匙赞,這里面的算法和邏輯也非常的復(fù)雜,大家可以通過學(xué)習(xí)操作系統(tǒng)相關(guān)的課程去了解妖碉,這里就不再展開了涌庭。可以看出高速緩存的作用解決了不同速度設(shè)備之間的數(shù)據(jù)傳遞問題欧宜。在實(shí)際中CPU內(nèi)部可能不止設(shè)有一級高速緩存脾猛,有可能會配備兩級到三級的高速緩存,越高級的高速緩存速度越快鱼鸠,容量越低猛拴,而越低級的高度緩存則速度越慢,但是容量越大蚀狰。比如iPhoneX上的搭載的arm處理器A11里面除了固有的37個通用寄存器外愉昆,L1級緩存的容量是64KB, L2級緩存的容量達(dá)到了8M(這么大的二級緩存麻蹋,都有可能在你的程序代碼少時可以一次性將代碼讀到緩存中去運(yùn)行)跛溉, 沒有配備三級緩存。
我們知道在軟件設(shè)計(jì)上有一個所謂的空間換時間的概念扮授,就是當(dāng)兩個對象之間進(jìn)行交互時因?yàn)槎咛幚硭俣炔⒉灰恢聲r芳室,我們就需要引入緩存來解決讀寫不一致的問題。比如文件讀寫或者socket通信時刹勃,因?yàn)镮O設(shè)備的處理速度很慢堪侯,所以在進(jìn)行文件讀寫以及socket通信時總是要將讀出或者寫入的部分?jǐn)?shù)據(jù)先保存到一個緩存中,然后再統(tǒng)一的執(zhí)行讀出和寫入操作荔仁。
可以看出無論是在硬件層面上還是在軟件層面上伍宦,當(dāng)兩個組件之間因?yàn)樗俣葐栴}不能進(jìn)行同步交互時,就可以借助緩存技術(shù)來彌補(bǔ)這種不平衡的狀況
指令中的寄存器
CPU執(zhí)行的每條指令都由操作碼和操作數(shù)組成乏梁,簡單理解就是要對誰(操作數(shù))做什么(操作碼)次洼。在CPU內(nèi)部要運(yùn)算的數(shù)據(jù)總是放在寄存器中,而實(shí)際的數(shù)據(jù)則有可能是放在內(nèi)存或者是IO端口中遇骑。因此我們的程序其實(shí)大部分時間就是做了如下三件事情:
- 把內(nèi)存或者I/O端口的數(shù)據(jù)讀取到寄存器中
- 將寄存器中的數(shù)據(jù)進(jìn)行運(yùn)算(運(yùn)算只能在寄存器中進(jìn)行)
- 將寄存器的內(nèi)容回寫到內(nèi)存或者I/O端口中
這三件事情都是跟寄存器有關(guān)卖毁,寄存器就是數(shù)據(jù)存儲的中轉(zhuǎn)站,非常的關(guān)鍵落萎,因此在CPU所提供的指令中亥啦,如果操作數(shù)有兩個時至少要有一個是寄存器炭剪。
;下面部分是arm64指令示例:
mov x0, #0x100 ;將常數(shù)0x100賦值給寄存器x0
mov x1, x0 ;將寄存器x0的值賦值給寄存器x1
ldr x3, [sp, #0x8] ;將棧頂加0x8處的內(nèi)存值賦值給x3寄存器
add x0, x1, x2 ;x0 = x1 + x2 可以看出運(yùn)算的指令必須放在寄存器中
sub x0, x1, x2 ;r0 = x1 - x2
str x1, [sp, #0x08] ;將寄存器x1中的值保存到棧頂加0x8處的內(nèi)存處。
;下面部分是x86_64指令示例(AT&T匯編):
mov $0x100, %rax ;將常數(shù)0x100賦值給寄存器rax
mov %rax, %rbx ;將寄存器rax的值賦值給rbx寄存器
movq 8(%rax), %rbx ;將寄存器rax中的值+8并將所指向內(nèi)存中的數(shù)據(jù)賦值給rbx寄存器
所以不要將機(jī)器語言或者匯編語言當(dāng)成是很復(fù)雜或者難以理解的語言禁悠,如果你仔細(xì)觀察一段匯編語言代碼時,你就會發(fā)現(xiàn)幾乎大部分代碼都是做的上面的三件事情兑宇。我們在高級語言里面看到的只是變量碍侦,但是在低級語言里面看到的就是內(nèi)存地址和寄存器,你可以將內(nèi)存地址和寄存器也理解為定義的變量隶糕,帶著這樣的思路去閱讀匯編代碼時你就會發(fā)現(xiàn)其實(shí)匯編語言也不是那么的困難瓷产。在高級語言中我們可以根據(jù)自身的需要定義出很多有特殊意義的變量,但是低級語言中因?yàn)榧拇嫫骶湍敲磶讉€枚驻,它必須要被復(fù)用和重復(fù)使用濒旦,因此匯編語言中就會出現(xiàn)大量的將寄存器的內(nèi)容保存到內(nèi)存中的指令代碼以及從內(nèi)存中讀取到寄存器中的指令代碼。這些代碼中有很多都有共性再登,只要在你實(shí)踐中多去閱讀尔邓,然后適應(yīng)一下就很快能夠很高興的去看匯編代碼了,熟能生巧嗎锉矢。
寄存器的分類
寄存器是CPU中的數(shù)據(jù)臨時存儲單元梯嗽,不同的CPU體系結(jié)構(gòu)中的寄存器的數(shù)量是不一致的比如: arm64體系下的CPU就提供了37個64位的通用的寄存器,而x86_64體系下的CPU就提供了16個64位的通用寄存器沽损。在說分類之前要說一下寄存器的長度問題灯节。有時候我們看匯編代碼時會發(fā)現(xiàn)代碼中出現(xiàn)了x0, w0(arm64); 或者rax, eax, ax, al(x64)。 它們之間有什么關(guān)系嗎绵估? 寄存器是存儲單元炎疆,意味著它具備一定的容量,也就是每個寄存器能保存的最大的數(shù)值是多少国裳,也就是寄存器的位數(shù)形入。不同CPU架構(gòu)下的寄存器的位數(shù)有差別,這個跟CPU的字長有關(guān)系缝左。一般情況下64位字長的CPU提供的寄存器的容量是64個bit位唯笙,而32位字長的CPU提供的寄存器的容量是32個bit位。比如arm64體系下的CPU提供的37個通用寄存器的容量都是8個字節(jié)的盒使,所以每個寄存器能保存的數(shù)值范圍就是(0到2^64次方)崩掘。
對于x86_64系的CPU來說,如果寄存器以r開頭則表明的是一個64位的寄存器少办,如果以e開頭則表明是一個32位的寄存器苞慢,同時系統(tǒng)還提供了16位的寄存器以及8位的寄存器。32位的寄存器是64位寄存器的低32位部分并不是獨(dú)立存在的英妓,16位寄存器則是32位寄存器的低16位部分并不是獨(dú)立存在的挽放,8位寄存器則是16位寄存器的低8位部分并不是獨(dú)立存在的绍赛。
對于arm64系的CPU來說, 如果寄存器以x開頭則表明的是一個64位的寄存器辑畦,如果以w開頭則表明是一個32位的寄存器吗蚌,在系統(tǒng)中沒有提供16位和8位的寄存器供訪問和使用。其中32位的寄存器是64位寄存器的低32位部分并不是獨(dú)立存在的纯出。
不管寄存器的長度如何蚯妇,它們有些用來存放將要執(zhí)行的指令地址,有些用來存儲要運(yùn)算的數(shù)據(jù)暂筝,有些用來存儲計(jì)算的結(jié)果狀態(tài)箩言,有些用來保存內(nèi)存的基地址信息,有些用來保存要運(yùn)算的浮點(diǎn)數(shù)焕襟。因此CPU中的寄存器可以按照作用進(jìn)行如下分類:
1.數(shù)據(jù)地址寄存器
數(shù)據(jù)地址寄存器通常用來做數(shù)據(jù)計(jì)算的臨時存儲陨收、做累加、計(jì)數(shù)鸵赖、地址保存等功能务漩。定義這些寄存器的作用主要是用于在CPU指令中保存操作數(shù),在CPU中當(dāng)做一些常規(guī)變量來使用它褪。所以我們的代碼里面看到的以及用到的最多的寄存器就是這些寄存器:
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x86_64 | 64 | RAX,RBX,RCX,RDX,RDI,RSI, R8-R15 |
x86_64 | 32 | EAX,EBX,ECX,EDX,EDI,ESI, R8D-R15D |
x86_64 | 16 | AX,BX,CX,DX,DI,SI, R8W-R15W |
x86_64 | 8 | AL,BL,CL,DL,DIL,SIL, R8L-R15L |
arm64 | 64 | X0-X30, XZR |
arm64 | 32 | W0-W30, WZR |
如果你仔細(xì)觀察一些匯編代碼中的寄存器的使用菲饼,其實(shí)你會發(fā)現(xiàn)一些特點(diǎn):
- 在x86_64體系中RAX以及arm64體系中的X0一般都用來保存函數(shù)的返回值。
- 在函數(shù)調(diào)用時的非浮點(diǎn)參數(shù)傳遞在x86_64體系中分別保存在RDI,RSI,RDX,RCX,R8,R9列赎;而在arm64體系中則分別保存在X0-X7中宏悦。對于超出的數(shù)量都保存到棧內(nèi)存中。
- arm64體系中的XZR,WZR表示為一個特殊的寄存器包吝,就是用來表示0
- arm64體系中的X8一般用來表示全局變量或者常量的偏移地址饼煞。而 X16,X17則有特殊的用途一般用來保存間接調(diào)用時的函數(shù)地址。
- arm64中的X29寄存器特殊用于保存函數(shù)棧的基址寄存器(X29也叫FP)诗越,所以一般不能用于其他用途砖瞧。
2.Intel架構(gòu)CPU的段寄存器
早期的16位實(shí)模式程序中的內(nèi)存訪問都是基于物理地址的,而且還把整個程序拆分為數(shù)據(jù)段嚷狞、代碼段块促、棧段、擴(kuò)展段四個區(qū)域床未,每個內(nèi)存區(qū)段內(nèi)的地址編碼都是相對于這個段的偏移來設(shè)置的竭翠,因此為了定位和區(qū)分這些內(nèi)存區(qū)段,CPU分別設(shè)置了CS,DS,SS,ES四個寄存器來保存這些段的基地址薇搁。后來隨著CPU和操作系統(tǒng)的發(fā)展斋扰,應(yīng)用程序不再直接訪問物理內(nèi)存地址了,而是訪問由操作系統(tǒng)提供的虛擬內(nèi)存地址,同時也不再把整個內(nèi)存空間劃分為數(shù)據(jù)段和代碼段了传货,而是提供一個從0開始的平坦連續(xù)的內(nèi)存空間了屎鳍,同時將程序所能訪問的內(nèi)存區(qū)域和操作系統(tǒng)內(nèi)核所能訪問的內(nèi)存區(qū)域進(jìn)行了隔離,我們稱這樣的程序?yàn)楸Wo(hù)模式下運(yùn)行的程序问裕。因此這時候里面的CS,DS,SS,ES寄存器的作用將不再用于保存內(nèi)存區(qū)域的基地址了逮壁,同時還增加了FS,GS兩個寄存器,這6個寄存器的作用變?yōu)榱吮4娌僮飨到y(tǒng)進(jìn)入用戶態(tài)還是核心態(tài)以及進(jìn)行用戶態(tài)和核心態(tài)之間進(jìn)行切換上下文數(shù)據(jù)的功能了粮宛。也就是在保護(hù)模式下運(yùn)行的程序我們將不需要也沒有權(quán)利去訪問這些段寄存器了窥淆。如果你想了解更加具體的內(nèi)容請搜索:全局描述符表與局部描述符表 相關(guān)的知識。在arm體系的CPU中則沒有專門提供這些所謂的段寄存器:
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x86_64 | 16 | CS,DS,SS,ES,FS,GS |
這里面需要澄清的是我們的程序內(nèi)存區(qū)域雖然從物理上不再劃分為代碼段窟勃、數(shù)據(jù)段祖乳、棧段幾個獨(dú)立的內(nèi)存空間逗堵。但是在平坦內(nèi)存模式下我們依然保留了代碼段秉氧、數(shù)據(jù)段、棧段的劃分蜒秤,每個段的基地址都是從0開始汁咏,只是各種類型的數(shù)據(jù)存放到了不同的內(nèi)存空間中去了,也就是說程序分段的機(jī)制由硬件劃分轉(zhuǎn)化為了軟件劃分了作媚。
3.棧寄存器
棧的概念攘滩,在學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)的時候就已經(jīng)有了解,棧是一塊具有后進(jìn)先出功能的存儲區(qū)域纸泡,在進(jìn)行操作時我們總是只能將數(shù)據(jù)壓入棧頂漂问,或者將數(shù)據(jù)從棧頂彈出來。
從上面可以看出要維護(hù)一個棧區(qū)域就必須要提供2個寄存器蚤假,一個寄存器用來保存棧的基地址也就是棧的底部,而一個寄存器則用來保存棧的偏移也就是棧的頂部吧兔。在一般的系統(tǒng)中磷仰,我們都將棧的基地址設(shè)置在內(nèi)存的高位,而將棧頂?shù)刂吩O(shè)置在內(nèi)存的低位境蔼。因此每當(dāng)有進(jìn)棧操作時則將棧頂?shù)刂愤M(jìn)行遞減灶平,而當(dāng)有出棧操作時則將棧頂?shù)刂愤f增。棧的這種特性箍土,使得他非常適合于保存函數(shù)中定義的局部變量逢享,以及函數(shù)內(nèi)調(diào)用函數(shù)的情況。(具體棧和函數(shù)的關(guān)系我會在后續(xù)的文章中詳細(xì)介紹)吴藻。在x86_64體系的CPU中拼苍,提供了一個專門的RBP寄存用來保存棧的基地址, 同時提供一個專門的RSP寄存器來保存棧的棧頂?shù)刂罚欢鴄rm64體系的CPU中則用X29(FP)寄存器來保存棧的基地址疮鲫,同時提供一個SP寄存器來保存棧的棧頂?shù)刂贰?/strong>
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x86_64 | 64 | RBP為椷耗悖基址寄存器,RSP為棧頂寄存器 |
x86_64 | 32 | EBP為椏》福基址寄存器妇多,ESP為棧頂寄存器 |
x86_64 | 16 | BP為棧基址寄存器燕侠,SP為棧頂寄存器 |
arm64 | 64 | X29(FP)為椪咦妫基址寄存器,SP為棧頂寄存器 |
4.浮點(diǎn)和向量寄存器
因?yàn)楦↑c(diǎn)數(shù)的存儲以及其運(yùn)算的特殊性绢彤,所以CPU中專門提供FPU以及相應(yīng)的浮點(diǎn)數(shù)寄存器來處理浮點(diǎn)數(shù)七问,除了一些浮點(diǎn)數(shù)狀態(tài)和控制寄存器(比如四舍五入的處理方式等)外主要就是一些保存浮點(diǎn)數(shù)的寄存器:
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x86_64 | 256 | YMM0-YMM15 |
x86_64 | 128 | XMM0 - XMM15 |
x86_64 | 80 | STMM0-STMM15 |
arm64 | 128 | Q0-Q31(V0-V31) |
arm64 | 64 | D0 - D31 |
arm64 | 32 | S0 - S31 |
現(xiàn)在的CPU除了支持標(biāo)量運(yùn)算外,還支持向量運(yùn)算茫舶。向量運(yùn)算在圖形處理相關(guān)的領(lǐng)域用得非常的多械巡。為了支持向量計(jì)算系統(tǒng)了也提供了眾多的向量寄存器,以及SSE和SIMD指令集:
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x64 | 128 | XMM0 - XMM15, YMM0-YMM15, STMM0-STMM7 |
arm64 | 128 | V0-V31 |
5.狀態(tài)寄存器。
狀態(tài)寄存器用來保存指令運(yùn)行結(jié)果的一些信息,比如相加的結(jié)果是否溢出蚪缀、結(jié)果是否為0、以及是否是負(fù)數(shù)等古程。CPU的某些指令會根據(jù)運(yùn)行的結(jié)果來設(shè)置狀態(tài)寄存器的狀態(tài)位,而某些指令則是根據(jù)這些狀態(tài)寄存器中的值來進(jìn)行處理喊崖。比如一些條件跳轉(zhuǎn)指令或者比較指令等等挣磨。我們在高級語言里面的條件判斷最終在轉(zhuǎn)化為機(jī)器指令時,機(jī)器指令就是根據(jù)狀態(tài)寄存器里面的特殊位置來進(jìn)行跳轉(zhuǎn)的荤懂。在x64體系的CPU中提供了一個64位的RFLAGS寄存器來作為狀態(tài)寄存器茁裙;arm64體系的CPU則提供了一個32位的CPSR寄存器來作為狀態(tài)寄存器。狀態(tài)寄存器的內(nèi)容由CPU內(nèi)部進(jìn)行置位势誊,我們的程序中不能將某個數(shù)值賦值給狀態(tài)寄存器呜达。
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x64 | 64 | RFLAGS |
arm64 | 32 | CPSR |
6.指令寄存器(程序計(jì)數(shù)器)
我們知道程序代碼是保存在內(nèi)存中的,那CPU又是如何知道要執(zhí)行哪一條保存在內(nèi)存中的指令呢粟耻?這就是通過指令寄存器來完成的查近。因?yàn)閮?nèi)存中的指令總是按線性序列保存的,CPU只是按照編制好的程序來執(zhí)行指令挤忙。因此CPU內(nèi)提供一個指令寄存器來記錄CPU下一條將要執(zhí)行的指令的內(nèi)存地址霜威,這樣每次執(zhí)行完畢一條指令后,CPU就根據(jù)指令寄存器中所記錄的地址到內(nèi)存中去讀取指令并執(zhí)行册烈,同時又將下一條指令的內(nèi)存地址保存到指令寄存器中戈泼,就這樣就重復(fù)不斷的處理來完成整個程序的執(zhí)行婿禽。
但是這里面有兩問題:
前面不是說CPU內(nèi)有高速緩存嗎?怎么又說每次都去訪問內(nèi)存呢大猛?而且保存還是內(nèi)存的地址呢扭倾。 這是沒有問題的,指令寄存器中保存的確實(shí)是下一條指令在內(nèi)存中的地址挽绩,但是操作系統(tǒng)除了將部分內(nèi)存區(qū)域中的指令保存到高速緩存外還會建立一個內(nèi)存地址到高速緩存地址之間的映射關(guān)系數(shù)據(jù)結(jié)構(gòu)膛壹。因此即使是指令寄存器中保存的是內(nèi)存地址,但是在指令真實(shí)執(zhí)行時CPU就會根據(jù)指令寄存器中的內(nèi)存地址以及內(nèi)部建立的內(nèi)存和高速緩存的映射關(guān)系來轉(zhuǎn)化為指令在高速緩存中的地址來讀取指令并執(zhí)行唉堪。當(dāng)然如果發(fā)現(xiàn)指令并不在高速緩存中時模聋,CPU就會觸發(fā)一個中斷并告訴操作系統(tǒng),操作系統(tǒng)再根據(jù)特定的策略從內(nèi)存中再次讀取一塊新的內(nèi)存數(shù)據(jù)到高速緩存中唠亚,并覆蓋掉原先保存在高速緩存中的內(nèi)容链方,然后CPU再次讀取高速緩存中的指令后繼續(xù)執(zhí)行。
如果說指令寄存器每次都是保存的順序執(zhí)行指令的話那么怎么去實(shí)現(xiàn)跳轉(zhuǎn)邏輯呢灶搜? 答案是跳轉(zhuǎn)指令和函數(shù)調(diào)用指令的存在祟蚀。我們的用戶態(tài)中的代碼不能去人為的改變指令寄存器的值,也就是不能對指令寄存器進(jìn)行賦值占调,因此默認(rèn)情況下指令寄存器總是由CPU內(nèi)部設(shè)置為下一條指令的地址暂题,但是跳轉(zhuǎn)指令和函數(shù)調(diào)用指令例外移剪,這兩條指令的主要作用就是用來改變指令寄存器的內(nèi)容究珊,正是因?yàn)樘D(zhuǎn)功能才使得我們的程序可以不只按順序去執(zhí)行而是具有條件執(zhí)行和循環(huán)執(zhí)行代碼的能力。
在x64體系的CPU中提供了一個64位的指令寄存器RIP纵苛,而在arm64體系的CPU中則提供了一個64位的PC寄存器剿涮。需要再次強(qiáng)調(diào)的是指令寄存器保存的是下一條將要執(zhí)行的指令的內(nèi)存地址,而不是當(dāng)前正在執(zhí)行的指令的內(nèi)存地址攻人。
體系結(jié)構(gòu) | 長度 | 名稱 |
---|---|---|
x64 | 64 | RIP |
x64 | 32 | EIP |
arm64 | 64 | PC, LR |
這里再看一下arm64體系下的PC和LR寄存器取试,我們先看下面一張圖:
從上面的圖中我們可以看出PC寄存器和LR寄存器所表示的意義:PC寄存器保存的是下一條將要執(zhí)行的指令的內(nèi)存地址,而不是當(dāng)前正在執(zhí)行的指令的內(nèi)存地址怀吻。LR寄存器則保存著最后一次函數(shù)調(diào)用指令的下一條指令的內(nèi)存地址瞬浓。那么LR寄存器有什么作用嗎?答案就是為了做函數(shù)調(diào)用棧跟蹤蓬坡,我們的程序在崩潰時能夠?qū)⒑瘮?shù)調(diào)用棧打印出來就是借助了LR寄存器來實(shí)現(xiàn)的猿棉。具體的實(shí)現(xiàn)原理我會在后面的文章里面詳細(xì)介紹。
7.其他寄存器
上面列出的都是我們在編程時會用到的寄存器屑咳,其實(shí)CPU內(nèi)部還有很多專門用于控制的寄存器以及用于調(diào)試的寄存器萨赁,這些寄存器一般都提供給操作系統(tǒng)使用或者用于CPU內(nèi)部調(diào)試使用。這里就不再進(jìn)行介紹了兆龙,感興趣的同學(xué)可以去下載一本x64或者arm手冊進(jìn)行學(xué)習(xí)和了解杖爽。
寄存器的編碼
這里面需要澄清的是上述中的寄存器名稱只是匯編語言里面對寄存器的一個別稱或者有意義的命名,我們知道機(jī)器指令是二進(jìn)制數(shù)據(jù),一條機(jī)器指令里面無論是操作碼還是操作數(shù)都是二進(jìn)制編碼的慰安,二進(jìn)制數(shù)據(jù)太過晦澀難以理解腋寨,所以才有了匯編語言的誕生,匯編語言是一種機(jī)器指令的助記語言化焕,他只不過是以人類更容易理解的自然語言的方式來描述一條機(jī)器指令而已精置。所以雖然上面的寄存器看到的是一個個字母,但是在機(jī)器語言里面锣杂,則是通過給寄存器編號來表示某個寄存器的脂倦。還記得在我的介紹指令集的文章里面,你有看到過里面的虛擬CPU里面的寄存器的定義嗎:
//定義寄存器編號
typedef enum : int {
Reg0,
Reg1,
Reg2,
Reg3
} RegNum;
上面的枚舉你可以看到我們在代碼里面用Reg0, Reg1...來表示虛擬的寄存器編號元莫,但是實(shí)際的寄存器編號則分別為0赖阻,1... 真實(shí)中的CPU的寄存器也是如此編號的,我們來看下面一段代碼踱蠢,以及其中的機(jī)器指令:
mov x0, #0x0 ;0xD2800000
mov x1, #0x0 ;0xD2800001
mov x2, #0x0 ;0xD2800002
mov指令的二進(jìn)制結(jié)構(gòu)如下:可見上面的二進(jìn)制機(jī)器指令中關(guān)于寄存器部分的字段Rd分別從0到2而出現(xiàn)了差異火欧,從而說明了寄存器讀寫的編碼規(guī)則。寄存器編碼的機(jī)制和內(nèi)存地址編碼是同樣的原理和機(jī)制茎截,CPU訪問內(nèi)存數(shù)據(jù)時總是要指定內(nèi)存數(shù)據(jù)所在的地址苇侵,同樣CPU訪問某個寄存器時一樣的要通過寄存器編碼來完成,這些東西統(tǒng)統(tǒng)都體現(xiàn)在指令里面企锌。
寄存器的查看
上面分別介紹了兩種不同CPU上的寄存器榆浓,那么我們?nèi)绾蝸聿榭春驮O(shè)置寄存器的內(nèi)容呢?在XCODE中可以很方便的在代碼執(zhí)行到斷點(diǎn)時查看當(dāng)前線程中的所有寄存器中內(nèi)容(請選擇最左下角處的all表示顯示所有變量)撕攒。我們可以通過下面兩張圖來查看所有的寄存的信息陡鹃。
上面兩圖中的左下角列出了執(zhí)行到某個斷點(diǎn)時所有寄存器的當(dāng)前值,你可以看到其中的通用寄存器(General Purpose Registers)抖坪、浮點(diǎn)寄存器(Floating Point Registers)萍鲸、異常狀態(tài)寄存器(Exception State Registers)中的數(shù)據(jù)。通用寄存器中的每個寄存器默認(rèn)都是一個64位長度的存儲單元擦俐。查看左下角的寄存器值唯一的缺點(diǎn)是你無法看出寄存器中的保存的數(shù)據(jù)的真實(shí)類型脊阴,而只能干巴巴的看到16進(jìn)制的數(shù)值。其實(shí)你可以將寄存器理解一個個特殊定義的變量蚯瞧,既然可以在lldb中通過expr或者p命令來顯示某個變量的更加詳細(xì)的信息嘿期,那么也一樣的可以顯示某個寄存器當(dāng)前保存的數(shù)據(jù)的詳細(xì)信息。通過看上面圖片的右下角你可以看出状知,要想打印顯示某個寄存器的內(nèi)容秽五,我們在使用expr或者po時 只需要在顯示的寄存器的前面增加一個$即可。比如下面的例子中我們分別顯示模擬器下的rdi, rsi以及真機(jī)下的x0和x1寄存器中的內(nèi)容:
//模擬器下
expr -o -- $rdi
expr (char*)$rsi
expr *(CGFloat*)&$xmm0; //打印浮點(diǎn)數(shù)寄存器xmm0的值
//真機(jī)下
expr -o -- $x0
expr (char*)$x1
expr $r12 = 100; //和變量一樣你也可以手動改變寄存器的值
當(dāng)你在某個OC方法內(nèi)部斷點(diǎn)并打印這兩個寄存器的值時饥悴,大多數(shù)情況下你會發(fā)現(xiàn)rdi/x0總是指向一個OC的self對象坦喘,而rsi/x1則是這個方法的方法名盲再。沒有錯,這是系統(tǒng)的一個規(guī)定:在任何一個OC方法調(diào)用前都會將寄存器rdi/x0的值設(shè)置為調(diào)用方法的對象瓣铣,而將寄存器rsi/x1設(shè)置為方法的簽名也就是方法的SEL(具體的原因我會在后面的文章中詳細(xì)說明原因)答朋。很可惜的是上面的這套讀取和設(shè)置寄存器的語法在swift中就失效了,當(dāng)你要在swift中讀取和寫入寄存器的內(nèi)容時你應(yīng)該采用:
register read 寄存器
register write 寄存器 值
的方式來讀取和寫入某個寄存器的值了棠笑,比如下面的例子(lldb中):
register read x0 //讀取x0寄存器的值梦碗,這里不再需要附加$符號了
register read //讀取所有寄存器的值
register write x10 100 //將寄存器的x10的值設(shè)置為100
arm64體系的CPU中雖然定義X29,X30兩個寄存器,但是你在XCODE上是看不到這兩個寄存器的蓖救,但是你能看到FP和LR寄存器洪规,其實(shí)X29就是FP, X30就是LR。
寄存器的復(fù)用
1.線程切換時的寄存器復(fù)用
我們的代碼并不是只在單線程中執(zhí)行循捺,而是可能在多個線程中執(zhí)行斩例。那么這里你就可能會產(chǎn)生一個疑問?既然進(jìn)程中有多個線程在并行執(zhí)行从橘,而CPU中的寄存器又只有那么一套念赶,如果不加處理豈不會產(chǎn)生數(shù)據(jù)錯亂的場景?答案是否定的恰力。我們知道線程是一個進(jìn)程中的執(zhí)行單元叉谜,每個線程的調(diào)度執(zhí)行其實(shí)都是通過操作系統(tǒng)來完成。也就是說哪個線程占有CPU執(zhí)行以及執(zhí)行多久都是由操作系統(tǒng)控制的踩萎。具體的實(shí)現(xiàn)是每創(chuàng)建一個線程時都會為這線程創(chuàng)建一個數(shù)據(jù)結(jié)構(gòu)來保存這個線程的信息停局,我們稱這個數(shù)據(jù)結(jié)構(gòu)為線程上下文,每個線程的上下文中有一部分?jǐn)?shù)據(jù)是用來保存當(dāng)前所有寄存器的副本驻民。每當(dāng)操作系統(tǒng)暫停一個線程時翻具,就會將CPU中的所有寄存器的當(dāng)前內(nèi)容都保存到線程上下文數(shù)據(jù)結(jié)構(gòu)中履怯。而操作系統(tǒng)要讓另外一個線程執(zhí)行時則將要執(zhí)行的線程的上下文中保存的所有寄存器的內(nèi)容再寫回到CPU中回还,并將要運(yùn)行的線程中上次保存暫停的指令也賦值給CPU的指令寄存器,并讓新線程再次執(zhí)行叹洲∧叮可以看出操作系統(tǒng)正是通過這種機(jī)制保證了即使是多線程運(yùn)行時也不會導(dǎo)致寄存器的內(nèi)容發(fā)生錯亂的問題。因?yàn)槊慨?dāng)線程切換時操作系統(tǒng)都幫它們將數(shù)據(jù)處理好了运提。下面的部分線程上下文結(jié)構(gòu)正是指定了所有寄存器信息的部分:
//這個結(jié)構(gòu)是linux在arm32CPU上的線程上下文結(jié)構(gòu)蝗柔,代碼來自于:http://elixir.free-electrons.com/linux/latest/source/arch/arm/include/asm/thread_info.h
//這里并沒有保存所有的寄存器,是因?yàn)锳BI中定義linux在arm上運(yùn)行時所使用的寄存器并不是全體寄存器民泵,所以只需要保存規(guī)定的寄存器的內(nèi)容即可癣丧。這里并不是所有的CPU所保存的內(nèi)容都是一致的,保存的內(nèi)容會根據(jù)CPU架構(gòu)的差異而不同栈妆。
//因?yàn)閕OS的內(nèi)核并未開源所以無法得到iOS定義的線程上下文結(jié)構(gòu)胁编。
//線程切換時要保存的CPU寄存器厢钧,
struct cpu_context_save {
__u32 r4;
__u32 r5;
__u32 r6;
__u32 r7;
__u32 r8;
__u32 r9;
__u32 sl;
__u32 fp;
__u32 sp;
__u32 pc;
__u32 extra[2]; /* Xscale 'acc' register, etc */
};
//線程上下文結(jié)構(gòu)
struct thread_info {
unsigned long flags; /* low level flags */
int preempt_count; /* 0 => preemptable, <0 => bug */
mm_segment_t addr_limit; /* address limit */
struct task_struct *task; /* main task structure */
__u32 cpu; /* cpu */
__u32 cpu_domain; /* cpu domain */
struct cpu_context_save cpu_context; /* cpu context */
__u32 syscall; /* syscall number */
__u8 used_cp[16]; /* thread used copro */
unsigned long tp_value[2]; /* TLS registers */
#ifdef CONFIG_CRUNCH
struct crunch_state crunchstate;
#endif
union fp_state fpstate __attribute__((aligned(8))); /*浮點(diǎn)寄存器*/
union vfp_state vfpstate; /*向量浮點(diǎn)寄存器*/
#ifdef CONFIG_ARM_THUMBEE
unsigned long thumbee_state; /* ThumbEE Handler Base register */
#endif
};
2.函數(shù)調(diào)用時的寄存器復(fù)用
寄存器數(shù)據(jù)被切換的問題也同樣會出現(xiàn)在函數(shù)的調(diào)用上,舉個例子來說:假設(shè)我們正在調(diào)用foo1函數(shù)嬉橙,在foo1中我們的代碼指令會用到x0,x1,x2等寄存器進(jìn)行數(shù)據(jù)運(yùn)算和存儲早直。假設(shè)我們在foo1中的某處調(diào)用foo2函數(shù),這時候因?yàn)閒oo2函數(shù)內(nèi)部的代碼指令也可能會用到x0,x1,x2等寄存器市框。那么問題就來了霞扬,因?yàn)閒oo2內(nèi)部的執(zhí)行會改變x0,x1,x2寄存器的內(nèi)容,那么當(dāng)foo2函數(shù)返回并再次執(zhí)行foo1下面的代碼時枫振,就有可能x0,x1,x2等寄存器的內(nèi)容被改動而跟原先的值不一致了喻圃,從而導(dǎo)致數(shù)據(jù)錯亂問題的發(fā)生。那么這又是如何解決的呢粪滤?解決的方法就是由編譯器在編譯出機(jī)器指令時按一定的規(guī)則進(jìn)行編譯(這是一種ABI規(guī)則级及,什么是ABI后續(xù)我會詳細(xì)介紹)。 我們知道在高級語言中定義的變量無論是局部還是全局變量或者是堆內(nèi)存分配的變量都是在內(nèi)存中存儲的额衙。編譯為機(jī)器指令后饮焦,對內(nèi)存數(shù)據(jù)進(jìn)行處理時則總是要將內(nèi)存中的數(shù)據(jù)轉(zhuǎn)移到寄存器中進(jìn)行,然后再將處理的結(jié)果寫回到內(nèi)存中去窍侧,這種場景會發(fā)生在每次進(jìn)行變量訪問的情形中县踢。我們來看如下的高級語言代碼:
void foo2()
{
int a = 20;
a = a + 2;
int b = 30;
b = b * 3;
int c = a + b;
}
void foo1()
{
int a = 10;
int b = 20;
int c = 30;
a += 10;
b += 10;
c += 10;
foo2();
c = a + b;
}
雖然我們在foo1和foo2里面都定義了a,b,c三個變量,但是因?yàn)檫@三個變量分別保存在foo1和foo2的不同棧內(nèi)存區(qū)伟件,他們都是局部變量因此兩個函數(shù)之間的變量是不會受到影響的硼啤。但是如果是機(jī)器指令則不一樣了,因?yàn)檫\(yùn)算時總是要將內(nèi)存數(shù)據(jù)移動到寄存器中去斧账,但是寄存器只有一份谴返。因此解決的方法就是高級語言里面的每一行代碼在編譯為機(jī)器指令時總是先將數(shù)據(jù)從內(nèi)存讀取到寄存器中,處理完畢后立即寫回到內(nèi)存中去咧织,中間并不將數(shù)據(jù)進(jìn)行任何在寄存器上的緩存
從上面的代碼對應(yīng)關(guān)系可以看出嗓袱,每次高級語言的賦值處理總是先讀取再計(jì)算然后再寫回三步,因此當(dāng)調(diào)用foo2函數(shù)前,所有寄存器其實(shí)都是處于空閑的或者可以被任意修改的狀態(tài)习绢。而調(diào)用完畢函數(shù)后要訪問變量時又再次從內(nèi)存讀取到寄存器渠抹,運(yùn)算完畢后再立即寫回到內(nèi)存中。正是這種每次訪問數(shù)據(jù)時都從內(nèi)存讀取到寄存器闪萄,處理后立即再寫會內(nèi)存的機(jī)制就足以保證了即使在函數(shù)調(diào)用函數(shù)時也不會出現(xiàn)數(shù)據(jù)混亂的問題發(fā)生梧却。
上面是對寄存器復(fù)用的兩種不同的策略:空間換時間和時間換空間。 在軟件設(shè)計(jì)中當(dāng)存在有某個共享資源被多個系統(tǒng)競爭或者使用時我們就可以考慮采用上面的兩種不同方案來解決我們的問題败去。
??【返回目錄】