在高級(jí)語言中倔丈,變量和數(shù)值操作是很基本的語法喻鳄,基本所有語言都有扼倘,但是其在匯編級(jí)別上是怎么實(shí)現(xiàn)的?或者拓展了說除呵,在計(jì)算機(jī)上再菊,變量和數(shù)值操作的實(shí)現(xiàn)邏輯是怎樣的?
主要內(nèi)容
-
匯編與機(jī)器碼
首先竿奏,我們要知道袄简,在計(jì)算機(jī)架構(gòu)中腥放,最重要的兩層抽象是指令集和虛擬內(nèi)存泛啸。前者是所有計(jì)算機(jī)程序的最小邏輯單元,即所有的計(jì)算機(jī)程序秃症,都會(huì)被轉(zhuǎn)換為一連串的計(jì)算機(jī)指令并運(yùn)行候址。而虛擬內(nèi)存則是計(jì)算機(jī)對程序可訪問內(nèi)存的一層抽象,因?yàn)檫@層抽象存在种柑,每一個(gè)運(yùn)行在計(jì)算機(jī)上的程序可以認(rèn)為內(nèi)存是一個(gè)只有自己和OS在使用超級(jí)大的字節(jié)數(shù)據(jù)岗仑。而計(jì)算機(jī)上存儲(chǔ)、使用的數(shù)據(jù)都是二進(jìn)制數(shù)(機(jī)器碼)的形式聚请,因此荠雕,所有的計(jì)算機(jī)指令都會(huì)被轉(zhuǎn)換為對應(yīng)的二進(jìn)制數(shù),計(jì)算機(jī)最終會(huì)根據(jù)這些不同的二進(jìn)制數(shù)執(zhí)行相應(yīng)的計(jì)算機(jī)指令驶赏。但是二進(jìn)制數(shù)是機(jī)器的語言炸卑,如果我們要直接使用二進(jìn)制數(shù)進(jìn)行編程,先不提各個(gè)機(jī)器上的相同指令對應(yīng)機(jī)器碼之間的差異性和代碼的可讀性問題煤傍,記憶各個(gè)指令對應(yīng)的二進(jìn)制數(shù)無疑是困難的盖文。而如果我們設(shè)計(jì)一種人類可以很容易理解、記憶的語言蚯姆,它與計(jì)算機(jī)指令有一一對應(yīng)的關(guān)系五续,而我們只要再創(chuàng)建一個(gè)計(jì)算機(jī)指令編譯器,將這種新語言轉(zhuǎn)換對應(yīng)的機(jī)器碼龄恋,即解決了上述提到的各個(gè)問題疙驾。
而匯編語言就是上面說的“新語言”,它只是對各個(gè)計(jì)算機(jī)指令二進(jìn)制數(shù)的簡單字符抽象郭毕,匯編語言的格式與編譯器最終轉(zhuǎn)換為的二進(jìn)制數(shù)形式數(shù)據(jù)并沒太大區(qū)別荆萤。下面是一個(gè)簡單的代碼實(shí)例:
【待補(bǔ)充】 -
數(shù)據(jù)類型
在計(jì)算機(jī)上沒有常規(guī)意義的數(shù)據(jù)類型的概念,即沒有Integer,String類型之分链韭。在 匯編語言中偏竟,只存在不同長度的二進(jìn)制數(shù),但是使用二進(jìn)制數(shù)時(shí)敞峭,指令參數(shù)只有以下三種:- 標(biāo)量踊谋,例如
$1
,$22
旋讹,當(dāng)它出現(xiàn)在指令參數(shù)時(shí)殖蚕,參數(shù)的值就是其對應(yīng)的二進(jìn)制數(shù),$
符號(hào)只是在匯編的寫法習(xí)慣沉迹,在實(shí)際的二進(jìn)制代碼中并不存在$
前綴睦疫。 - 寄存器,例如
%rax
鞭呕,%rsi
蛤育,當(dāng)它出現(xiàn)在指令參數(shù)時(shí),表示的值為存儲(chǔ)在寄存器中的二進(jìn)制數(shù)葫松。和上面的標(biāo)量表示一樣瓦糕,匯編的寫法上一般會(huì)在寄存器名前加上%
做為標(biāo)識(shí)。使用寄存器作為參數(shù)時(shí)腋么,需要注意咕娄,當(dāng)指令要操作不同長度的二進(jìn)制數(shù)時(shí),我們要使用對應(yīng)長度的寄存器名珊擂。例如圣勒,寄存器%rax
的64位、32位摧扇、16位和8位的名稱分別為%rax
圣贸,%eax
,%ax
扳剿,%al
旁趟,那么當(dāng)計(jì)算機(jī)指令操作16位數(shù)據(jù)時(shí),需要用%ax
標(biāo)識(shí)該寄存器庇绽,8位則使用%al
锡搜,需要與指令類型嚴(yán)格一致。
- 內(nèi)存數(shù)據(jù)瞧掺,例如
0x100
耕餐,(%rdi)
,當(dāng)指令參數(shù)沒有$|%
前綴時(shí)辟狈,那么他就表示的是存放在內(nèi)存某個(gè)位置的二進(jìn)制數(shù)肠缔。這個(gè)時(shí)候夏跷,該二進(jìn)制數(shù)的長度只取決于指令類型。()
表示的是一種特殊的內(nèi)存地址計(jì)算規(guī)則明未,計(jì)算規(guī)則為:100(, %rdi, 2)
,其中%rdi
的值為0x1
趟妥,則最終結(jié)果為100 + 1 * 2 = 102
猫态,即內(nèi)存地址為102。
- 標(biāo)量踊谋,例如
訪問數(shù)據(jù)(未完)
算術(shù)邏輯操作
思考:
- 在匯編語言中披摄,如何表示高級(jí)語言中的變量亲雪?
在高級(jí)語言中,變量往往就代表著程序的操作對象疚膊,可以作為計(jì)算結(jié)果的存儲(chǔ)地點(diǎn)义辕、程序的操作對象,甚至可以表示一段程序的執(zhí)行過程寓盗。但是對于匯編語言來說灌砖,不管是可操作的數(shù)據(jù),還是計(jì)算機(jī)指令本身贞让,都只是一連串的二進(jìn)制數(shù)周崭,這些二進(jìn)制數(shù)的具體含義柳譬,僅依賴于其在匯編程序中的上下文(指令類型及參數(shù)位置)喳张。
但是在匯編語言中并不存在變量的概念,匯編語言的操作對象是各個(gè)寄存器和內(nèi)存數(shù)據(jù)美澳,那么匯編語言是怎么表示高級(jí)語言中變量的語義的呢销部?
我們先看一段代碼,對于C語言函數(shù):
其轉(zhuǎn)換的匯編語言可能是這樣的:void concat_char(char a, char b, char *dest){ dest[0] = a; dest[1] = b; }
上面的匯編代碼中聊记,movb表示移動(dòng)一個(gè)字節(jié)撒妈,參數(shù)有兩個(gè),第一個(gè)參數(shù)為源地址排监,第二個(gè)參數(shù)為目標(biāo)地址狰右。從上面匯編代碼可以看出,對于匯編語言舆床,不同的參數(shù)類型只代表著不同的數(shù)據(jù)大小棋蚌。concat_char: movb %dil, (%rdx) %dil表示第一個(gè)參數(shù)所在的寄存器制跟,%rdx表示第三個(gè)參數(shù)所在寄存器地址舅桩,由于第三個(gè)參數(shù)是指針,因此需要加上()表示取其指向的內(nèi)存地址 movb %sil, (%rdx, $1, 1) %sil表示第二個(gè)參數(shù)所在的寄存器雨膨,$1表示標(biāo)量擂涛,即$1就表示了數(shù)值1,(%rdx, $1, 1)的語義為(%rdx + 1 * 1)指向的內(nèi)存地址 ret 表示函數(shù)結(jié)束
即使考慮更復(fù)雜的變量類型 ---- JAVA中的對象嫁佳,其存儲(chǔ)于計(jì)算機(jī)中也只是一連串的二進(jìn)制數(shù)據(jù),對于匯編語言來說也只有使用上的區(qū)別谷暮,即JVM轉(zhuǎn)換為機(jī)器碼時(shí)蒿往,可能會(huì)以不同的指令(同一類型指令,但是操作不同大小的數(shù)據(jù))去操作對應(yīng)對象數(shù)據(jù)的各個(gè)一部分(對應(yīng)著對象實(shí)例的不同的字段類型)湿弦,但是變量本身卻只對應(yīng)著某個(gè)寄存器或某個(gè)內(nèi)存地址熄浓。
總的來說,我們或許可以這樣認(rèn)為省撑,在匯編語言并不存在變量的概念赌蔑,但是我們可以通過操作不同數(shù)據(jù)大小的不同指令,結(jié)合寄存器和內(nèi)存地址來模擬實(shí)現(xiàn)變量的效果竟秫。