匯編基礎(chǔ)教程
16位和32位的80x86匯編語言的區(qū)別
需要注意的是匯編不是一種語言,不同平臺有不同的匯編語言對應(yīng)栈戳,因為匯編和操作系統(tǒng)平臺相關(guān)安聘,所以匯編語言沒有移植性。對于IA-32架構(gòu)平臺而言麦向,選用的是32位80386匯編語言瘟裸,也就是說本教程討論的操作系統(tǒng)平臺是32位的,可執(zhí)行文件的格式也是32位而不是64位或16位的诵竭。
實際分析中讀者要知道研究的程序是運(yùn)行在什么平臺上话告,以選擇相應(yīng)的匯編語言兼搏,對應(yīng)IA-32架構(gòu)而言,IA-16架構(gòu)的匯編語言原理其實和IA-32的匯編語言一樣沙郭,學(xué)習(xí)過16位的80x386匯編語言的讀者只需花一點時間就可以轉(zhuǎn)到32位80386匯編語言上佛呻。
什么是IA-32?
IA-32(Intel Architecture)病线,英特爾體系架構(gòu)吓著,英特爾從486開始采用,也就叫X86-32架構(gòu)送挑,
16位操作系統(tǒng)與32位操作系統(tǒng)的80x86匯編語言主要區(qū)別如下:
16位操作系統(tǒng)中的中斷調(diào)用相當(dāng)于32位操作系統(tǒng)中的API調(diào)用绑莺。16位操作系統(tǒng)中的段地址和偏移地址在32位中消失了,在32位操作系統(tǒng)中統(tǒng)一采用平坦的內(nèi)存地址模式尋址让虐。
16位操作系統(tǒng)中的程序運(yùn)行在RING0級紊撕,也就是說普通程序和操作系統(tǒng)程序運(yùn)行在同一個級別并且擁有最高權(quán)限,而32位操作系統(tǒng)中的程序一般只擁有RING3級運(yùn)行權(quán)限赡突,程序的所有操作都受到操作系統(tǒng)控制对扶,若程序要獲得RING0操作特權(quán)只能通過驅(qū)動程序?qū)崿F(xiàn)。
16位操作系統(tǒng)的可執(zhí)行文件格式和32位操作系統(tǒng)的可執(zhí)行文件格式不同惭缰,在32位的Windows操作系統(tǒng)中浪南,可執(zhí)行文件的格式叫PE格式,32位的Windows操作系統(tǒng)運(yùn)行在CPU的保護(hù)模式之上漱受,而16位的系統(tǒng)則運(yùn)行在CPU的實模式上络凿。
了解EAX、EBX昂羡、ECX和EDX寄存器以及對應(yīng)的16位寄存器
IA-32架構(gòu)中一共有4個32位寄存器絮记,用于保存臨時數(shù)據(jù),它們分別是EAX虐先、EBX怨愤、ECX和EDX。
這4個32位寄存器的通用寄存器名字前面都有一個“E”字母蛹批,含義是“Expand”擴(kuò)展撰洗,這是由于在16位的時代,這4個通用寄存器的名字是AX腐芍、BX差导、CX和DX,到了32位后就在它們的名字前面加個“E”來區(qū)別是32位還是16位猪勇。
這4個32位的通用寄存器可以當(dāng)作16位使用设褐,也可以當(dāng)作8位使用。當(dāng)作8位使用時,就將AX折開為AH和AL络断,AH中的“H”代表“high”裁替,意思是高位的意思,AL中的“L”代表“l(fā)ow”貌笨,意思是地位的意思弱判。同理,BX锥惋、CX和DX可折開為BH昌腰、BL、CH膀跌、CL遭商、DH、DL來使用捅伤。
一些寄存器是別的寄存器的一部分:例如劫流,如果EAX保存了值12782345,這里是其他寄存器的值丛忆。
|:--- |:------:|:------:|:------:|:------:|
| EAX | 12 | 78 | 23 | 45 |
| AX | 12 | 78 | 23 | 45 |
| AH | 12 | 78 | 23 | 45 |
學(xué)習(xí)EAX祠汇、EBX、ECX和EDX寄存器的用途
- EAX寄存器:EAX稱為累加器熄诡,常用于算數(shù)運(yùn)算可很、布爾操作、邏輯操作凰浮、返回函數(shù)結(jié)果等。
- EBX寄存器:EBX稱為基址寄存器袜茧,常用于存檔內(nèi)存地址。
- ECX寄存器:ECX稱為計數(shù)寄存器纳鼎,常用于存放循環(huán)語句的循環(huán)次數(shù),字符串操作中也常用递递。
- EDX寄存器:稱為數(shù)據(jù)寄存器喷橙,常常和EAX一起使用登舞。
注意:上面所述的4個通用寄存器的專門用途不是一成不變的悬荣,編譯器在編譯程序的時候會根據(jù)很多因素菠秒,例如編譯器、編譯條件、操作系統(tǒng)等做出相應(yīng)的改變践叠,讀者要知道著手研究的程序是用什么編譯器編譯,然后針對具體的編譯器參考該編譯器的說明禁灼。
學(xué)習(xí)變址寄存器-ESI和EDI寄存器與其用途
變址寄存器
顧名思義,變址的含義是內(nèi)存地址會變動的弄捕,也就是說變址寄存器中存放在變動的內(nèi)存地址。80386架構(gòu)中有兩個變址寄存器穿铆,分別是ESI和EDI斋荞。
ESI和EDI寄存器:
- ESI:ESI稱為源變址寄存器,通常存放要處理的數(shù)據(jù)的內(nèi)存地址平酿。
- EDI:EDI稱為目的變址寄存器,通常存放處理后的數(shù)據(jù)的內(nèi)存地址别洪。
ESI和EDI寄存器的用途
ESI和EDI常用來配合使用完成數(shù)據(jù)的賦值操作柳刮,下面是一個ESI和EDI配合使用的例子。
Rep movs dword ptr [edi],dword ptr [esi]
上面的指令把ESI所指向的內(nèi)存地址中的內(nèi)容復(fù)制到EDI所指向的內(nèi)存中痢毒,數(shù)據(jù)的長度在ECX寄存器中指定蚕甥。
學(xué)習(xí)指針寄存器-EBP和ESP寄存器與其用途
指針寄存器
80386的指針寄存器有基址寄存器EBP,堆棧指針寄存器ESP和指令指針寄存器EIP菇怀。只需要了解基址寄存器EBP和堆棧指針寄存器ESP即可爱沟,指令指針寄存器EIP總是指向下一條要執(zhí)行的指令的地址,一般情況下無需修改EIP呼伸。
EBP和ESP寄存器
(1)EBP:EBP稱為基址寄存器,可作為通用寄存器用于存放操作數(shù)搂根,常用來代替堆棧指針訪問堆棧中的數(shù)據(jù)。
(2)ESP:ESP稱為堆棧指針寄存器剩愧,不可作為通用寄存器使用,ESP存放當(dāng)前堆棧棧頂?shù)牡刂枫逶茫话闱闆r下五督,ESP和EBP聯(lián)合使用來訪問函數(shù)中的參數(shù)和局部變量。
EBP和ESP寄存器的用途:
EBP和ESP常配合使用完成堆棧的訪問充包,下面是一段常見的堆棧訪問指令。
Push ebp
Mov ebp,esp
Sub esp,78
Push esi
Push edi
Cmp dword ptr [ebp+8],0
學(xué)習(xí)標(biāo)志寄存器-EFLAGS寄存器與其用途
標(biāo)志寄存器EFLAGS一共有32位淆储,在這32位中大部分是保留和給編寫操作系統(tǒng)的人用的家浇,一般情況下只需知道32位的低16位中的8位即可.
下面的圖列出了標(biāo)志寄存器EFLAGS中需要了解的8個位的位置。
- OF(Overflow Flag):溢出標(biāo)志点额,溢出時為1莺琳,否則置0。
- DF (Direction Flag):方向標(biāo)志惭等,在串處理指令中控制信息的方向辞做。
- IF (Interrupt Flag) :中斷標(biāo)志
- AF (Auxiliary carry Flag) :輔助進(jìn)位標(biāo)志,有進(jìn)位時置1秤茅,否則置0。
- ZF (Zero Flag) :零標(biāo)志孔厉,運(yùn)算結(jié)構(gòu)為0時ZF位位置1帖努,否則置0。
- SF (Sign Flag):符號標(biāo)志污桦,結(jié)果為負(fù)時置1匙监,否則置0。
- CF (Carry Flag): 進(jìn)位標(biāo)志稼钩,進(jìn)位時置1达罗,否則置0。
- PF (Parity Flag): 奇偶標(biāo)志巡李。結(jié)果操作數(shù)中1的個數(shù)為偶數(shù)時置1扶认,否則置0。
EFLAGS寄存器的用途
正如上面所說EFLAGS是實現(xiàn)條件判斷和邏輯判斷的一種機(jī)制狱从,在匯編語言中一般不直接訪問EFLAGS寄存器叠纹,而是通過指令的操作隱含訪問EFLAGS寄存器,下面是一個利用EFLAGS寄存器的例子吊洼。
Cmp dword ptr [ebp+8],0 ;影響標(biāo)志CF冒窍、ZF、SF综液、OF谬莹、AF和PF
Jz 00405898 ; 如果ZF等于1桩了,則跳轉(zhuǎn)到00405898
學(xué)習(xí)6種靈活的尋址方式與其作用
- 立即尋址
示例:
Mov eax,56H
作用:通常用于賦值埠戳。
- 直接尋址
示例:
Mov eax,[12558878H]
作用:通常用于處理變量。
- 寄存器尋址
示例
Mov eax,[edi]
作用:地址在寄存器中颗圣。
- 寄存器相對尋址
示例
Mov EAX,[EDI+32H]
作用:常用于訪問數(shù)組和結(jié)構(gòu)屁使。
- 基址加變址尋址
示例
Mov EAX,[EBP+ESI]
作用:常用于訪問數(shù)組
- 相對基址加變址尋址。
示例
MOV EAX,[EBX+EDI-10H]
作用:常用于訪問結(jié)構(gòu)蔽午。
高級語言中的數(shù)據(jù)結(jié)構(gòu)和80386尋址方式的關(guān)系
一般高級語言中的數(shù)據(jù)結(jié)構(gòu)和尋址方式有一定的關(guān)系酬蹋,熟悉這些關(guān)系對逆向分析反匯編指令有很大的幫助。
表1-1所示為高級語言中的數(shù)據(jù)結(jié)構(gòu)和80386尋址方式的關(guān)系写半。
全局類型
全部使用數(shù)據(jù)段尉咕,變量尋址使用直接的內(nèi)存地址,數(shù)組尋址使用ESI(源變址寄存器)+內(nèi)存地址悔捶。
局部類型
全部使用堆棧单芜,變量尋址使用ESP(堆棧指針寄存器)+偏移,數(shù)組尋址使用ESP(堆棧指針寄存器)+ESI(源變址寄存器)+地址偏移
動態(tài)分配類型
全部使用數(shù)據(jù)段堂淡,變量尋址使用EBX(基址寄存器)或EAX(累加寄存器)+地址偏移扒腕,數(shù)組尋址使用EBX(基址寄存器)+ESI(源變址寄存器)+地址偏移
局部類型和動態(tài)分配類型都的數(shù)組尋址都是用了ESI(源變址寄存器)+地址偏移
學(xué)習(xí)80386指令-Intel格式和AT&T格式的指令格式
80386指令
觀察一下Intel 的80x86 CPU文檔手冊會發(fā)現(xiàn),Intel的80x86 CPU支持幾百條指令皆的,如此多的指令莫說深入研究蹋盆,連入門恐怕也非易事硝全。
幸運(yùn)的是楞抡,在這幾百條的指令中,常用的也不過幾十條而已,Intel 的80x86 CPU之所以支持幾百條指令柱恤,原因在于Intel 的80x86 CPU為了保持向下兼容的問題找爱,所以從過去到現(xiàn)在的所有指令都包含在CPU里面,例如有8086/8088车摄、80186吮播、80286和80386等。
Intel格式和AT&T格式(&在英語里讀and)
編寫IA-32架構(gòu)的匯編語言常見有兩種格式意狠,一種是Intel格式,另一種是AT&T格式闷板。
- Intel 格式的指令格式院塞。
指令名稱 目標(biāo)操作數(shù)DST,源操作數(shù)SRC
示例代碼:
Mov eax,[edx] //將內(nèi)存地址為EDX的數(shù)據(jù)放入EAX寄存器
Xchg eax,edi //交換EAX和EDI寄存器的值
Add eax,ebx // 將EAX和EBX相加县遣,結(jié)構(gòu)放回EAX中
Shl eax,4 //將EAX邏輯左移4位汹族。
- AT&T格式的指令格式。
指令名稱 源操作數(shù)SRC饭聚,目標(biāo)操作數(shù)DST
示例代碼:
Mov (%EDX),%EAX //將內(nèi)存地址為EDX的數(shù)據(jù)放入EAX寄存器
XCHG %EDI,%EAX //交換EAX和EDI寄存器的值
ADD %EBX,%EAX //將EAX和EBX相加搁拙,結(jié)構(gòu)放回EAX中
SHL $4,%EAX //將EAX邏輯左移4位法绵。
本教程中講解的匯編語言統(tǒng)一采用Intel 格式的匯編格式朋譬。
學(xué)習(xí)數(shù)據(jù)傳送指令MOV兴垦、XCHG
80386的數(shù)據(jù)傳送指令是為了實現(xiàn)CPU和內(nèi)存、輸入/輸出端口之間的數(shù)據(jù)傳送狡赐。
- MOV:稱為數(shù)值傳送指令钦幔,格式是“MOV DST,SRC”。
- MOV指令將源操作數(shù)SRC傳送到目的操作數(shù)DST中鲤氢,
- 傳送的數(shù)據(jù)格式可以是8字節(jié)卷玉、16字節(jié)和32字節(jié)。
示例代碼:
MOV EAX,56 //將56H立即數(shù)傳送到EAX寄存器
MOV ESI,DWROD PTR [EAX*2+1] //將內(nèi)存地址為EAX*2+1處的4字節(jié)數(shù)據(jù)傳送到ESI寄存器咆蒿。
MOV AH,BYTE PTR [ESI*2+EAX] //將內(nèi)存地址為ESI*2+EAX處的8位數(shù)據(jù)傳送到AH寄存器蚂子。
MOV DWORD PTR [ESP+36],EBX //將EBX寄存器的值以4字節(jié)傳送到堆棧地址為ESP+36所指向的地方。
- XCHG:稱為交換指令蒂破,XCHG實現(xiàn)寄存器間和內(nèi)存間的數(shù)據(jù)交換别渔。
格式是“XCHG DST,SRC”。XCHG指令交換SRC和DST之間的數(shù)據(jù)哎媚,
交換的數(shù)據(jù)可以是8字節(jié)拨与、16字節(jié)和32字節(jié),其中SRC和DST必須格式相同买喧。
示例代碼:
XCHG EAX,EDX //將EDX寄存器的值和EAX寄存器的值交換
XCHG [ESP-55],EDI //將EDI寄存器的值和堆棧地址為[esp-55]處的值交換。
XCHG BH,BL //將BL寄存器和BH寄存器的值交換今缚。
學(xué)習(xí)數(shù)據(jù)傳送指令PUSH、POP
PUSH和POP:稱為壓入堆棧指令和彈出堆棧指令瞬项,格式是“PUSH SRC(源操作數(shù))”和“POP DST(目的操作數(shù))”何荚。
PUSH指令和POP指令是匹配出現(xiàn)的,上面的代碼有多少個PUSH下面的代碼就有多少個POP绎橘,否則堆棧就會不平衡唠倦。
PUSH指令將源操作數(shù)SRC壓入堆棧涮较,同時ESP-4狂票,而POP恰恰相反,POP指令從堆棧的頂部彈出4字節(jié)的數(shù)值然后放入DST闺属。在32位的Windows操作系統(tǒng)上掂器,PUSH和POP指令的操作是以4字節(jié)為單位的。
PUSH和POP指令常用于向函數(shù)傳遞參數(shù)国瓮。
示例代碼:
PUSH EAX //將EAX寄存器的值以4字節(jié)壓入堆棧乃摹,同時ESP-4
PUSH DWORD PTR [12FF8589] //將內(nèi)存地址為12FF8589所指向的值以4字節(jié)壓入堆棧,同時ESP-4
POP DWORD PTR [12FF8589] //將堆棧頂部的4字節(jié)彈出到內(nèi)存地址為12FF8589所指地方孵睬,同時ESP+4
POP EAX //將堆棧頂部的4字節(jié)彈出到EAX寄存器,同時ESP+4