我們在學(xué)習(xí)逆向開發(fā)之前,我們要了解一個基本的逆向原理.首先我們是逆向iOS系統(tǒng)上面的APP.那么我們知道,一個APP安裝在手機(jī)上面的可執(zhí)行文件本質(zhì)上是二進(jìn)制文件.因為iPhone手機(jī)本質(zhì)上執(zhí)行的指令是二進(jìn)制.是由手機(jī)上的CPU執(zhí)行的.所以逆向開發(fā)是建立在分析二進(jìn)制上面.所以今天我們接下來從非常基礎(chǔ)的東西開始講解.
匯編語言的發(fā)展
機(jī)器語言
由0和1組成的機(jī)器指令.
- 加:0100 0000
- 減:0100 1000
- 乘:1111 0111 1110 0000
- 除:1111 0111 1111 0000
匯編語言(assembly language)
使用助記符代替機(jī)器語言
如:
- 加:INC EAX 通過編譯器 0100 0000
- 減:DEC EAX 通過編譯器 0100 1000
- 乘:MUL EAX 通過編譯器 1111 0111 1110 0000
- 除:DIV EAX 通過編譯器 1111 0111 1111 0000
高級語言(High-level programming language)
C\C++\Java\OC\Swift,更加接近人類的自然語言
比如C語言:
- 加:A+B 通過編譯器 0100 0000
- 減:A-B 通過編譯器 0100 1000
- 乘:A*B 通過編譯器 1111 0111 1110 0000
- 除:A/B 通過編譯器 1111 0111 1111 0000
我們的代碼在終端設(shè)備上是這樣的過程:
- 匯編語言與機(jī)器語言一一對應(yīng),每一條機(jī)器指令都有與之對應(yīng)的匯編指令
- 匯編語言可以通過編譯得到機(jī)器語言荧呐,機(jī)器語言可以通過反匯編得到匯編語言
- 高級語言可以通過編譯得到匯編語言 \ 機(jī)器語言祠肥,但匯編語言\機(jī)器語言幾乎不可能還原成高級語言
匯編語言的特點(diǎn)
可以直接訪問、控制各種硬件設(shè)備被去,比如存儲器主儡、CPU等,能最大限度地發(fā)揮硬件的功能
能夠不受編譯器的限制惨缆,對生成的二進(jìn)制代碼進(jìn)行完全的控制
目標(biāo)代碼簡短糜值,占用內(nèi)存少,執(zhí)行速度快
匯編指令是機(jī)器指令的助記符,同機(jī)器指令一一對應(yīng)坯墨。每一種CPU都有自己的機(jī)器指令集\匯編指令集寂汇,所以匯編語言不具備可移植性
知識點(diǎn)過多,開發(fā)者需要對CPU等硬件結(jié)構(gòu)有所了解捣染,不易于編寫骄瓣、調(diào)試、維護(hù)
不區(qū)分大小寫液斜,比如mov和MOV是一樣的
匯編的用途(哥么我學(xué)了能干啥?)
- 編寫驅(qū)動程序累贤、操作系統(tǒng)(比如Linux內(nèi)核的某些關(guān)鍵部分)
- 對性能要求極高的程序或者代碼片段叠穆,可與高級語言混合使用(內(nèi)聯(lián)匯編)
- 軟件安全
- 病毒分析與防治
- 逆向\加殼\脫殼\破解\外掛\免殺\加密解密\漏洞\黑客
- 理解整個計算機(jī)系統(tǒng)的最佳起點(diǎn)和最有效途徑
- 為編寫高效代碼打下基礎(chǔ)
- 弄清代碼的本質(zhì)
- 函數(shù)的本質(zhì)究竟是什么?
- ++a + ++a + ++a 底層如何執(zhí)行的?
- 編譯器到底幫我們干了什么?
- DEBUG模式和RELEASE模式有什么關(guān)鍵的地方被我們忽略
- ......
最后來句裝13的話
越底層越單純!真正的程序員都需要了解的一門非常重要的語言,匯編!
匯編語言的種類
-
目前討論比較多的匯編語言有
- 8086匯編(8086處理器是16bit的CPU)
- Win32匯編
- Win64匯編
- ARM匯編(嵌入式、Mac臼膏、iOS)
- ......
我們iPhone里面用到的是ARM匯編,但是不同的設(shè)備也有差異.因CPU的架構(gòu)不同.
架構(gòu) | 設(shè)備 |
---|---|
armv6 | iPhone, iPhone2, iPhone3G, 第一代硼被、第二代 iPod Touch |
armv7 | iPhone3GS, iPhone4, iPhone4S,iPad, iPad2, iPad3(The New iPad), iPad mini, iPod Touch 3G, iPod Touch4 |
armv7s | iPhone5, iPhone5C, iPad4(iPad with Retina Display) |
arm64 | iPhone5S 以后 iPhoneX , iPad Air, iPad mini2以后 |
幾個必要的常識
- 要想學(xué)好匯編,首先需要了解CPU等硬件結(jié)構(gòu)
- APP/程序的執(zhí)行過程
- 硬件相關(guān)最為重要是CPU/內(nèi)存
- 在匯編中,大部分指令都是和CPU與內(nèi)存相關(guān)的
總線
- 每一個CPU芯片都有許多管腳,這些管腳和總線相連渗磅,CPU通過總線跟外部器件進(jìn)行交互
- 總線:一根根導(dǎo)線的集合
- 總線的分類
- 地址總線
- 數(shù)據(jù)總線
- 控制總線
舉個例子
-
地址總線
- 它的寬度決定了CPU的尋址能力
- 8086的地址總線寬度是20嚷硫,所以尋址能力是1M( 2^20 )
-
數(shù)據(jù)總線
- 它的寬度決定了CPU的單次數(shù)據(jù)傳送量,也就是數(shù)據(jù)傳送速度
- 8086的數(shù)據(jù)總線寬度是16始鱼,所以單次最大傳遞2個字節(jié)的數(shù)據(jù)
-
控制總線
- 它的寬度決定了CPU對其他器件的控制能力仔掸、能有多少種控制
做個小練習(xí)
一個CPU 的尋址能力為8KB,那么它的地址總線的寬度為____
8080,8088,80286,80386 的地址總線寬度分別為16根,20根,24根,32根.那么他們的尋址能力分別為多少____KB, ____MB,____MB,____GB?
8080,8088,8086,80286,80386 的數(shù)據(jù)總線寬度分別為8根,8根,16根,16根,32根.那么它們一次可以傳輸?shù)臄?shù)據(jù)為:____B,____B,____B,____B,____B,
從內(nèi)存中讀取1024字節(jié)的數(shù)據(jù),8086至少要讀____次,80386至少要讀取____次.
1、1KB=210=1024B医清,8KB=210*2^3起暮,所以是13根數(shù)據(jù)總線。
2会烙、16根數(shù)據(jù)總線=210*26=1024B*64=1KB*64=64KB负懦;20根數(shù)據(jù)總線=210*210=1024B*1024B=1024KB=1MB
單位換算
帶寬單位換算①位/比特(bit):內(nèi)存中最小的單位,二進(jìn)制數(shù)序列中的一個0或一個1就是一比比特柏腻, ≈嚼鳌②1 Byte=8bit(位)。 ∥迳③1KB=1024Byte(字節(jié)) 】牌贰④1 MB=1024KB。 ∥衷怠⑤1GB=1024MB躯枢。 ⑥TB孩灯、Tera byte:1TB=1024GB闺金。 1比特 = 一個二進(jìn)制位,只有0和1兩種狀態(tài)1字節(jié) = 8 比特1k字節(jié) = 1024字節(jié)(字節(jié)英文為byte峰档,注意與bit區(qū)分)1M字節(jié)= 1024k字節(jié)bps:位/每秒败匹,通常對于串行總線設(shè)備使用bps為單位,如串口讥巡,USB口掀亩,以太網(wǎng)總線等。 Bps:字節(jié)/每秒欢顷,通常對于并行總線設(shè)備使用Bps為單位槽棍,如并口,IDE硬盤等。 網(wǎng)絡(luò)技術(shù)中的 10M 帶寬指的是以位計算, 就是 10M bit /秒 ,而下載時的速度看到的是 以 字節(jié)(Byte)計算的,所以 10M 帶寬換算成字節(jié) 理論上最快下載速度為: 1.25 M Byte/秒!在計算機(jī)/通訊行業(yè)中,計算數(shù)據(jù)傳送速度也使用十進(jìn)制來衡量炼七。在數(shù)據(jù)存儲容量計算中缆巧,一般采用二進(jìn)制來衡量。1MB=1024K=1024*1024B豌拙。根據(jù)進(jìn)制規(guī)定陕悬,傳送速度可以有兩種表示方法 bps 和 Bps,但是他們是有嚴(yán)格區(qū)別。Bps中的B使用的是二進(jìn)制系統(tǒng)中的Byte字節(jié) ,bps中的b是十進(jìn)制系統(tǒng)中的位元按傅。在我們常說的56K撥號捉超,100M局域網(wǎng)都是bps計量,當(dāng)用于軟件下在時唯绍,下載工具一般又以Bps計算拼岳,所以它們之間有8bit=1Byte的換算關(guān)系。那么56Kbps撥號極限下載速度是56Kbps/8=7KBps况芒,即每秒下載7K字節(jié)惜纸。
答案
內(nèi)存
內(nèi)存地址空間的大小受CPU地址總線寬度的限制。8086的地址總線寬度為20牛柒,可以定位2^20個不同的內(nèi)存單元(內(nèi)存地址范圍0x00000~0xFFFFF)堪簿,所以8086的內(nèi)存空間大小為1MB
0x00000~0x9FFFF:主存儲器∑け冢可讀可寫
0xA0000~0xBFFFF:向顯存中寫入數(shù)據(jù),這些數(shù)據(jù)會被顯卡輸出到顯示器哪审《昶牵可讀可寫
0xC0000~0xFFFFF:存儲各種硬件\系統(tǒng)信息。只讀
進(jìn)制
學(xué)習(xí)進(jìn)制的障礙
很多人學(xué)不好進(jìn)制湿滓,原因是總以十進(jìn)制為依托去考慮其他進(jìn)制滴须,需要運(yùn)算的時候也總是先轉(zhuǎn)換成十進(jìn)制,這種學(xué)習(xí)方法是錯誤的.
我們?yōu)槭裁匆欢ㄒD(zhuǎn)換十進(jìn)制呢叽奥?僅僅是因為我們對十進(jìn)制最熟悉扔水,所以才轉(zhuǎn)換.
每一種進(jìn)制都是完美的,想學(xué)好進(jìn)制首先要忘掉十進(jìn)制,也要忘掉進(jìn)制間的轉(zhuǎn)換朝氓!
進(jìn)制的定義
- 八進(jìn)制由8個符號組成:0 1 2 3 4 5 6 7 逢八進(jìn)一
- 十進(jìn)制由10個符號組成:0 1 2 3 4 5 6 7 8 9逢十進(jìn)一
- N進(jìn)制就是由N個符號組成:逢N進(jìn)一
做個練習(xí)
- 1 + 1 在____情況下等于 3 ?
.
.
.
.
.
.
.
.
.
.
.
.
.
十進(jìn)制由10個符號組成: 0 1 3 2 8 A B E S 7 逢十進(jìn)一
如果這樣定義十進(jìn)制: 1 + 1 = 3!就對了!
這樣的目的何在?
傳統(tǒng)我們定義的十進(jìn)制和自定義的十進(jìn)制不一樣.那么這10個符號如果我們不告訴別人這個符號表,別人是沒辦法拿到我們的具體數(shù)據(jù)的!用于加密!
十進(jìn)制由十個符號組成,逢十進(jìn)一,符號是可以自定義的!!
進(jìn)制的運(yùn)算
做個練習(xí)
- 八進(jìn)制運(yùn)算
- 2 + 3 = __ , 2 * 3 = __ ,4 + 5 = __ ,4 * 5 = __.
- 277 + 333 = __ , 276 * 54 = __ , 237 - 54 = __ , 234 / 4 = __ .
八進(jìn)制加法表
0 1 2 3 4 5 6 7
10 11 12 13 14 15 16 17
20 21 22 23 24 25 26 27
...
1+1 = 2
1+2 = 3 2+2 = 4
1+3 = 4 2+3 = 5 3+3 = 6
1+4 = 5 2+4 = 6 3+4 = 7 4+4 = 10
1+5 = 6 2+5 = 7 3+5 = 10 4+5 = 11 5+5 = 12
1+6 = 7 2+6 = 10 3+6 = 11 4+6 = 12 5+6 = 13 6+6 = 14
1+7 = 10 2+7 = 11 3+7 = 12 4+7 = 13 5+7 = 14 6+7 = 15 7+7 = 16
八進(jìn)制乘法表
0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 20 21 22 23 24 25 26 27...
1*1 = 1
1*2 = 2 2*2 = 4
1*3 = 3 2*3 = 6 3*3 = 11
1*4 = 4 2*4 = 10 3*4 = 14 4*4 = 20
1*5 = 5 2*5 = 12 3*5 = 17 4*5 = 24 5*5 = 31
1*6 = 6 2*6 = 14 3*6 = 22 4*6 = 30 5*6 = 36 6*6 = 44
1*7 = 7 2*7 = 16 3*7 = 25 4*7 = 34 5*7 = 43 6*7 = 52 7*7 = 61
實(shí)戰(zhàn)四則運(yùn)算
277 236 276 234
+ 333 - 54 * 54 / 4
-------- -------- -------- --------
632 162 20250 47
二進(jìn)制的簡寫形式
二進(jìn)制: 1 0 1 1 1 0 1 1 1 1 0 0
三個二進(jìn)制一組: 101 110 111 100
八進(jìn)制: 5 6 7 4
四個二進(jìn)制一組: 1011 1011 1100
十六進(jìn)制: b b c
二進(jìn)制:從0 寫到 1111
0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
這種二進(jìn)制使用起來太麻煩魔市,改成更簡單一點(diǎn)的符號:
0 1 2 3 4 5 6 7 8 9 A B C D E F 這就是十六進(jìn)制了
數(shù)據(jù)的寬度
數(shù)學(xué)上的數(shù)字,是沒有大小限制的赵哲,可以無限的大待德。但在計算機(jī)中,由于受硬件的制約枫夺,數(shù)據(jù)都是有長度限制的(我們稱為數(shù)據(jù)寬度)将宪,超過最多寬度的數(shù)據(jù)會被丟棄。
#import <UIKit/UIKit.h>
#import "AppDelegate.h"
int test(){
int cTemp = 0x1FFFFFFFF;
return cTemp;
}
int main(int argc, char * argv[]) {
printf("%x\n",test());
@autoreleasepool {
return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
}
}
計算機(jī)中常見的數(shù)據(jù)寬度
- 位(Bit): 1個位就是1個二進(jìn)制位.0或者1
- 字節(jié)(Byte): 1個字節(jié)由8個Bit組成(8位).內(nèi)存中的最小單元Byte.
- 字(Word): 1個字由2個字節(jié)組成(16位),這2個字節(jié)分別稱為高字節(jié)和低字節(jié).
- 雙字(Doubleword): 1個雙字由兩個字組成(32位)
那么計算機(jī)存儲數(shù)據(jù)它會分為有符號數(shù)和無符號數(shù).那么關(guān)于這個看圖就理解了!
無符號數(shù),直接換算!
有符號數(shù):
正數(shù): 0 1 2 3 4 5 6 7
負(fù)數(shù): F E D B C A 9 8
-1 -2 -3 -4 -5 -6 -7 -8
自定義進(jìn)制符號
練習(xí)
- 現(xiàn)在有10進(jìn)制數(shù) 10個符號分別是:2,9较坛,1印蔗,7,6丑勤,5喻鳄,4, 8确封,3 , A 逢10進(jìn)1 那么: 123 + 234 = ____
十進(jìn)制: 0 1 2 3 4 5 6 7 8 9
自定義: 2 9 1 7 6 5 4 8 3 A
92 99 91 97 96 95 94 98 93 9A
12 19 11 17 16 15 14 18 13 1A
72 79 71 77 76 75 74 78 73 7A
62 69 61 67 66 65 64 68 63 6A
52 59 51 57 56 55 54 58 53 5A
42 49 41 47 46 45 44 48 43 4A
82 89 81 87 86 85 84 88 83 8A
32 39 31 37 36 35 34 38 33 3A
922
那么剛才通過10進(jìn)制運(yùn)算可以轉(zhuǎn)化10進(jìn)制然后查表!但是如果是其他進(jìn)制.我們就不能轉(zhuǎn)換,要直接學(xué)會查表
- 現(xiàn)在有9進(jìn)制數(shù) 9個符號分別是:2除呵,9,1爪喘,7颜曾,6,5秉剑,4泛豪, 8,3 逢9進(jìn)1 那么: 123 + 234 = ____
十進(jìn)制: 0 1 2 3 4 5 6 7 8
自定義: 2 9 1 7 6 5 4 8 3
92 99 91 97 96 95 94 98 93
12 19 11 17 16 15 14 18 13
72 79 71 77 76 75 74 78 73
62 69 61 67 66 65 64 68 63
52 59 51 57 56 55 54 58 53
42 49 41 47 46 45 44 48 43
82 89 81 87 86 85 84 88 83
32 39 31 37 36 35 34 38 33
922
寄存器
內(nèi)部部件之間由總線連接
- 對程序員來說侦鹏,CPU中最主要部件是寄存器诡曙,可以通過改變寄存器的內(nèi)容來實(shí)現(xiàn)對CPU的控制
- 不同的CPU,寄存器的個數(shù)略水、結(jié)構(gòu)是不相同的
通用寄存器
- ARM64擁有有31個64位的通用寄存器 x0 到 x30,這些寄存器通常用來存放一般性的數(shù)據(jù)价卤,稱為通用寄存器(有時也有特定用途)
- 那么w0 到 w28 這些是32位的. 因為64位CPU可以兼容32位.所以可以只使用64位寄存器的低32位.
- 比如 w0 就是 x0的低32位!
- 通常,CPU會先將內(nèi)存中的數(shù)據(jù)存儲到通用寄存器中渊涝,然后再對通用寄存器中的數(shù)據(jù)進(jìn)行運(yùn)算
- 假設(shè)內(nèi)存中有塊紅色內(nèi)存空間的值是3慎璧,現(xiàn)在想把它的值加1,并將結(jié)果存儲到藍(lán)色內(nèi)存空間
- CPU首先會將紅色內(nèi)存空間的值放到X0寄存器中:mov X0,紅色內(nèi)存空間
- 然后讓X0寄存器與1相加:add X0,1
- 最后將值賦值給內(nèi)存空間:mov 藍(lán)色內(nèi)存空間,X0
pc寄存器(program counter)
- 為指令指針寄存器跨释,它指示了CPU當(dāng)前要讀取指令的地址
- 在內(nèi)存或者磁盤上胸私,指令和數(shù)據(jù)沒有任何區(qū)別,都是二進(jìn)制信息
- CPU在工作的時候把有的信息看做指令鳖谈,有的信息看做數(shù)據(jù)岁疼,為同樣的信息賦予了不同的意義
- 比如 1110 0000 0000 0011 0000 1000 1010 1010
- 可以當(dāng)做數(shù)據(jù) 0xE003008AA
- 也可以當(dāng)做指令 mov x0, x8
- CPU根據(jù)什么將內(nèi)存中的信息看做指令?
- CPU將pc指向的內(nèi)存單元的內(nèi)容看做指令
- 如果內(nèi)存中的某段內(nèi)容曾被CPU執(zhí)行過缆娃,那么它所在的內(nèi)存單元必然被pc指向過
bl指令
CPU從何處執(zhí)行指令是由pc中的內(nèi)容決定的捷绒,我們可以通過改變pc的內(nèi)容來控制CPU執(zhí)行目標(biāo)指令
-
ARM64提供了一個mov指令(傳送指令),可以用來修改大部分寄存器的值龄恋,比如
- mov x0,#10疙驾、mov x1,#20
但是,mov指令不能用于設(shè)置pc的值郭毕,ARM64沒有提供這樣的功能
ARM64提供了另外的指令來修改PC的值它碎,這些指令統(tǒng)稱為轉(zhuǎn)移指令,最簡單的是bl指令
bl指令 -- 練習(xí)
現(xiàn)在有兩段代碼!假設(shè)程序先執(zhí)行A,請寫出指令執(zhí)行順序.最終寄存器x0的值是多少?
_A:
mov x0,#0xa0
mov x1,#0x00
add x1, x0, #0x14
mov x0,x1
bl _B
mov x0,#0x0
ret
_B:
add x0, x0, #0x10
ret
關(guān)于CPU的補(bǔ)充
寄存器
CPU除了有控制器、運(yùn)算器還有寄存器扳肛。其中寄存器的作用就是進(jìn)行數(shù)據(jù)的臨時存儲傻挂。
CPU的運(yùn)算速度是非常快的挖息,為了性能CPU在內(nèi)部開辟一小塊臨時存儲區(qū)域金拒,并在進(jìn)行運(yùn)算時先將數(shù)據(jù)從內(nèi)存復(fù)制到這一小塊臨時存儲區(qū)域中,運(yùn)算時就在這一小快臨時存儲區(qū)域內(nèi)進(jìn)行套腹。我們稱這一小塊臨時存儲區(qū)域為寄存器绪抛。
對于arm64系的CPU來說, 如果寄存器以x開頭則表明的是一個64位的寄存器电禀,如果以w開頭則表明是一個32位的寄存器幢码,在系統(tǒng)中沒有提供16位和8位的寄存器供訪問和使用。其中32位的寄存器是64位寄存器的低32位部分并不是獨(dú)立存在的尖飞。
高速緩存
iPhoneX上搭載的ARM處理器A11它的1級緩存的容量是64KB症副,2級緩存的容量8M.
CPU每執(zhí)行一條指令前都需要從內(nèi)存中將指令讀取到CPU內(nèi)并執(zhí)行。而寄存器的運(yùn)行速度相比內(nèi)存讀寫要快很多,為了性能,CPU還集成了一個高速緩存存儲區(qū)域.當(dāng)程序在運(yùn)行時政基,先將要執(zhí)行的指令代碼以及數(shù)據(jù)復(fù)制到高速緩存中去(由操作系統(tǒng)完成).CPU直接從高速緩存依次讀取指令來執(zhí)行.
寄存器的補(bǔ)充
數(shù)據(jù)地址寄存器
數(shù)據(jù)地址寄存器通常用來做數(shù)據(jù)計算的臨時存儲贞铣、做累加、計數(shù)沮明、地址保存等功能辕坝。定義這些寄存器的作用主要是用于在CPU指令中保存操作數(shù),在CPU中當(dāng)做一些常規(guī)變量來使用珊擂。
ARM64中
- 64位: X0-X30, XZR(零寄存器)
- 32位: W0-W30, WZR(零寄存器)
注意:
之前講解8086匯編中有一種特殊的寄存器段寄存器:CS,DS,SS,ES四個寄存器來保存這些段的基地址,這個屬于Intel架構(gòu)CPU中.在ARM中并沒有
浮點(diǎn)和向量寄存器
因為浮點(diǎn)數(shù)的存儲以及其運(yùn)算的特殊性,CPU中專門提供浮點(diǎn)數(shù)寄存器來處理浮點(diǎn)數(shù)
- 浮點(diǎn)寄存器 64位: D0 - D31 32位: S0 - S31
現(xiàn)在的CPU支持向量運(yùn)算.(向量運(yùn)算在圖形處理相關(guān)的領(lǐng)域用得非常的多)為了支持向量計算系統(tǒng)了也提供了眾多的向量寄存器.
- 向量寄存器 128位:V0-V31