棧
- 棧:是一種具有特殊的訪問方式的存儲(chǔ)空間(后進(jìn)先出碍侦, Last In Out Firt粱坤,LIFO)
SP和FP寄存器
- sp寄存器在任意時(shí)刻會(huì)保存我們棧頂?shù)牡刂?
- fp寄存器也稱為x29寄存器屬于通用寄存器,但是在某些時(shí)刻我們利用它保存棧底的地址!()
注意:ARM64開始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
ARM64里面對(duì)棧(sp)的操作(必須)是16字節(jié)對(duì)齊的! !
(否則即會(huì)崩潰,如:add sp,0x6)
sp 寄存器指向哪里瓷产,哪里就是棧站玄,通過 sp 偏移來 讀取/存 數(shù)據(jù)。
關(guān)于內(nèi)存讀寫指令
注意:讀/寫 數(shù)據(jù)是都是往高地址讀/寫濒旦。
(椫昕酰空間的開辟,設(shè)計(jì)其實(shí)是從上往下走的,從高到低)
操作系統(tǒng)設(shè)計(jì)的時(shí)候锉矢,怎么把內(nèi)存的堆棧分開呢?
所以做了一個(gè)約定齿尽,從上往下為棧沽损,從下往上為堆。這樣就能更加合理的利用內(nèi)存空間循头,為彈性的空間绵估。(Stack Overflow 堆棧溢出)
str(store register)指令
將數(shù)據(jù)從寄存器中讀出來,存到內(nèi)存中.
ldr(load register)指令
將數(shù)據(jù)從內(nèi)存中讀出來,存到寄存器中
此ldr 和 str 的變種ldp 和 stp 還可以操作2個(gè)寄存器.
堆棧操作練習(xí)
使用32個(gè)字節(jié)空間作為這段程序的椏睿空間,然后利用棧將x0和x1的值進(jìn)行交換.
sub sp, sp, #0x20 ;拉伸椆眩空間32個(gè)字節(jié)
stp x0, x1, [sp, #0x10] ;sp往上加16個(gè)字節(jié),存放x0 和 x1
ldp x1, x0, [sp, #0x10] ;將sp偏移16個(gè)字節(jié)的值取出來,放入x1 和 x0
( [sp,#0x10] 代表左邊的 sp 加上右邊的 0x10,若是減的話就是[sp,#-0x10])
register write x0 0xffffffff
register write x1 0xffffffff
修改 xo 和 x1 寄存器的值
讀取完畢以后:
add sp, sp, #0x20
復(fù)位保持棧的平衡,防止椚纾空間的浪費(fèi)缝左,或者溢出。
bl和ret指令
bl標(biāo)號(hào)
- 將下一條指令的地址放入lr(x30)寄存器
(用于返回繼續(xù)執(zhí)行)
- 轉(zhuǎn)到標(biāo)號(hào)處執(zhí)行指令
# + 數(shù)字:立即數(shù)浓若,代表一個(gè)常數(shù)渺杉。
bl 與 8086 匯編中的 jump 類似。
.s 代表匯編文件
.text 代碼段
.gloal 定義全局變量挪钓。
64 位的寄存器 8 個(gè)字節(jié)
.text
.global _A,_B
_A:
mov x0,#0xaaaaaaaa
bl _B
mov x0,#0xcccccc
ret
_B:
mov x0,#0xbbbb
ret
(在進(jìn)入 A 函數(shù)之前少办,lr 保存了下一步執(zhí)行的地址,bl _B 之后诵原,lr 則保存為下一條指令的地址,覆蓋掉之前保存的值挽放,進(jìn)入 B 函數(shù)執(zhí)行完绍赛,再次跳回 A 函數(shù),陷入死循環(huán)辑畦。)
每一個(gè)函數(shù)都會(huì)開辟一個(gè)椔鸢觯空間
指令優(yōu)化
stp x29, x30 ,[sp, #-0x10]!
加 “!” 的作用相當(dāng)于:
sub sp, sp,#0x10; stp x29, x30, 【sp】
將 sp -10 賦值給 sp;
在 ARM 64 匯編中纯出,x29 沒有什么作用蚯妇,x30 保存返回的地址。
stp x29, x30 ,[sp, #-0x10]! // 將 x29, x30 寄存器中的值放到棧里面
mov x29, sp
bl 0x2345463 // 函數(shù)調(diào)用
ldp x29, x30, [sp], #10 // 完畢以后暂筝,在從棧里面讀出來放到 x29, x30 中箩言,保護(hù)x29 , x30 這兩個(gè)寄存器(現(xiàn)場(chǎng)保護(hù))
ret
str/ldr 操作一個(gè)寄存器,stp/ ldp 管理兩個(gè)寄存器
優(yōu)化后的代碼:
.text
.global _A,_B
_A:
mov x0,#0xaaaaaaaa
str x30,[sp,#-0x10]!
bl _B
mov x0,#0xcccccc
ldr x30,[sp],#0x10 // 相當(dāng)于: ldr x30, [sp]; add sp, sp, #0x10;
ret
_B:
mov x0,#0xbbbb
ret
ret
- 默認(rèn)使用lr(x30)寄存器的值,通過底層指令提示CPU此處作為下條指令地址!
就是跳轉(zhuǎn)到 x30 寄存器所保存的地址
ARM64平臺(tái)的特色指令,它面向硬件做了優(yōu)化處理的
x30寄存器
x30寄存器存放的是函數(shù)的返回地址.當(dāng)ret指令執(zhí)行時(shí)刻,會(huì)尋找x30寄存器保存的地址值!
注意:在函數(shù)嵌套調(diào)用的時(shí)候.需要講x30入棧!
函數(shù)的參數(shù)和返回值
ARM64下,函數(shù)的參數(shù)(通常)是存放在X0到X7(W0到W7)這8個(gè)寄存器里面的.如果超過8個(gè)參數(shù),就會(huì)入棧.
int sum2(int a, int b, int c, int d, int e, int f, int g, int h, int i) {
return a+b+c+d+e+f+g+h+I;
}
sum2(1,2,3,4,5,6,7,8,9);
001-函數(shù)的參數(shù)和返回值`main:
0x10486a8d0 <+0>: sub sp, sp, #0x30 ; =0x30
0x10486a8d4 <+4>: stp x29, x30, [sp, #0x20]
0x10486a8d8 <+8>: add x29, sp, #0x20 ; =0x20
0x10486a8dc <+12>: orr w8, wzr, #0x1
0x10486a8e0 <+16>: orr w9, wzr, #0x2
0x10486a8e4 <+20>: orr w2, wzr, #0x3
0x10486a8e8 <+24>: orr w3, wzr, #0x4
0x10486a8ec <+28>: mov w4, #0x5
0x10486a8f0 <+32>: orr w5, wzr, #0x6
0x10486a8f4 <+36>: orr w6, wzr, #0x7
0x10486a8f8 <+40>: orr w7, wzr, #0x8
0x10486a8fc <+44>: mov w10, #0x9
0x10486a900 <+48>: stur w0, [x29, #-0x4]
0x10486a904 <+52>: str x1, [sp, #0x10]
-> 0x10486a908 <+56>: mov x0, x8
0x10486a90c <+60>: mov x1, x9
0x10486a910 <+64>: str w10, [sp]
0x10486a914 <+68>: bl 0x10486a858 ; sum2 at main.m:16
0x10486a918 <+72>: mov w8, #0x0
0x10486a91c <+76>: str w0, [sp, #0xc]
0x10486a920 <+80>: mov x0, x8
0x10486a924 <+84>: ldp x29, x30, [sp, #0x20]
0x10486a928 <+88>: add sp, sp, #0x30 ; =0x30
0x10486a92c <+92>: ret
注:匯編代碼開始一定都是x29 ,x30 都入棧焕襟,為了保護(hù)函數(shù)的返回地址陨收。
stur
是一個(gè)無符號(hào)的變種指令,可以把它當(dāng)做 str .
stur w0, [x29, #-0x4] —— 減的時(shí)候?yàn)?stur
str x1, [sp, #0x10] —— 加的時(shí)候?yàn)?str.
【sp】
【】代表把 sp 的值取出來,當(dāng)做一個(gè)內(nèi)存地址务漩,相當(dāng)于取地址拄衰,代表 sp 指針?biāo)赶虻膮^(qū)域。
拉伸空間是往低地址拉伸饵骨,讀寫是往高地址翘悉。
函數(shù)的返回值(通常)是放在X0 寄存器里面的,.這是編譯器決定的居触,如果返回結(jié)構(gòu)體即放不下了妖混,不能以 x0 作為返回值了
0x1009e28d8 <+0>: sub sp, sp, #0x10 ; =0x10 // sp 減 16 字節(jié),向低地址
0x1009e28dc <+4>: str w0, [sp, #0xc] // 內(nèi)部數(shù)據(jù)可以隨意放
0x1009e28e0 <+8>: str w1, [sp, #0x8]
-> 0x1009e28e4 <+12>: ldr w0, [sp, #0xc]
0x1009e28e8 <+16>: ldr w1, [sp, #0x8]
0x1009e28ec <+20>: add w0, w0, w1 // 兩個(gè)參數(shù)相加放入w0, 即為返回值
0x1009e28f0 <+24>: add sp, sp, #0x10 ; =0x10 // sp 加 16 字節(jié)饼煞,向高地址
0x1009e28f4 <+28>: ret
sum (10, 20);
簡化版
替代上面的匯編代碼
add x0, x0, x1
ret
注:如果一個(gè)函數(shù)內(nèi)部不再調(diào)用其它的函數(shù)源葫,我們稱之為 葉子函數(shù)
。
我們知道了 x0---x7 是存放參數(shù)的砖瞧, OC 方法的調(diào)用息堂,
[self viewDidLoad] ;
即為 msgSend(self, @selector(viewDidLoad));
那么 x0 即為 self ,x1 即為調(diào)用的方法地址。
函數(shù)的局部變量
函數(shù)的局部變量放在棧里面!
int sum(int a, int b) {
return a + b;
}
或
int sum(int a, int b) {
int c = 10;
int d = 11;
return a+b+c+d+;
}
棧拉伸空間時(shí)块促,至少拉伸 16 個(gè)字節(jié)荣堰,即 0x10 最低。
上面的函數(shù)竭翠,就只拉伸一個(gè)字節(jié)振坚。
sub sp, sp, #0x10 ; =0x10
如果為:
int sum(int a, int b) {
int c = 10;
int d = 11;
int e = 12;
return a+b+c+d+e;
}
則拉伸兩個(gè)字節(jié)
如果內(nèi)部調(diào)用函數(shù),即函數(shù)嵌套調(diào)用斋扰,則會(huì)拉伸0x30渡八,保存 x29, x30 寄存器,16個(gè)字節(jié)传货。
int sum(int a, int b) {
int c = 10;
int d = 11;
printf("%d",d);
return a+b+c+d;
}
adrp : 基地址 + 偏移地址 獲取一個(gè)全局變量屎鳍。
函數(shù)嵌套調(diào)用2
int func(int a, int b) {
int c = sum(10, 11);
int e = sum(12, 13);
return c+e;
}
或
int func(int a, int b) {
int c = sum(a, b);
int e = sum(a, b);
return e;
}