前言
最近準(zhǔn)備學(xué)習(xí)匯編蛹批,然后在B站上看到叫iOS小賢的作者發(fā)的視頻挺不錯(cuò)衙荐,打算跟著學(xué)瓶埋,文章是看視頻的筆記希柿,最后有原視頻鏈接,想看視頻的可以看看通過(guò)鏈接查看視頻养筒。
函數(shù)的參數(shù)和返回值
- ARM64下曾撤,函數(shù)的參數(shù)通常情況下是存放在X0到X7(W0到W7)這8個(gè)寄存器里面的。如果超過(guò)8個(gè)參數(shù)晕粪,就會(huì)入棧挤悉。
- 編譯器決定的函數(shù)的返回值通常都是放在x0中,之所以是通常是因?yàn)楸热绶祷刂凳且粋€(gè)結(jié)構(gòu)體巫湘,x0只能放64位即8個(gè)字節(jié)装悲,這個(gè)時(shí)候放不下。
我們新寫(xiě)一個(gè)sum方法尚氛,然后打斷點(diǎn)
mov w0, #0xa
mov w1, #0x14
這兩句是把#0xa(10)诀诊,#0x14(放入)w0(x0的低32位)和w1(x1的低32位)中。接下來(lái)bl 0x10273a94c
就進(jìn)入sum函數(shù)阅嘶。
sub sp, sp, #0x10
拉伸検舭辏空間#0x10(16位)。
str w0, [sp, #0xc]
str w1, [sp, #0x8]
w0和w1的值放入了椦度幔空間抡蛙,位置是sp偏移#0xc,sp偏移#0x8魂迄。
ldr w0, [sp, #0xc]
ldr w1, [sp, #0x8]
把棿纸兀空間的值讀出來(lái)放入寄存器w0,w1捣炬〈雀瘢看起來(lái)有點(diǎn)滑稽,但是在打包的時(shí)候編譯器會(huì)做優(yōu)化遥金。
add w0, w0, w1
w0和w1的值相加然后放入w0浴捆。
add sp, sp, #0x10
ret
棧平衡并且return。
用匯編手寫(xiě)求和函數(shù)
在函數(shù)內(nèi)部沒(méi)有調(diào)用其他函數(shù)的函數(shù)叫做葉子函數(shù)稿械。
葉子函數(shù)沒(méi)有必要開(kāi)辟椦⌒海空間,不移動(dòng)sp的位置,直接通過(guò)sp的偏移页眯,放入sp開(kāi)始的低地址的區(qū)域中梯捕,因?yàn)榻酉聛?lái)不會(huì)調(diào)用別的函數(shù),就不會(huì)有其他函數(shù)干擾窝撵,所以沒(méi)問(wèn)題傀顾。而且調(diào)用完畢之后這塊區(qū)域也不需要了,別的函數(shù)在用的時(shí)候碌奉,sp往低地址移動(dòng)短曾,開(kāi)辟新的棧空間棿土樱空間會(huì)先寫(xiě)再讀嫉拐,所以不會(huì)有影響。
這樣我們可以寫(xiě)出精簡(jiǎn)版的sum函數(shù)的匯編代碼
.text
.global _suma
_suma:
add x0, x0 , x1
ret
我們看到輸出了正確結(jié)果30魁兼。
有人可能會(huì)問(wèn)為何結(jié)果放入x0中婉徘,這是由編譯器的,我們?cè)囋嚳捶湃離1會(huì)怎樣咐汞,結(jié)果輸出了10盖呼。這是因?yàn)榘呀Y(jié)果放入x1,而x0仍然第一個(gè)參數(shù)是10化撕。
函數(shù)參數(shù)超過(guò)8個(gè)
sub sp, sp, #0x30
sp向低地址拉伸16*3=48個(gè)字節(jié)塌计,如下圖
stp x29, x30, [sp, #0x20]
sp偏移#0x20即向高地址出偏移2*16=32個(gè)字節(jié),然后寫(xiě)入x29和x30侯谁,前面講過(guò)讀寫(xiě)是往高地址锌仅,于是之后的內(nèi)存布局如下圖:
add x29, sp, #0x20
sp加#0x20其實(shí)和上面[sp, #0x20]一樣,然后賦值給x29墙贱。
stur wzr, [x29, #-0x4]
stur w0, [x29, #-0x8]
str x1, [sp, #0x10]
執(zhí)行這幾個(gè)命令之后內(nèi)存圖如下:
orr w0, wzr, #0x1
orr w1, wzr, #0x2
orr w2, wzr, #0x3
orr w3, wzr, #0x4
mov w4, #0x5
orr w5, wzr, #0x6
orr w6, wzr, #0x7
orr w7, wzr, #0x8
mov w8, #0x9
orr是或得意思热芹,前面講過(guò)ARM64中
- 64位: X0-X30, XZR(零寄存器)
- 32位: W0-W30, WZR(零寄存器)
所以是#0x1和0進(jìn)行或運(yùn)算,然后賦值給w0惨撇,相當(dāng)于mov w0, #0x1
伊脓。
w8, [sp]
因?yàn)楹瘮?shù)的參數(shù)通常情況下是存放在X0到X7(W0到W7)這8個(gè)寄存器里面的,所以w8不能參數(shù)魁衙,于是直接把w8放入棧中报腔,也就是#0x9,就是參數(shù)9剖淀。
在調(diào)用sum函數(shù)
bl 0x1050028bc ; sum1 at main.m:16
之前纯蛾,對(duì)棧的操作就是這么個(gè)過(guò)程。總結(jié):
- 就是拉伸了椬莞簦空間
- 然后往棧中保護(hù)了兩個(gè)寄存器x29翻诉,x30
- 接下來(lái)保護(hù)w0和x1寄存器
- 然后把參數(shù)放入w1到w7
- 最后多出來(lái)參數(shù)放入椗谝蹋空間
然后進(jìn)入sum函數(shù)
sub sp, sp, #0x30
又是拉伸棧空間碰煌,拉升了#0x30舒岸。
ldr w8, [sp, #0x30]
[sp, #0x30]是sp加上#0x30,就是剛剛sp的位置芦圾,然后向高地址處讀取值放入w8中蛾派,就是剛剛放的參數(shù),這里讀出放入棧中的參數(shù)个少。
str w0, [sp, #0x2c]
str w1, [sp, #0x28]
str w2, [sp, #0x24]
str w3, [sp, #0x20]
str w4, [sp, #0x1c]
str w5, [sp, #0x18]
str w6, [sp, #0x14]
str w7, [sp, #0x10]
把w0到w7里的參數(shù)入棧洪乍。
ldr w0, [sp, #0x2c]
ldr w1, [sp, #0x28]
add w0, w0, w1
從棧中取出來(lái),兩兩相加稍算。
ldr w1, [sp, #0x24]
add w0, w0, w1
ldr w1, [sp, #0x20]
add w0, w0, w1
ldr w1, [sp, #0x1c]
add w0, w0, w1
ldr w1, [sp, #0x18]
add w0, w0, w1
ldr w1, [sp, #0x14]
add w0, w0, w1
ldr w1, [sp, #0x10]
add w0, w0, w1
ldr w1, [sp, #0x30]
add w0, w0, w1