編譯是將高可讀性的源代碼轉(zhuǎn)為匯編語(yǔ)言饺蚊,再進(jìn)一步轉(zhuǎn)換為二進(jìn)制文件(obj)的過(guò)程亭姥。
當(dāng)引用 lib文件(靜態(tài)鏈接庫(kù))時(shí)即纲,會(huì)將其嵌入到生成的obj文件中,但dll文件(動(dòng)態(tài)鏈接庫(kù))不會(huì)谭网,它只在exe運(yùn)行時(shí)載入汪厨。
1. 編譯技巧
在代碼編寫時(shí),我們可以使用一些tricky的方法來(lái)騙過(guò)編譯器愉择,從而實(shí)現(xiàn)某些特殊要求
struct Car; //聲明Car劫乱,但未定義
Car* createCar(){ return null; }
int main() {
Car* p = createCar();
}
上面這段代碼沒(méi)有定義Car,但依然可以跑锥涕,因?yàn)榫幾g器在編譯時(shí)知道指針p的大小為4個(gè)byte衷戈。
一般而言,任何類型的指針大小都是4個(gè)byte层坠。
但如果不使用指針殖妇,編譯器就會(huì)報(bào)錯(cuò),比如下面的代碼破花。
int main() {
Car p = Car();
}
編譯器編譯時(shí)不知道Car這個(gè)類的大小谦趣,因?yàn)樗挥新暶鳑](méi)有定義,所以會(huì)報(bào)錯(cuò)旧乞。
有時(shí)候我們會(huì)出現(xiàn)讓兩個(gè)類A, B互相包含的情況蔚润,這時(shí)候也需要用指針磅氨。
class A {
B b;
}
class B {
A a;
}
這樣的定義會(huì)報(bào)錯(cuò)尺栖,但是如果換成
class A {
B* b;
}
class B {
A* a;
}
就可以正常運(yùn)行了。
由于C++中每個(gè)cpp文件都會(huì)單獨(dú)編譯為obj烦租,每個(gè)頭文件都會(huì)查找所有相關(guān)頭文件延赌,嵌入再進(jìn)行編譯除盏,很耗時(shí)間。當(dāng)工程量很大時(shí)挫以,編譯時(shí)間好幾個(gè)小時(shí)是很正常的情況者蠕。
減少編譯時(shí)間的方法可以參考這個(gè)鏈接
2. 函數(shù)傳參
C++函數(shù)都運(yùn)行在內(nèi)存中的某一塊特定區(qū)域,叫做棧掐松。
當(dāng)我們調(diào)用Foo(5,7)這么一個(gè)函數(shù)時(shí)踱侣,它的匯編指令大概如下:
push 7
push 5
jmp Foo
上級(jí)函數(shù)先把兩個(gè)參數(shù)7和5 push到棧里(壓棧),然后跳轉(zhuǎn)到Foo函數(shù)的Body地址開(kāi)始執(zhí)行Foo函數(shù)大磺。
這里有兩個(gè)要注意的點(diǎn)
1).先push 7抡句,后push 5
函數(shù)壓棧時(shí),參數(shù)是按照從右向左的順序壓棧杠愧。(這取決于編譯器的約定 Calling Convention待榔,也有的是從左向右壓,但目前幾乎所有約定都是從右向左壓)
(PS:拓展)
在if(condition)中流济,多個(gè)condition的判斷也是從后向前判斷锐锣,這樣就會(huì)有一些很有深意的寫法。
比如如下的代碼:
Car* p = createCar();
if(p.speed==100 && p!=null) { }
由于無(wú)法確認(rèn)p是否是空指針绳瘟,所以如果直接if(p.speed==100)
可能會(huì)崩雕憔,因?yàn)閜為空時(shí)不存在speed變量。
正常的寫法是
if(p!=null){
if(p.speed==100){ }
}
先確認(rèn)p存在糖声,再取它的變量橘茉,但這樣就會(huì)多寫一些代碼,沒(méi)有第一種同時(shí)判斷那么簡(jiǎn)潔姨丈。
但我不推薦使用第一種的寫法
第二種雖然多了點(diǎn)代碼量畅卓,但更加易讀易懂易維護(hù)。tricky的寫法雖然效率高蟋恬,但可讀性經(jīng)常會(huì)比效率更加重要翁潘。
2).Calling Convention
當(dāng)Foo函數(shù)執(zhí)行完成時(shí),誰(shuí)來(lái)銷毀它的椉哒空間拜马?
(1)Foo函數(shù)自己
(2)Foo的上級(jí)函數(shù)
兩種答案都對(duì),這就是Calling Convention沐绒。有些語(yǔ)言編譯器會(huì)采用方法1俩莽,有些語(yǔ)言編譯器會(huì)采用方法2。
由Caller(上級(jí)函數(shù))來(lái)銷毀空間的方法稱為__cdecl乔遮,這也是C++的默認(rèn)約定扮超,參數(shù)壓棧從右向左。
由Callee(函數(shù)自身)來(lái)銷毀空間的方法有多種,大同小異出刷,一般是__stdcall璧疗,參數(shù)也是從右向左壓棧。
這兩種方法有區(qū)別嗎馁龟?為什么C++用__cdecl崩侠?
當(dāng)由上級(jí)調(diào)用者銷毀時(shí),由于上級(jí)函數(shù)會(huì)先push參數(shù)坷檩,所以它知道到底push了幾個(gè)參數(shù)却音。但如果交給函數(shù)自己銷毀,它是不知道父函數(shù)push了幾個(gè)參數(shù)給自己的矢炼。
所以C++可以出現(xiàn) printf() 這種可變參數(shù)數(shù)量的神奇函數(shù)僧家,而Windows API必須顯式傳入va_list參數(shù)(如FormatMessage)來(lái)獲得變參能力。
3. 虛函數(shù)
虛函數(shù)是和類繼承相輔相成的裸删,父類里定義了虛函數(shù)八拱,在每個(gè)子類里要對(duì)應(yīng)著實(shí)現(xiàn)其body。
class Shape{
virtual void draw();
}
class triangle : Shape
class rect : Shape
=============
Shape* shapes[100];
foreach s in shapes {
s->draw();//在匯編中是 jmp 0x12345678這種涯塔,跳到draw的地址肌稻。
}
在上面的代碼中,怎么確定s->draw()是triangle的draw()匕荸,還是rect的draw()爹谭?
即如何確定 jmp 跳躍的地址?
在C++中榛搔,存在一個(gè)Virtual Table(虛表 V-table)的東西诺凡,它用來(lái)存放一個(gè)類的所有虛函數(shù)地址。
當(dāng)我們定義了Shape類的時(shí)候践惑,如下
class Shape{
double x;
double y;
virtual void draw();
virtual void move();
}
在Shape中腹泌,首地址4個(gè)字節(jié)不是x,也不是y尔觉,而是一個(gè)指向Shape的V-table的指針凉袱,通過(guò)該指針可以找到Shape的虛函數(shù)表,在它的虛函數(shù)表里侦铜,存放了draw()和move()兩個(gè)函數(shù)的body的地址专甩,可以通過(guò)這個(gè)地址去找到他們的實(shí)現(xiàn)。
虛函數(shù)名 | 地址 |
---|---|
draw | 0x12345678 |
move | 0x87654321 |
在虛表中钉稍,是通過(guò) offset 來(lái)確定是哪一個(gè)虛函數(shù)的涤躲,在上例中,draw()的offset是0贡未,move()的offset是4种樱。
在所有繼承自Shape的類中蒙袍,比如triangle和rect,他們的虛表也是一模一樣的缸托,只是虛表地址不一樣左敌。他們的虛表中也是draw()的offset是0瘾蛋,move()的offset是4俐镐。
所以,如何判斷兩個(gè)自定義類變量是同一個(gè)類型哺哼?
答:取出它們倆的首4個(gè)字節(jié)佩抹,即虛表地址,如果虛表地址相同取董,則是同一個(gè)類型棍苹。
關(guān)于純虛函數(shù) virtual void funtion1()=0
有沒(méi)有虛表的問(wèn)題,有人說(shuō)有茵汰,有人說(shuō)沒(méi)有枢里, 我個(gè)人覺(jué)得有沒(méi)有不影響,畢竟就算有了虛表蹂午,它的每個(gè)虛函數(shù)也是沒(méi)有body的栏豺。