引言
虛表是 C++ 中一個十分重要的概念烹困,面向?qū)ο缶幊痰亩鄳B(tài)性在 C++ 中的實(shí)現(xiàn)全靠虛表來實(shí)現(xiàn)晶渠。在聊虛表之前我們先回顧一下什么事多態(tài)性。
多態(tài)實(shí)際上就是讓一個父類指針曲伊,通過賦予子類對象的地址叽讳,可以呈現(xiàn)出多種形態(tài)和功能。如果這么說比較抽象的話坟募,我們看一個例子就明白了:
class Base {
int m_tag;
public:
Base(int tag) : m_tag(tag) {}
void print() {
cout << "Base::print() called" << endl;
}
virtual void vPrint() {
cout << "Base::vPrint() called" << endl;
}
virtual void printTag() {
cout << "Base::m_tag of this instance is: " << m_tag << endl;
}
};
class Derived : public Base {
public:
Derived(int tag) : Base(tag) {}
void print() {
cout << "Derived1::print() called" << endl;
}
virtual void vPrint() {
cout << "Derived::vPrint() called" << endl;
}
};
在上面的代碼中岛蚤,我們聲明了一個父類 Base
,和它的一個派生類 Derived
懈糯,其中 print()
實(shí)例方法是非虛函數(shù)涤妒,而其余兩個實(shí)例方法被聲明為了虛函數(shù)。并且在子類中我們重新了 print()
和 vPrint()
赚哗。下面我們構(gòu)造出一個 Derived
實(shí)例她紫,并分別將其地址賦給 Base
指針和 Derived
指針:
int main(int argc, char *argv[]) {
Derived *foo = new Derived(1);
Base *bar = foo;
foo->print();
foo->vPrint();
bar->print();
bar->vPrint();
return 0;
}
我們看看程序運(yùn)行的結(jié)果:
Derived1::print() called
Derived::vPrint() called
Base::print() called
Derived::vPrint() called
可以看到,對于 Derived
指針的操作正如它應(yīng)該表現(xiàn)的樣子屿储,然而當(dāng)我們把相同對象的地址賦給 Base
指針時贿讹,可以發(fā)現(xiàn)它的非虛函數(shù)竟然表現(xiàn)出了父類的行為,并沒有被重寫的樣子够掠。
這是什么原因呢民褂?
C++ 類的實(shí)質(zhì)是什么
首先我們要明白 C++ 中類的實(shí)質(zhì)到底是什么。實(shí)際上疯潭,類在 C++ 中就是 struct (結(jié)構(gòu)體)的一種擴(kuò)展赊堪,允許了更高級的繼承和虛函數(shù)。那么也就是說竖哩,結(jié)構(gòu)體缺少的實(shí)際上就是虛函數(shù)哭廉。
對于一般的成員變量,它和結(jié)構(gòu)體在內(nèi)存布局上是完全一樣的期丰,不管是順序還是內(nèi)存對齊群叶,完全一致吃挑。而一個類的方法地址并不會存儲在一個實(shí)例的內(nèi)存中。對于非虛函數(shù)街立,它們在內(nèi)存中的地址是唯一的舶衬,你可以把它想象成普通函數(shù),只不過第一個參數(shù)是 this
指針赎离,在通過類對象指針調(diào)用時逛犹,編譯器會根據(jù)類型找到相應(yīng)非虛函數(shù)的地址,這個工作是編譯時完成的梁剔。
也就是說虽画,什么指針指向什么函數(shù)這是固定的,反正指針如果是 Base *
荣病,那我就直接執(zhí)行 Base::print()
函數(shù)码撰。
揭開 vTable 的神秘面紗
既然非虛函數(shù)實(shí)現(xiàn)這么簡單,那虛函數(shù)是不是會很復(fù)雜个盆?其實(shí)并不是那么復(fù)雜脖岛。虛函數(shù)的地址被存儲一張叫做虛表的東西里,我們其實(shí)很容易拿到這個虛表颊亮。下面我們通過 dump memory 的方式來揪出一個類的虛表:
看到我選中的那個字節(jié)柴梆,那是我們的一個實(shí)例變量,在這個實(shí)例變量的前面有 8 個字節(jié)的內(nèi)容终惑,那實(shí)際就是虛表的地址了绍在,我們嘗試將這個地址所指向的內(nèi)容拿出來:
這就是虛表的內(nèi)容了,什么雹有?你不信偿渡,下面我就把虛表中第一個函數(shù)揪出來執(zhí)行一下:
可以看到,Derived
類中重寫的 vPrint()
方法已經(jīng)被執(zhí)行件舵。這就說明虛函數(shù)在執(zhí)行時是一個動態(tài)的過程卸察,并不是在編譯時就確定下來要執(zhí)行哪一個函數(shù),而是運(yùn)行時從虛表查到真正要執(zhí)行的函數(shù)的地址铅祸,然后再將 this
指針傳入執(zhí)行坑质。
到這里,我們已經(jīng)大致了解了虛函數(shù)是怎樣工作的了临梗。下面我們看看 Base
類和 Derived
類的虛表有什么區(qū)別涡扼。我修改了源碼,實(shí)例化了一個 Base
類對象 baz
盟庞,然后分別 dump 出 Base
類和 Derived
類的內(nèi)存:
可以看出吃沪,兩個對象的虛表指針是不同的。然后我們看看這兩者虛表有什么不同:
這兩張?zhí)摫淼牡谝粋€函數(shù)不同什猖,因?yàn)?Derived
類重寫了 vPrint()
方法票彪,所以 Derived
的虛表第一個函數(shù)指針會有不同红淡,而 printTag()
我并沒有重寫,所以兩張表指向一個同一個函數(shù)降铸。
所以每個類都會維護(hù)一張?zhí)摫碓诤担幾g時,編譯器根據(jù)類的聲明創(chuàng)建出虛表推掸,當(dāng)對象被構(gòu)造時桶蝎,虛表的地址就會被寫入這個對象內(nèi)存的起始位置。這就是多態(tài)性在 C++ 中實(shí)現(xiàn)的方式谅畅,而像 Java登渣、OC 這樣的語言由于 Runtime 的存在,這些對象會有多余的內(nèi)存空間記錄類的信息(meta-object)毡泻,在運(yùn)行時根據(jù)這些信息解析出相應(yīng)的函數(shù)去執(zhí)行胜茧。雖然不同,但是異曲同工牙捉。
理解虛函數(shù)表有什么作用呢竹揍?
- 能讓你更好地理解 C++
- 一些 hook 技術(shù)就是利用虛表來實(shí)現(xiàn)的
Wrap Up
這篇文章就簡單地講了一下多態(tài)和虛函數(shù)在 C++ 中的實(shí)現(xiàn),我們說 C++ 非常 magical 就是因?yàn)樗苡米詈唵蔚姆绞饺?shí)現(xiàn)各種面向?qū)ο缶幊痰奶匦孕安种档梦覀兘K身學(xué)習(xí)。