想必很多人都聽說過虛函數(shù)開銷大亏娜,貌似很多答案都說是因?yàn)樘摵瘮?shù)表導(dǎo)致的那一次間接調(diào)用,真的如此嗎蹬挺?
直接看下面這兩段代碼:
#include <cmath>
執(zhí)行時(shí)間:12.895s
#include <cmath>
執(zhí)行時(shí)間:12.706s
這兩段代碼的執(zhí)行時(shí)間幾乎沒有區(qū)別维贺,可見虛函數(shù)表導(dǎo)致的那一次函數(shù)間接調(diào)用并不浪費(fèi)時(shí)間,所以虛函數(shù)的開銷并不在重定向上巴帮,這一次重定向基本上不影響程序性能溯泣。
那它的開銷究竟在哪里呢?看下面兩段代碼榕茧,這兩段代碼和上面相比只改動(dòng)了一行:
#include <cmath>
執(zhí)行時(shí)間:436ms
#include <cmath>
執(zhí)行時(shí)間154ms
這里看到垃沦,僅僅改變了一行代碼,虛函數(shù)調(diào)用就比普通函數(shù)慢了幾倍雪猪,為什么栏尚?
虛函數(shù)其實(shí)最主要的性能開銷在于它阻礙了編譯器內(nèi)聯(lián)函數(shù)和各種函數(shù)級(jí)別的優(yōu)化,導(dǎo)致性能開銷較大,在普通函數(shù)中l(wèi)og(10)會(huì)被優(yōu)化掉译仗,它就只會(huì)被計(jì)算一次抬虽,而如果使用虛函數(shù),log(10)不會(huì)被編譯器優(yōu)化纵菌,它就會(huì)被計(jì)算多次阐污。如果代碼中使用了更多的虛函數(shù),編譯器能優(yōu)化的代碼就越少咱圆,性能就越低笛辟。
虛函數(shù)通常通過虛函數(shù)表來實(shí)現(xiàn),在虛表中存儲(chǔ)函數(shù)指針序苏,實(shí)際調(diào)用時(shí)需要間接訪問手幢,這需要多一點(diǎn)時(shí)間。
然而這并不是虛函數(shù)速度慢的主要原因忱详,真正原因是編譯器在編譯時(shí)通常并不知道它將要調(diào)用哪個(gè)函數(shù)围来,所以它不能被內(nèi)聯(lián)優(yōu)化和其它很多優(yōu)化,因此就會(huì)增加很多無意義的指令(準(zhǔn)備寄存器匈睁、調(diào)用函數(shù)监透、保存狀態(tài)等),而且如果虛函數(shù)有很多實(shí)現(xiàn)方法航唆,那分支預(yù)測(cè)的成功率也會(huì)降低很多胀蛮,分支預(yù)測(cè)錯(cuò)誤也會(huì)導(dǎo)致程序性能下降。
如果你想要寫出高性能代碼并頻繁的調(diào)用虛函數(shù)糯钙,注意如果用其它的方式(例如if-else粪狼、switch、函數(shù)指針等)來替換虛函數(shù)調(diào)用并不能根本解決問題超营,它還有可能會(huì)更慢鸳玩,真正的問題不是虛函數(shù)阅虫,而是那些不必要的間接調(diào)用演闭。
正常的函數(shù)調(diào)用:
復(fù)制棧上的一些寄存器,以允許被調(diào)用的函數(shù)使用這些寄存器颓帝;
將參數(shù)復(fù)制到預(yù)定義的位置米碰,這樣被調(diào)用的函數(shù)可以找到對(duì)應(yīng)參數(shù);
入棧返回地址购城;
跳轉(zhuǎn)到函數(shù)的代碼吕座,這是一個(gè)編譯時(shí)地址,因?yàn)榫幾g器/鏈接器硬編碼為二進(jìn)制瘪板;
從預(yù)定義的位置獲取返回值吴趴,并恢復(fù)想要使用的寄存器。
而虛函數(shù)調(diào)用與此完全相同侮攀,唯一的區(qū)別就是編譯時(shí)不知道函數(shù)的地址锣枝,而是:
從對(duì)象中獲取虛表指針厢拭,該指針指向一個(gè)函數(shù)指針數(shù)組,每個(gè)指針對(duì)應(yīng)一個(gè)虛函數(shù)撇叁;
從虛表中獲取正確的函數(shù)地址供鸠,放到寄存器中;
跳轉(zhuǎn)到該寄存器中的地址陨闹,而不是跳轉(zhuǎn)到一個(gè)硬編碼的地址楞捂。
通常,使用虛函數(shù)沒問題趋厉,它的性能開銷也不大寨闹,而且虛函數(shù)在面向?qū)ο蟠a中有強(qiáng)大的作用。
但是不能無腦使用虛函數(shù)君账,特別是在性能至關(guān)重要的或者底層代碼中鼻忠,而且大項(xiàng)目中使用多態(tài)也會(huì)導(dǎo)致繼承層次很混亂。
那么有什么好方法替代虛函數(shù)呢杈绸?這里提供幾個(gè)思路帖蔓,讀者請(qǐng)持續(xù)關(guān)注,后續(xù)會(huì)具體講解:
使用訪問者模式來使類層次結(jié)構(gòu)可擴(kuò)展瞳脓;
使用普通模板替代繼承和虛函數(shù)塑娇;
C++20中的concepts用來替代面向?qū)ο蟠a;
使用variants替代虛函數(shù)或模板方法劫侧。
這幾種方法是Michael Spertus大佬介紹的埋酬,各有各的優(yōu)缺點(diǎn),作者都會(huì)用烧栋,但什么情況下使用哪個(gè)写妥,取決于你自己的判斷,這里只是教你了一個(gè)工具审姓,什么時(shí)候用都取決于你自己珍特。
Michael Spertus 世界級(jí)C++技術(shù)權(quán)威Michael Spertus是世界級(jí)C++技術(shù)權(quán)威。作為ISO C++標(biāo)準(zhǔn)委員會(huì)資深成員魔吐,Michael 曾遞交過50多項(xiàng)標(biāo)準(zhǔn)提案扎筒,是內(nèi)存管理與性能調(diào)優(yōu)方面公認(rèn)的技術(shù)權(quán)威。他目前是Symantec的技術(shù)院士與首席科學(xué)家酬姆,負(fù)責(zé)云端安全服務(wù)嗜桌。同時(shí)在芝加哥大學(xué)任教。Michael 自1980開始沉迷軟件設(shè)計(jì)辞色,是IBM PC第一個(gè)商用C語言編譯器的作者骨宠,并曾創(chuàng)辦 Geodesic,后被VERITAS收購(gòu)。
參考資料