想要理解C++結(jié)構(gòu)體收捣,要從兩個角度出發(fā)届案。 一是內(nèi)存角度,而是面向?qū)ο蠼嵌取?/p>
為什么要內(nèi)存對齊
內(nèi)存對齊本來是個很簡單的事罢艾,但是網(wǎng)上始終沒有一個很好的解釋楣颠。 有些人強調(diào)背公式,有些人強調(diào)記規(guī)則咐蚯。但我認為這些都不必要童漩。
先來看看數(shù)據(jù)是怎樣從DRAM中讀出的。
在這幅圖上仓蛆,最重要的信息是 主存儲器地址A處的64-bit數(shù)據(jù)睁冬。這說明,當CPU給出一個地址時看疙,存儲器會同時讀出64-bit數(shù)據(jù), 也就是8 byte直奋。 當CPU想拿到內(nèi)存條里的某個變量時能庆,無論這個變量是 4 byte 的 int 型變量,還是 1 byte 的 char 型變量脚线, 內(nèi)存條都會提供給 CPU 8 byte 的數(shù)據(jù)搁胆。
那么問題來了。假設(shè)有一個 double
類型的變量邮绿,它占用了 8 byte渠旁。 但它在存儲器中的布局是下面這樣的。當CPU需要讀取這個變量時船逮,存儲器不得不傳輸兩次顾腊,而且每次都包含 4 byte 的垃圾數(shù)據(jù)。這會導(dǎo)致訪存性能下降挖胃。
為了避免這種情況杂靶,需要讓每個變量的首地址都是 8 的倍數(shù)。這也就是所謂的 按 8 字節(jié)對齊酱鸭。
速算結(jié)構(gòu)體尺寸
面試 C++ 崗時吗垮,計算結(jié)構(gòu)體占用的空間是必考題。 這里我獻出一個速算技巧凹髓。 比如有一個結(jié)構(gòu)體A
烁登,請你計算sizeof(A);
的結(jié)果蔚舀。
struct A
{
char a;
double b;
char c;
};
首先饵沧,你要找出占用空間最大的成員變量锨络,比如 struct A
中, double b
占用空間最大捷泞,共占 8 byte足删。那么這個結(jié)構(gòu)體就要按 8 byte 對齊。
然后锁右,請你試想一個 8 byte 大的箱子失受。你要把所有成員變量逐個放進去。先放入 char a
咏瑟,再放入double b
拂到。
放入 char a
后,當前行已經(jīng)沒有空間再容納 double b
了码泞, 這時兄旬,剩余的空間(藍色所代表的)就是 memory padding,也就是編譯器為你填充的額外空間余寥。 double b
會放在另一個8 byte 的箱子里领铐。
最后,放入 char c宋舷。這沒什么好說的绪撵, 8 byte 的箱子里只有它一個變量。
所以祝蝠,struct A
最后所占用的空間音诈,是 24 byte。而且绎狭,struct A
的內(nèi)存布局细溅,是非常規(guī)整的,每個成員變量的首地址儡嘶,都是 8 的倍數(shù)喇聊。 這樣,存儲器只需傳送3次社付,就可以讓CPU拿到struct A
的全部數(shù)據(jù)承疲。
如何按指定字節(jié)對齊
雖然struct A
的已經(jīng)完美對齊,但是 memory padding 有點大鸥咖,會造成空間浪費燕鸽。如果把箱子的尺寸從 8 byte 改為 4 byte,好像一樣可以對齊啼辣,只不過 double b
會被切割啊研。
如何控制箱子的大小呢?如果你用 Visual Studio 寫 C++ 代碼,可以使用編譯器控制指令#pragma pack
實現(xiàn)党远。
#pragma pack(4)
struct A
{
char a;
double b;
char c;
};
此時削解,執(zhí)行 sizeof(A)
,結(jié)果是 16沟娱,這正好符合我們用速算法得到的結(jié)果氛驮。
Property Offset
property 是結(jié)構(gòu)體中數(shù)據(jù)成員的別名。比如 struct A
中济似, char a
是 property, double b
也是 property矫废。 在 C/C++ 中,通過某種手段砰蠢,可以取得 property 相對于結(jié)構(gòu)體基地址的偏移蓖扑,你可以簡單理解為“唯一的代號”。 我們來看下面一段代碼:
size_t offset = (size_t) & (((A*)0)->c);
這個表達式的意思是台舱,把數(shù)字0轉(zhuǎn)換成結(jié)構(gòu)體指針后律杠,先拿到它的某個成員,再把這個成員地址轉(zhuǎn)換成數(shù)字竞惋。通過這個表達式柜去,可以取得某個 property 相對于結(jié)構(gòu)體基地址的偏移量。 它也算是一種“地址”拆宛,不過是相對的诡蜓。
有了 property offset后,只要提供一個結(jié)構(gòu)體基地址胰挑,就可以用取得 property。
double value = *(double*)((size_t)&a + offset);
其中椿肩, (size_t)&a
將結(jié)構(gòu)體基地址轉(zhuǎn)化為一個數(shù)字瞻颂,(size_t)&a + offset
把基地址和偏移加在一起,形成 property最終的地址郑象。最后贡这,把最終地址轉(zhuǎn)化為指針,再取值厂榛,就可以拿到property的值盖矫。
所以,對于任何類對象击奶,只要你能提供對象地址和property的偏移辈双,就可以訪問。其中柜砾,對象地址在運行期確定湃望,property offset 在 編譯期確定。