C++ or C
本文討論的是 C++, 在C中內(nèi)存布局差不多肌厨,但也不盡相同。如一個(gè)空的struct巷帝,c++中大小為1纷跛, C中卻大小為0.
struct 的最小大小為1
C++中每個(gè)對(duì)象必須有個(gè)唯一的地址,所以每個(gè)對(duì)象的大小必須不能為0惋戏。因此一個(gè) struct 的最小大小為 1. 一個(gè)例子是一個(gè)空struct:
struct EmptyStruct {};
// sizeof (EmptyStruct) = 1
內(nèi)存布局流程
一個(gè) struct 的內(nèi)存布局流程可以簡(jiǎn)化為下面幾步:
- struct 放到地址0上
- struct 的所有成員順序地依次放置到自己的偏移位置上
- 所有成員放置完畢领追,對(duì)struct的內(nèi)容大小(最后一個(gè)成員的終了位置)進(jìn)行對(duì)齊响逢,計(jì)算出新大小
流程中涉及到兩點(diǎn):
- 如何確定一個(gè)成員的放置起始位置
- 如何最后對(duì)struct的內(nèi)容大小進(jìn)行對(duì)齊
成員的起始位置
當(dāng)放置完上一個(gè)成員之后绒窑,對(duì)接下來的成員放置位置是有要求的,要求這個(gè)位置偏移(對(duì)于struct的起始位置)必須是這個(gè)成員的內(nèi)部最大pod類型的大小的倍數(shù)龄句。
成員的內(nèi)部最大pod類型可以分成幾種情況來討論:
第一種是這個(gè)成員就是基本的pod類型(int,char,double,...) 回论,那么其內(nèi)部最大pod類型大小自然是其本身成員的大小了。
第二種是這個(gè)成員是struct類型分歇,其內(nèi)部最大pod類型為struct內(nèi)部的各個(gè)成員的內(nèi)部最大pod類型中最大的那個(gè)(有個(gè)遞歸了)傀蓉。
第三種是數(shù)組,數(shù)組的內(nèi)存布局要求是职抡,每個(gè)數(shù)組成員之間無空隙排列的葬燎,沒有填充字節(jié)。所以數(shù)組的總大小是數(shù)組長(zhǎng)度乘以每個(gè)數(shù)組成員的大小缚甩。內(nèi)部最大pod類型的大小為數(shù)組成員內(nèi)部的最大pod類型大衅拙弧(有個(gè)遞歸了)。
偽代碼如下:
// 求內(nèi)部最大的成員大小
function maxInnerUnitSize(data)
if data 是 pod類型:
return sizeof(pod類型)
else if data 是 struct 類型:
return max(map(data.members, maxInnerUnitSize))
else if data 是 數(shù)組類型:
return maxInnerUnitSize(data[0])
end
在上個(gè)放置成員尾部和當(dāng)前成員起始位置之間如果有間隙擅威,那么編譯器會(huì)填充無效字節(jié)壕探。
然后就可以把當(dāng)前成員放置進(jìn)去,放入的大小為當(dāng)前成員的總大小郊丛。一個(gè)成員的大小計(jì)算偽代碼:
function dataSize(data)
if data 是 pod類型:
return sizeof(pod類型)
else if data 是 struct 類型:
return struct 的大小
else if data 是 數(shù)組類型:
return 數(shù)組長(zhǎng)度 * sizeof(data[0])
end
struct 的大小對(duì)齊
成員都放置完畢之后李请,struct的內(nèi)容大小有個(gè)規(guī)則瞧筛,必須是內(nèi)部最大pod類型的大小的倍數(shù)。沒錯(cuò)导盅,就是上面那個(gè) maxInnerUnitSize较幌。
然后在最后一個(gè)成員末尾到struct的新大小末尾會(huì)填充字節(jié)(如果有空隙的話)。
舉個(gè)例子:
struct AAA {
char a[3];
int64_t b;
char c;
};
首先白翻,最大成員大小 maxInnerUnitSize 為 max(3, 8, 1) = 8, 所以每個(gè)成員的偏移位置必須是 8 的倍數(shù)乍炉。先放置 a 在 0 處,其占用 3 個(gè)字節(jié)滤馍,然后填充 5 個(gè)補(bǔ)齊字節(jié)岛琼,以讓 b 放置在 8 處,b占用 8 個(gè)字節(jié)纪蜒,最后 c 放置在 16 處衷恭,占用 1 個(gè)字節(jié)此叠。至此整個(gè)struct內(nèi)容大小為 17纯续,所以調(diào)整到 8 的倍數(shù),末尾填充 6 個(gè)字節(jié)灭袁,struct 大小調(diào)整為 24.
#pragma pack(n) 的影響
pack 的參數(shù)n猬错,有1,2茸歧,4倦炒,8,16软瞎, 原則是 2 的次冪逢唤。這個(gè)參數(shù)影響的是上面流程中的內(nèi)部最大pod類型大小。影響是從正常流程算出的大小涤浇,和pack(n) 指定的大小取最小值來布局鳖藕。即:
maxInnerUnitSize(data) = min(maxInnerUnitSize(data), pack_n)
再看上面的例子,添加 pack(n) 后的效果:
#pragma pack(4)
struct AAA {
char a[3];
int64_t b;
char c;
};
首先只锭,最大成員大小 maxInnerUnitSize 為 max(3, 8, 1) = 8, 然后與 pack(4) 取最小徝著恩,故每個(gè)成員的偏移位置必須是 4 的倍數(shù)。
a 放置在地址 0 處蜻展,占用 3 個(gè)字節(jié)喉誊,接下來 b 放置在地址 4 處,占用 8 個(gè)字節(jié)纵顾, c 放置在地址 12 處伍茄,占用 1 個(gè)字節(jié)。struct內(nèi)容區(qū)域大小為 13 施逾,需要調(diào)整為 4 的倍數(shù)敷矫,所以大小調(diào)整為 16 .