一冯挎、何為內(nèi)存對齊
內(nèi)存對齊”應(yīng)該是編譯器的“管轄范圍”。編譯器為程序中的每個“數(shù)據(jù)單元”安排在適當(dāng)?shù)奈恢蒙厦Ф凇5荂語言的一個特點就是太靈活谬擦,太強(qiáng)大,它允許你干預(yù)“內(nèi)存對齊”朽缎。如果你想了解更加底層的秘密惨远,“內(nèi)存對齊”對你就不應(yīng)該再模糊了。
二话肖、如何內(nèi)存對齊
每個特定平臺上都有自己的默認(rèn)“對齊系數(shù)”(也叫對齊模數(shù))北秽。程序員可以通過[預(yù)編譯]命令#pragma pack(n),n=1,2,4,8,16來改變這一系數(shù)最筒,其中的n就是你要指定的“對齊系數(shù)”贺氓。ios中默認(rèn)系數(shù)為8。
對齊規(guī)則:
- 數(shù)據(jù)成員對齊規(guī)則:結(jié)構(gòu)(struct)(或聯(lián)合(union))的數(shù)據(jù)成員床蜘,第一個數(shù)據(jù)成員放在offset為0的地方辙培,以后每個數(shù)據(jù)成員的對齊按照min(對齊系數(shù),自身長度)進(jìn)行邢锯。
- 結(jié)構(gòu)(或聯(lián)合)的整體對齊規(guī)則:在數(shù)據(jù)成員完成各自對齊之后扬蕊,結(jié)構(gòu)(或聯(lián)合)本身也要進(jìn)行對齊,對齊將按照min(對齊系數(shù)丹擎,最大數(shù)據(jù)成員長度)進(jìn)行尾抑。
下面舉個??:
struct Struct1 {
char a; // 1
double b; // 8
int c; // 4
short d; // 2
} MyStruct1;
struct Struct2 {
double b; // 8
int c; // 4
char a; /
short d; // 2
} MyStruct2;
NSLog(@"%lu-%lu",sizeof(MyStruct1),sizeof(MyStruct2));
上面的輸出結(jié)果為:
24-16
那么是為什么兩個結(jié)構(gòu)體的大小輸出不一致呢,我們可以按照上面的兩條原則進(jìn)行分析。
先分析Struct1:
- 根據(jù)原則1, a為第一個數(shù)據(jù)成員房子offset為0位置蛮穿,占據(jù)一個字節(jié)大小庶骄。
- b為第二個數(shù)據(jù)成員,它按照min(8,8)=8對齊践磅,即a后面需要補(bǔ)足7位单刁,使b的起始位置為8,b占據(jù)的位置為8-15府适。
- 以此類推羔飞,c按照min(8,4)=4對齊,c的起始位置為16檐春,占據(jù)16-19的位置逻淌。
- d按照min(8,2)=2對齊,占據(jù)20-21的位置疟暖。
- 此時Struct1的大小為22卡儒。又根據(jù)原則2,結(jié)構(gòu)自身也要根據(jù)min(8,8)=8對齊俐巴,所以需要在后邊補(bǔ)足兩位骨望,構(gòu)成8的倍數(shù),即24欣舵。
分析完Struct1擎鸠,即可同理分析出Struct2的大小了。
- b從0開始缘圈,占據(jù)8位劣光,位置為0-7。
- c從8開始糟把,占據(jù)4位绢涡,位置為8-11。
- a的起始位置為12遣疯,占據(jù)一個字節(jié)大小雄可。占據(jù)12位置
- d按照min(8,2)=4對齊,a后面需要補(bǔ)一位另锋,d從14開始,占據(jù)位置為14-15狭归。
- 此時Struct2大小為16夭坪,剛好滿足原則2。
三过椎、為何要內(nèi)存對齊
- 平臺原因(移植原因):不是所有的硬件平臺都能訪問任意地址上的任意數(shù)據(jù)的室梅;某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù),否則拋出硬件異常。
- 性能原因:經(jīng)過內(nèi)存對齊后亡鼠,CPU的內(nèi)存訪問速度大大提升赏殃。具體原因請往繼續(xù)下看。
在普通程序員心目中的內(nèi)存印象间涵,由一個個的字節(jié)組成仁热,而CPU并不是這么看的。CPU把內(nèi)存當(dāng)成是一塊一塊的勾哩,塊的大小可以是2抗蠢,4,8思劳,16字節(jié)大小迅矛,因此CPU在讀取內(nèi)存時是一塊一塊進(jìn)行讀取的。塊大小成為memory access granularity(內(nèi)存讀取粒度) 潜叛。
舉個??假設(shè)CPU要讀取一個int型4字節(jié)大小的數(shù)據(jù)到寄存器中秽褒,分兩種情況討論:
a. 數(shù)據(jù)從0字節(jié)開始
當(dāng)該數(shù)據(jù)是從0字節(jié)開始時,很CPU只需讀取內(nèi)存一次即可把這4字節(jié)的數(shù)據(jù)完全讀取到寄存器中威兜。
b.數(shù)據(jù)從1字節(jié)開始
當(dāng)該數(shù)據(jù)是從1字節(jié)開始時销斟,問題變的有些復(fù)雜,此時該int型數(shù)據(jù)不是位于內(nèi)存讀取邊界上牡属,這就是一類內(nèi)存未對齊的數(shù)據(jù)票堵。此時CPU先訪問一次內(nèi)存,讀取0—3字節(jié)的數(shù)據(jù)進(jìn)寄存器逮栅,并再次讀取4—5字節(jié)的數(shù)據(jù)進(jìn)寄存器悴势,接著把0字節(jié)和6,7措伐,8字節(jié)的數(shù)據(jù)剔除特纤,最后合并1,2侥加,3捧存,4字節(jié)的數(shù)據(jù)進(jìn)寄存器。對一個內(nèi)存未對齊的數(shù)據(jù)進(jìn)行了這么多額外的操作担败,大大降低了CPU性能昔穴。當(dāng)然,實際情況可能更復(fù)雜提前。