前言
要深入學(xué)習(xí)Java以及Java虛擬機(jī)搔弄,深入學(xué)習(xí)Java字節(jié)碼文件是繞不開的一條路日熬,只有知道了字節(jié)碼文件里的排列結(jié)構(gòu)携冤,你才能透徹的了解在JVM里,類加載是怎么加載Java類的须床,是怎么將二進(jìn)制流轉(zhuǎn)化為運(yùn)行時(shí)數(shù)據(jù)結(jié)構(gòu)的铐料。
Class文件是是一組以8字節(jié)為基礎(chǔ)單位的二進(jìn)制流,各個(gè)數(shù)據(jù)項(xiàng)目嚴(yán)格按照順序緊湊地排列在Class文件中豺旬,中間沒有任何分隔符。
這里的Class文件其實(shí)不是特指Java的字節(jié)碼文件柒凉,任何編程語(yǔ)言的編譯器只要按照字節(jié)碼文件規(guī)范編譯成Class文件族阅,都可以在JVM上運(yùn)行,所以字節(jié)碼文件和JVM是和語(yǔ)言無(wú)關(guān)的膝捞。
另外一般Class文件指的不一定是存儲(chǔ)在磁盤上的以.class后綴結(jié)束的文件坦刀,是一種泛指,指的是一切按照字節(jié)碼文件規(guī)范排列的二進(jìn)制字節(jié)流。
字節(jié)碼文件解析
Class文件采用下面這種類似C語(yǔ)言的結(jié)構(gòu)體的偽結(jié)構(gòu)來(lái)存儲(chǔ)數(shù)據(jù)鲤遥,整個(gè)Class文件是一張表沐寺,表里又由無(wú)符號(hào)數(shù)和表組成。
ClassFile {
u4 magic; // 魔數(shù)盖奈,固定為"0xCAFEBABY"
u2 minor_version; //jdk次版本號(hào)
u2 major_version; //jdk主版本號(hào)
u2 constant_pool_count; //常量池?cái)?shù)組大小混坞,從1計(jì)數(shù)
cp_info constant_pool[constant_pool_count - 1]; //常量池?cái)?shù)組
u2 access_flags; //類的訪問(wèn)標(biāo)志,如:public
u2 this_class; //類索引钢坦,指向常量池中的類符號(hào)引用
u2 super_class; //父類索引究孕,指向常量池中的類符號(hào)引用
u2 interfaces_count; //實(shí)現(xiàn)的接口的數(shù)量
u2 interfaces[interfaces_count]; //接口列表,按implements后面的接口順序
u2 fields_count; //字段數(shù)
field_info fields[fields_count]; //字段表
u2 methods_count; //方法數(shù)
method_info methods[methods_count]; //方法表
u2 attributes_count; //屬性表大小
attribute_info attributes[attributes_count]; //屬性表
}
從上面的偽結(jié)構(gòu)可以看到爹凹,Class文件根據(jù)上面的順序把規(guī)定的數(shù)據(jù)類型按照占用的字節(jié)依次排列下來(lái)厨诸。
下面通過(guò)一個(gè)例子來(lái)實(shí)戰(zhàn)分析一下Class文件
//Test.class
public class Test {
public static int a = 1;
public static final int b = 1;
public void say(){
System.out.println("Hello");
}
}
上圖是編譯后的Test.class文件的二進(jìn)制數(shù)據(jù),可以按照上面ClassFile的結(jié)構(gòu)順序依次分析下禾酱,下面是部分分析結(jié)果:
(1) u4 magic
????4個(gè)字節(jié)(000h:0123)魔數(shù): 0xCAFEBABY
(2) u2 minor_version
????2個(gè)字節(jié)(000h:45)次版本號(hào): 0x0000, 次版本號(hào)為0
(3) u2 major_version
????2個(gè)字節(jié)(000h:67)主版本號(hào): 0x0034,即52,JDK1.0-1.1:45.0 ~ 45.3, 1.1后版本增1微酬,數(shù)字加1,所以這里用的是1.1 + 0.(52-45) = 1.8
(4) u2 constant_pool_count
????2個(gè)字節(jié)(000h:89)常量池大小:0x0027,即39颤陶,常量池?cái)?shù)組是從1開始計(jì)數(shù)的颗管,說(shuō)明常量池中有38個(gè)常量,后面依次排列的就是常量池的38個(gè)常量
(5) cp_info constant_pool[constant_pool_count - 1]
????常量池所占的字節(jié)數(shù)是由常量池中常量的數(shù)量以及類型所決定的指郁,這里有38個(gè)常量忙上,每個(gè)常量開頭都有一個(gè)字節(jié)的tag標(biāo)識(shí)常量的類型,具體類型可以參考最下面的腦圖闲坎,根據(jù)這個(gè)標(biāo)識(shí)可以找到這個(gè)常量所占的字節(jié)以及含義疫粥,下面分析其中一個(gè)常量,其余的讀者有興趣可以全部完成
- 000h:a 0x0A,表示常量類型為10腰懂,查表可知是CONSTANT_Methodref方法符號(hào)引用梗逮,那接下來(lái)的四個(gè)字節(jié),前兩個(gè)字節(jié)表示指向常量池中方法所在類的符號(hào)引用的索引項(xiàng)绣溜,就是常量池的數(shù)組下標(biāo)慷彤,所在的位置是方法所在類的符號(hào)引用
- 000h:bc 0x0007,指向常量池?cái)?shù)組第7個(gè)元素,第7個(gè)常量是一個(gè)java.lang.Object類的符號(hào)引用
- 000h:de 0x0018, 指向常量池?cái)?shù)組的第24個(gè)元素怖喻,第24個(gè)常量是一個(gè)名稱和類型的符號(hào)引用底哗,方法名是
<init>
,描述符是()V
這樣第一個(gè)常量就分析完成锚沸,共占5個(gè)字節(jié)跋选,表示的是方法符號(hào)引用,該方法所在的類是Object類哗蜈,方法名稱是<init>
, 無(wú)參數(shù)前标,返回值是void
借助工具javap可以更直觀的看到我們剛剛分析的部分結(jié)果以及全部類文件的結(jié)構(gòu)坠韩,使用以下命令即可:
javap -v Test.class
結(jié)果如圖:
通過(guò)上面的圖可以看到,和我們上面的部分分析是一致的
Class文件結(jié)構(gòu)腦圖
下面是我在看《深入理解Java虛擬機(jī)》這本書的時(shí)候整理的關(guān)于Class文件結(jié)構(gòu)的腦圖炼列,圖片比較大只搁,右鍵另存為圖片再查看會(huì)更方便。
更多干貨俭尖,請(qǐng)掃描關(guān)注公眾號(hào)氢惋,持續(xù)更新