《深入理解Java虛擬機(jī)》讀書筆記,java字節(jié)碼文件的這塊定義的數(shù)據(jù)結(jié)構(gòu)比較多击胜,書講解的很詳細(xì)。
一.class文件中的數(shù)據(jù)格式
字節(jié)碼文件是由java源文件經(jīng)過編譯之后獲得掂墓,是以8位字節(jié)為基礎(chǔ)單位的二進(jìn)制流护戳,各個(gè)數(shù)據(jù)嚴(yán)格按照順序緊湊地排列在class文件之中,中間沒有任何分割符绊率,當(dāng)數(shù)據(jù)項(xiàng)占用8位字節(jié)以上的空間時(shí)谨敛,按照高位在前(大端法)的方式分割成若干個(gè)8位字節(jié)進(jìn)行存儲(chǔ)。
class文件中的格式只有倆種數(shù)據(jù)類型:無符號(hào)數(shù)和表
無符號(hào)數(shù):為基本類型的數(shù)據(jù)類型滤否,以u(píng)1,u2,u4,u8來代表1個(gè)字節(jié)脸狸,2個(gè)字節(jié),4個(gè)字節(jié)藐俺,8個(gè)字節(jié)的無符號(hào)數(shù)炊甲。無符號(hào)數(shù)可以用來描述“數(shù)字、索引引用欲芹、數(shù)量值或者按照utf-8編碼構(gòu)成的字符串值卿啡。
表:表是由多個(gè)無符號(hào)數(shù)或者其他表作為數(shù)據(jù)項(xiàng)構(gòu)成的復(fù)雜數(shù)據(jù)類型。所有表都習(xí)慣以“_info”結(jié)尾菱父。表用于描述有層次關(guān)系的復(fù)雜結(jié)構(gòu)的數(shù)據(jù)颈娜。如下:
表中描述的標(biāo)簽有“類型、名稱浙宜、數(shù)量”官辽,對于一段由0和1組成的序列來說,有了類型梆奈,那么就知道了數(shù)據(jù)的大小野崇,去讀取數(shù)據(jù)大小的字節(jié)即可,通過名稱可以知道數(shù)據(jù)所要表達(dá)的意思亩钟,數(shù)量則可以知道有多少個(gè)這樣的數(shù)據(jù)類型乓梨。
舉個(gè)例子來說的話,有一段序列是代表一張表清酥,其中表中每一項(xiàng)的類型和數(shù)量是已經(jīng)的扶镀,且是順序排序的。那么在讀取的時(shí)候按照固定的字節(jié)去讀取進(jìn)行解析即可焰轻。
二. class文件格式
整個(gè)class文件也是一張表臭觉。下圖中可以看出編譯之后class文件中包含了常量池、字段表、接口表蝠筑、屬性表等狞膘。
在文件中的存儲(chǔ)如下:
三.常量池
常量池中存放倆大類常量:字面量和符號(hào)引用。
字面量:文本字符串什乙、聲明為final的常量值等
符號(hào)引用:類和接口的全限定名挽封、字段名稱和描述符、方法的名稱和描述符
常量池的項(xiàng)目類型:
常量池中的每一種類型都是一張表臣镣,且結(jié)構(gòu)各不相同辅愿。在java編譯期編譯java源文件時(shí),把源文件中的有關(guān)類忆某,字段点待,方法相關(guān)的信息全部放入class字節(jié)碼的常量池中,class文件中的字段表弃舒,方法表中可以通過常量池中的“常量”索引去訪問對應(yīng)的常量項(xiàng)癞埠,拿到類或方法,字段等信息聋呢。
java虛擬機(jī)在運(yùn)行java程序時(shí)燕差,首先去加載class文件,通過class文件坝冕,java虛擬機(jī)才知道對象有那些方法,字段瓦呼,然后去內(nèi)存分配空間喂窟,進(jìn)行運(yùn)算。
3.1 CONSTANT_Class_info
class_info表中tag所占1個(gè)字節(jié)央串,值為7磨澡,代表為class_info。index指向CONSTANT_Utf8_info表质和,其內(nèi)容為類的全限定名稳摄。
3.2 CONSTANT_Fieldref_info
第一個(gè)index是聲明字段的類的CONSTANT_Class_info索引項(xiàng),通過這個(gè)索引可以知道字段是哪個(gè)類聲明的饲宿。
第二個(gè)index是CONSTANT_NameAndType的索引項(xiàng)厦酬。
3.3 CONSTANT_NameAndType
CONSTANT_NameAndType中的內(nèi)容包含了字段的名稱和描述符,描述符用來表示字段的數(shù)據(jù)類型(基本類型或者對象)瘫想。
3.4 CONSTANT_Method_Type_info
四. 字段表
上表中name_index和descriptor_index都是對常量池的引用仗阅。name_index代表字段的名稱,descriptor_index代表字段的描述符国夜。
字段表集合中不會(huì)列出從超類或者父接口中繼承而來的字段减噪。
內(nèi)部類中為了保持對外部類的訪問性,會(huì)自動(dòng)添加指向外部類實(shí)例的字段。
五. 方法表
其中name_index和descriptor_index和屬性表中一樣筹裕,代表方法的名稱和方法的描述符醋闭。
六.屬性表
6.1 Code屬性
6.2 Exceptions屬性
Exceptions屬性是列舉方法中可能拋出的受查異常,也就是throws關(guān)鍵子后面列舉的異常朝卒。
6.3 LocalVariableTable屬性
其中l(wèi)ocal_variable_info表示的方法中的形參和局部變量证逻。start_pc和length表示變量的作用域。
6.4 ConstantValue屬性
ConstantValue屬性的作用是通知虛擬機(jī)自動(dòng)為靜態(tài)變量賦值扎运。
static類型的的變量瑟曲,有倆種賦值方式,一種是在類構(gòu)造器<clinit>方法中豪治,另一種是通過ConstantValue屬性洞拨。Sun Javac編譯器中,如果同時(shí)使用final和static來修飾一個(gè)變量负拟,并且這個(gè)變量的數(shù)據(jù)類型是基本類型或者String類型的話烦衣,就生成Constant屬性來進(jìn)行初始化。
6.5 InnerClasses 屬性
InnerClasses屬性用于記錄內(nèi)部類與宿主類之間的關(guān)聯(lián)掩浙。
數(shù)據(jù)類number_of_classes代表需要記錄多少個(gè)內(nèi)部類花吟,每個(gè)內(nèi)部類的信息都由一個(gè)inner_classes_info表進(jìn)行描述。
- inner_class_info_index和outer_class_info_index都是指向常量池中
CONSTANT_Class_info型常量的索引 - inner_name_index是指向常量池中CONSTANT_Utf8_info型常量的索引,代表這個(gè)類的名稱厨姚,如果是匿名內(nèi)部類衅澈,那么這項(xiàng)值為0.
- inner_class_access_flags是內(nèi)部類的訪問標(biāo)志
6.6 Signature 屬性
Signature屬性記錄的是泛型簽名信息。java語言的泛型采用的是擦除法谬墙,在字節(jié)碼中今布,泛型信息都被擦除掉了。JDK1.5之后拭抬,任何類部默、接口、初始化方法或成員的泛型簽名中如果包含了類型變量或者“參數(shù)化類型”造虎,則Signature屬性會(huì)為它記錄泛型簽名信息傅蹂。