概述
java的編譯期可能指的以下三種:
-
前端編譯器:將
*.java
文件變成*.class
文件脐帝,例如Sun的Javac糖权、Eclipse JDT中的增量式編譯器(ECJ) - JIT編譯器(Just In Time Compiler):將字節(jié)碼變成機(jī)器碼,例如HotSpot VM的C1疚顷、C2編譯器
-
AOT編譯器(Ahead Of Time Compiler):直接把
*.java
文件編譯成本地機(jī)器碼,例如GNU Compiler for the Java(GCJ)阀坏、Excelsior JET
本文中涉及到的編譯器都僅限于第一類(lèi)释液,第二類(lèi)編譯器跟java語(yǔ)言的關(guān)系不大。javac這類(lèi)編譯器對(duì)代碼的運(yùn)行效率幾乎沒(méi)有任何優(yōu)化措施浸船,但javac做了許多針對(duì)java語(yǔ)言代碼過(guò)程的優(yōu)化措施來(lái)改善程序員的編碼風(fēng)格和提高編碼效率寝蹈,java許多的語(yǔ)法特性都是靠編譯器的語(yǔ)法糖來(lái)實(shí)現(xiàn)的
javac編譯器
Sun javac編譯器的編譯過(guò)程可以分為3個(gè)過(guò)程:
- 解析與填充符號(hào)表過(guò)程
- 插入式注解處理器的注解處理過(guò)程
- 分析與字節(jié)碼生成過(guò)程
解析與填充符號(hào)表
解析步驟包括了經(jīng)典程序編譯原理中的詞法分析與語(yǔ)法分析兩個(gè)過(guò)程
- 詞法箫老、語(yǔ)法分析
- 詞法分析是將源代碼的字符流轉(zhuǎn)變?yōu)闃?biāo)記(Token)集合,單個(gè)字符是程序編寫(xiě)過(guò)程的最小元素耍鬓,而標(biāo)記則是編譯過(guò)程的最小元素,關(guān)鍵字笆制、變量名涣达、字面量、運(yùn)算符都可以成為標(biāo)記
- 語(yǔ)法分析是根據(jù)Token序列構(gòu)造抽象語(yǔ)法樹(shù)的過(guò)程匆篓,抽象語(yǔ)法樹(shù)(Abstract Syntax Tree,AST)是一種用來(lái)描述程序代碼語(yǔ)法結(jié)構(gòu)的樹(shù)形表示方式寇窑,語(yǔ)法樹(shù)的每一個(gè)節(jié)點(diǎn)都代表著程序代碼中的一個(gè)語(yǔ)法結(jié)構(gòu)(Construct),例如包甩骏、類(lèi)型、修飾符谨设、運(yùn)算符缎浇、接口、返回值甚至代碼注釋等都可以是一個(gè)語(yǔ)法結(jié)構(gòu)
- 填充符號(hào)表
- 符號(hào)表(Symbol Table)是由一組符號(hào)地址和符號(hào)信息構(gòu)成的表格二蓝,可以想象成K-V的形式。符號(hào)表中所登記的信息在編譯的不同階段都要用到刊愚。在語(yǔ)義分析中,符號(hào)表所登記的內(nèi)容將用于語(yǔ)義檢查和產(chǎn)生中間代碼商玫。在目標(biāo)代碼生成階段牡借,當(dāng)對(duì)符號(hào)名進(jìn)行地址分配時(shí),符號(hào)表是地址分配的依據(jù)
注解處理器
注解處理器是用于提供對(duì)注解的支持炬藤,可以將其看成一組編譯器的插件
語(yǔ)義分析與字節(jié)碼生成
語(yǔ)法分析后碴里,編譯器獲得了程序代碼的抽象語(yǔ)法樹(shù)表示,語(yǔ)法樹(shù)能表示一個(gè)結(jié)構(gòu)正確的源程序的抽象咬腋,但無(wú)法保證源程序是符合邏輯的
- 標(biāo)注檢查
- 標(biāo)注檢查檢查的內(nèi)容包括變量使用前是否已被聲明、變量與賦值之間的數(shù)據(jù)類(lèi)型是否能夠匹配等溜徙。在標(biāo)注檢查中犀填,還有一個(gè)重要的動(dòng)作稱(chēng)為常量折疊嗓违,這使得a=1+2比起a=3不會(huì)增加任何運(yùn)算量
- 數(shù)據(jù)及控制流分析
- 數(shù)據(jù)及控制流分析是對(duì)程序上下文邏輯更進(jìn)一步的驗(yàn)證,可以檢查出諸如程序局部變量在使用前是否賦值冕广、方法的每條路徑是否都有返回值、是否所有的受查異常都被正確處理等
- 解語(yǔ)法糖
- 語(yǔ)法糖(Syntactic Sugar)撒汉,也稱(chēng)糖衣語(yǔ)法涕滋,指在計(jì)算機(jī)語(yǔ)言中添加的某種語(yǔ)法,這種語(yǔ)法對(duì)語(yǔ)言的功能并沒(méi)有影響溯饵,但方便使用。java在現(xiàn)代編程語(yǔ)言中屬于低糖語(yǔ)言隘谣,java中的主要語(yǔ)法糖包括泛型、可變參數(shù)寻歧、自動(dòng)裝箱/拆箱等秩仆,虛擬機(jī)運(yùn)行時(shí)不支持這些語(yǔ)法,它們?cè)诰幾g階段還原回簡(jiǎn)單的基礎(chǔ)語(yǔ)法結(jié)構(gòu)弟晚,這個(gè)過(guò)程稱(chēng)為解語(yǔ)法糖
- 字節(jié)碼生成
- 字節(jié)碼生成階段不僅僅時(shí)把前面各個(gè)步驟所生成的信息(語(yǔ)法樹(shù)逾苫、符號(hào)表)轉(zhuǎn)化成字節(jié)碼寫(xiě)到磁盤(pán)中,編譯器還進(jìn)行了少量的代碼添加和轉(zhuǎn)換工作
java語(yǔ)法糖
泛型與類(lèi)型擦除
泛型的本質(zhì)是參數(shù)化類(lèi)型(Parametersized Type)的應(yīng)用铅搓,也就是說(shuō)所操作的數(shù)據(jù)類(lèi)型被指定為一個(gè)參數(shù)
java中的泛型只在程序源碼中存在,在編譯后的字節(jié)碼文件中多望,已經(jīng)替換為原來(lái)的原生類(lèi)型(Raw Type)氢烘,并在相應(yīng)的地方插入了強(qiáng)制轉(zhuǎn)型代碼。因此椎工,對(duì)于運(yùn)行期的java語(yǔ)言來(lái)說(shuō),ArrayList<int>與ArrayList<String>就是同一個(gè)類(lèi)维蒙,所以泛型技術(shù)實(shí)際上時(shí)java語(yǔ)言的一種語(yǔ)法糖果覆,java語(yǔ)言中的泛型實(shí)現(xiàn)方法稱(chēng)為類(lèi)型擦除,基于這種方法實(shí)現(xiàn)的泛型稱(chēng)為偽泛型
由于java泛型引入的所產(chǎn)生的影響和新的需求斑响,因此,JCP組織對(duì)虛擬機(jī)規(guī)范做出了相應(yīng)的修改恋捆,引入了諸如Signature、LocalVariableTypeTable等新屬性用于解決伴隨泛型而來(lái)的參數(shù)類(lèi)型的識(shí)別問(wèn)題
自動(dòng)裝箱沸停、拆箱與遍歷循環(huán)
自動(dòng)裝箱、自動(dòng)拆箱與遍歷循環(huán)這些語(yǔ)法糖是java語(yǔ)言里使用得最多的語(yǔ)法糖
條件編譯
條件編譯也是java語(yǔ)言的一種語(yǔ)法糖瘟滨,根據(jù)布爾常量值的真假能颁,編譯器將會(huì)把分支中不成立的代碼塊消除掉
其它語(yǔ)法糖
除了泛型晋涣、自動(dòng)裝箱蛀恩、自動(dòng)拆箱镜硕、循環(huán)遍歷、可變參數(shù)和條件編譯外兴枯,java語(yǔ)言還有不少其他的語(yǔ)法糖,如內(nèi)部類(lèi)悠夯、枚舉類(lèi)躺坟、斷言語(yǔ)句、對(duì)枚舉和字符串的switch支持瞳氓、try語(yǔ)句中定義和關(guān)閉資源等