目前編程語言可以分為兩大類:
第一類是像C/C++捻撑, .NET, Java之類的編譯型語言番捂, 它們的共性是: 運行之前必須對源代碼進行編譯江解,然后運行編譯后的目標文件设预。
第二類比如:PHP犁河, Javascript, Ruby桨螺, Python這些解釋型語言, 他們都無需經(jīng)過編譯即可"運行"魏烫,雖然可以理解為直接運行,
但它們并不是真的直接就被能被機器理解则奥, 機器只能理解機器語言,那這些語言是怎么被執(zhí)行的呢读处, 一般這些語言都需要一個解釋器, 由解釋器來執(zhí)行這些源碼井辜, 實際上這些語言還是會經(jīng)過編譯環(huán)節(jié)管闷, 只不過它們一般會在運行的時候實時進行編譯粥脚。為了效率包个,并不是所有語言在每次執(zhí)行的時候都會重新編譯一遍, 比如PHP的各種opcode緩存擴展(如APC碧囊, xcache, eAccelerator等)天通,比如Python會將編譯的中間文件保存成pyc/pyo文件熄驼, 避免每次運行重新進行編譯所帶來的性能損失。
PHP的腳本的執(zhí)行也需要一個解釋器瓜贾, 比如命令行下的php程序,或者apache的mod_php模塊等等祭芦。 前一節(jié)提到了PHP的SAPI接口, 下面就以PHP命令行程序為例解釋PHP腳本是怎么被執(zhí)行的。 例如如下的這段PHP腳本:
<?php$str = "Hello, Tipi!\n";[echo](http://www.php.net/echo) $str;
假設上面的代碼保存在名為hello.php的文件中逊彭, 用PHP命令行程序執(zhí)行這個腳本:
$ php ./hello.php
這段代碼的輸出顯然是Hello, Tipi!侮叮, 那么在執(zhí)行腳本的時候PHP/Zend都做了些什么呢? 這些語句是怎么樣讓php輸出這段話的呢? 下面將一步一步的進行介紹审胸。
程序的執(zhí)行
如上例中, 傳遞給php程序需要執(zhí)行的文件砂沛, php程序完成基本的準備工作后啟動PHP及Zend引擎, 加載注冊的擴展模塊碍庵。
初始化完成后讀取腳本文件,Zend引擎對腳本文件進行詞法分析堰氓,語法分析苹享。然后編譯成opcode執(zhí)行。 如果安裝了apc之類的opcode緩存得问, 編譯環(huán)節(jié)可能會被跳過而直接從緩存中讀取opcode執(zhí)行。
腳本的編譯執(zhí)行
PHP在讀取到腳本文件后首先對代碼進行詞法分析椭赋,PHP的詞法分析器是通過lex生成的, 詞法規(guī)則文件在$PHP_SRC/Zend/zend_language_scanner.l宣蔚, 這一階段lex會會將源代碼按照詞法規(guī)則切分一個一個的標記(token)认境。PHP中提供了一個函數(shù)token_get_all()胚委, 該函數(shù)接收一個字符串參數(shù)叉信, 返回一個按照詞法規(guī)則切分好的數(shù)組。 例如將上面的php代碼作為參數(shù)傳遞給這個函數(shù):
<?php$code =<<<PHP_CODE<?php$str = "Hello, Tipi\n";echo $str;PHP_CODE; [var_dump](http://www.php.net/var_dump)([token_get_all](http://www.php.net/token_get_all)($code));
運行上面的腳本你將會看到一如下的輸出
0 =>
array (
0 => 368, // 腳本開始標記
1 => '<?php // 匹配到的字符串
',
2 => 1,
),
1 =>
array (
0 => 371,
1 => ' ',
2 => 2,
),
2 => '=',
3 =>
array (
0 => 371,
1 => ' ',
2 => 2,
),
4 =>
array (
0 => 315,
1 => '"Hello, Tipi
"',
2 => 2,
),
5 => ';',
6 =>
array (
0 => 371,
1 => '
',
2 => 3,
),
7 =>
array (
0 => 316,
1 => 'echo',
2 => 4,
),
8 =>
array (
0 => 371,
1 => ' ',
2 => 4,
),
9 => ';',```
這也是Zend引擎詞法分析做的事情硅急,將代碼切分為一個個的標記佳遂,然后使用語法分析器(PHP使用bison生成語法分析器, 規(guī)則見$PHP_SRC/Zend/zend_language_parser.y)丑罪, bison根據(jù)規(guī)則進行相應的處理凤壁, 如果代碼找不到匹配的規(guī)則跪另,也就是語法錯誤時Zend引擎會停止,并輸出錯誤信息免绿。 比如缺少括號,或者不符合語法規(guī)則的情況都會在這個環(huán)節(jié)檢查针姿。 在匹配到相應的語法規(guī)則后,Zend引擎還會進行編譯绞绒, 將代碼編譯為opcode榕暇, 完成后,Zend引擎會執(zhí)行這些opcode彤枢, 在執(zhí)行opcode的過程中還有可能會繼續(xù)重復進行編譯-執(zhí)行, 例如執(zhí)行eval缴啡,include/require等語句, 因為這些語句還會包含或者執(zhí)行其他文件或者字符串中的腳本秒咐。
例如上例中的echo語句會編譯為一條ZEND_ECHO指令, 執(zhí)行過程中携取,該指令由C函數(shù)zend_print_variable(zval* z)執(zhí)行帮孔,將傳遞進來的字符串打印出來。 為了方便理解文兢, 本例中省去了一些細節(jié),例如opcode指令和處理函數(shù)之間的映射關系等姆坚。 后面的章節(jié)將會詳細介紹。
如果想直接查看生成的Opcode烹俗,可以使用php的vld擴展查看萍程。擴展下載地址: [http://pecl.php.net/package/vld](http://pecl.php.net/package/vld)。Win下需要自己編譯生成dll文件茫负。
有關PHP腳本編譯執(zhí)行的細節(jié),請閱讀后面有關詞法分析忍法,語法分析及opcode編譯相關內(nèi)容。