PHP執(zhí)行原理**
php是一門應(yīng)用非常簡(jiǎn)單扼仲,開(kāi)發(fā)效率極高的一門語(yǔ)言寺董,其弱類型的變量能省去程序員大量的定義變量菊值、類型轉(zhuǎn)換等的時(shí)間和精力外驱。它是一種適用于web開(kāi)發(fā)的動(dòng)態(tài)語(yǔ)言育灸。
1. php設(shè)計(jì)的原理和特點(diǎn)
- 多進(jìn)程模型:這樣能做到進(jìn)程間互相不受影響,對(duì)于進(jìn)程的資源利用更快速昵宇、便捷
- 弱類型語(yǔ)言:和強(qiáng)類型語(yǔ)言C磅崭、C++、java等語(yǔ)言不同瓦哎,php中變量的類型并不是一開(kāi)始就確定的砸喻,他是在運(yùn)行時(shí)才確定的,可以隱式或顯式的對(duì)其進(jìn)行類型轉(zhuǎn)換蒋譬,這就使其在開(kāi)發(fā)中非常的靈活割岛,程序員無(wú)需關(guān)注變量類型的問(wèn)題
- Zend引擎+ 組件(ext)的模式降低內(nèi)部的耦合
- 中間層(sapi)隔絕web server 和php
- 語(yǔ)法簡(jiǎn)單靈活,規(guī)范少犯助。這一點(diǎn)就有利有弊了癣漆。。剂买。
2. php的四層體系
php從上到下一共四層體系:
- Zend引擎:Zend整體用C實(shí)現(xiàn)惠爽,是php的內(nèi)核部分,它將php的代碼翻譯成可執(zhí)行的opcode的瞬哼,處理并實(shí)現(xiàn)相應(yīng)的處理方法(原理:鳥(niǎo)哥的博客)婚肆、實(shí)現(xiàn)了基本的數(shù)據(jù)結(jié)構(gòu)、內(nèi)存分配及管理坐慰、提供了相應(yīng)api方法供外部使用较性,是一切的核心。
- Extensions:圍繞著Zend引擎讨越,extensions通過(guò)組件的方式提供各種基礎(chǔ)服務(wù)两残,常用的內(nèi)置函數(shù)array、標(biāo)準(zhǔn)庫(kù)等都是通過(guò)extension來(lái)實(shí)現(xiàn)的把跨,用戶也可以根據(jù)需要實(shí)現(xiàn)自己的extension以達(dá)到功能擴(kuò)展等目的如貼吧正在使用的 PHP中間層人弓、富文本解析就是extension的典型應(yīng)用)。
- Sapi:Sapi全稱Server Application Programing Interface着逐, 也就是服務(wù)端應(yīng)用編程接口崔赌,Sapi通過(guò)一些列鉤子函數(shù),使php可以和外圍交互數(shù)據(jù)耸别,這是PHP非常優(yōu)雅和成功的一個(gè)設(shè)計(jì)健芭,通過(guò) sapi成功的將PHP本身和上層應(yīng)用解耦隔離,PHP可以不再考慮如何針對(duì)不同應(yīng)用進(jìn)行兼容秀姐,而應(yīng)用本身也可以針對(duì)自己的特點(diǎn)實(shí)現(xiàn)不同的處理方式慈迈。
- 上層應(yīng)用:這就是程序員編寫的應(yīng)用程序,通過(guò)不同的sapi方式得到各種各樣的應(yīng)用模式省有,如通過(guò)webserver實(shí)現(xiàn)web應(yīng)用痒留,在命令行下以腳本的方式運(yùn)行等等
3. Sapi
如前所屬谴麦,Sapi通過(guò)一些列的接口,使外部應(yīng)用可以和php交換數(shù)據(jù)并可以根據(jù)不同的應(yīng)用特點(diǎn)實(shí)現(xiàn)特定的處理方法伸头,常見(jiàn)的sapi有:
- apache2handler:以apache作為webserver匾效,采用MOD_PHP模式運(yùn)行時(shí)候的處理方式,也是現(xiàn)在應(yīng)用最廣泛的一種
- cgi:這是webserver和php的另外一種交互方式恤磷,也就是fastcgi協(xié)議
- cli:命令調(diào)試應(yīng)用模式
4. php代碼的執(zhí)行流程
從圖中可以看出面哼,php通過(guò)Zend引擎實(shí)現(xiàn)了一個(gè)典型的動(dòng)態(tài)語(yǔ)言的執(zhí)行過(guò)程:獲取一段代碼片段,經(jīng)過(guò)詞法解析扫步、語(yǔ)法解析等階段魔策,源程序被翻譯成一個(gè)個(gè)指令(opcodes),然后Zend虛擬機(jī)順序執(zhí)行這些指令锌妻。PHP本身是用C語(yǔ)言實(shí)現(xiàn)的代乃,因此最終調(diào)用的也是C語(yǔ)言的函數(shù)。
PHP的執(zhí)行的核心是翻譯出來(lái)的一條一條指令仿粹,也即opcode
Opcode是PHP程序執(zhí)行的最基本單位。一個(gè)opcode由兩個(gè)參數(shù)(op1,op2)原茅、返回值和處理函數(shù)組成吭历。PHP程序最終被翻譯為一組opcode處理函數(shù)的順序執(zhí)行。
常用的幾個(gè)函數(shù):
- END_ASSIGN_SPEC_CV_CV_HANDLER : 變量分配 ( a=b)
- ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER:函數(shù)調(diào)用
- ZEND_CONCAT_SPEC_CV_CV_HANDLER:字符串拼接 a.b
- ZEND_ADD_SPEC_CV_CONST_HANDLER: 加法運(yùn)算a+2
- ZEND_IS_EQUAL_SPEC_CV_CONST:判斷相等 a==1
- ZEND_IS_IDENTICAL_SPEC_CV_CONST:判斷相等 a===1
5. Zend引擎介紹
Zend引擎作為php的內(nèi)核擂橘,主要的設(shè)計(jì)機(jī)制有:
5.1 實(shí)現(xiàn)HashTable數(shù)據(jù)結(jié)構(gòu)
HashTable是Zend的核心數(shù)據(jù)結(jié)構(gòu)晌区,在php里面幾乎用來(lái)實(shí)現(xiàn)所有功能,php的數(shù)據(jù)array()就是典型的應(yīng)用通贞。此外在Zend內(nèi)部朗若,如函數(shù)符號(hào)表、全景變量都是通過(guò)HashTable來(lái)實(shí)現(xiàn)的昌罩。
Zend hash table 實(shí)現(xiàn)了典型的hash表散列結(jié)構(gòu)哭懈,同時(shí)通過(guò)附加一個(gè)雙向鏈表,提供了正向茎用、反向遣总、遍歷數(shù)組的功能,結(jié)構(gòu)如圖:
可以看到轨功,在hash table中既有key->value形式的散列結(jié)構(gòu)旭斥,也有雙向鏈表模式,使得它能夠非常方便的支持快速查找和線性遍歷古涧。
** 散列結(jié)構(gòu)**:Zend的散列結(jié)構(gòu)是典型的hash表模型垂券,通過(guò)鏈表的方式來(lái)解決沖突。需要注意的是zend的hash table是一個(gè)自增長(zhǎng)的數(shù)據(jù)結(jié)構(gòu)羡滑,當(dāng)hash表數(shù)目滿了之后菇爪,其本身會(huì)動(dòng)態(tài)以2倍的方式擴(kuò)容并重新元素位置算芯。初始大小均為8。另外娄帖,在進(jìn)行 key->value快速查找時(shí)候也祠,zend本身還做了一些優(yōu)化,通過(guò)空間換時(shí)間的方式加快速度近速。比如在每個(gè)元素中都會(huì)用一個(gè)變量 nKeyLength標(biāo)識(shí)key的長(zhǎng)度以作快速判定诈嘿。
雙向鏈表:Zend hash table通過(guò)一個(gè)鏈表結(jié)構(gòu),實(shí)現(xiàn)了元素的線性遍歷削葱。理論上奖亚,做遍歷使用單向鏈表就夠了,之所以使用雙向鏈表析砸,主要目的是為了快速刪除昔字,避免遍歷。 Zend hash table是一種復(fù)合型的結(jié)構(gòu)首繁,作為數(shù)組使用時(shí)作郭,即支持常見(jiàn)的關(guān)聯(lián)數(shù)組也能夠作為順序索引數(shù)字來(lái)使用,甚至允許2者的混合弦疮。
PHP關(guān)聯(lián)數(shù)組:關(guān)聯(lián)數(shù)組是典型的hash_table應(yīng)用夹攒。一次查詢過(guò)程經(jīng)過(guò)如下幾步(從代碼可以看出,這是一個(gè)常見(jiàn)的hash查詢過(guò)程并增加一些快速判定加速查找):
01 getKeyHashValue h;
02 index = n & nTableMask;
03 Bucket *p = arBucket[index];
04 while (p) {
05 if ((p->h == h) && (p->nKeyLength == nKeyLength)) {
06 RETURN p->data;
07 }
08 p=p->next;
09 }
10 RETURN FALTURE;
PHP索引數(shù)組:索引數(shù)組就是我們常見(jiàn)的數(shù)組胁塞,通過(guò)下標(biāo)訪問(wèn)咏尝。例如 arr[0],Zend HashTable內(nèi)部進(jìn)行了歸一化處理啸罢,對(duì)于index類型key同樣分配了hash值和nKeyLength(為0)编检。內(nèi)部成員變量 nNextFreeElement就是當(dāng)前分配到的最大id,每次push后自動(dòng)加一扰才。正是這種歸一化處理允懂,PHP才能夠?qū)崿F(xiàn)關(guān)聯(lián)和非關(guān)聯(lián)的混合。由于 push操作的特殊性训桶,索引key在PHP數(shù)組中先后順序并不是通過(guò)下標(biāo)大小來(lái)決定累驮,而是由push的先后決定。例如 arr[1] = 2; arr[2] = 3;對(duì)于double類型的key舵揭,Zend HashTable會(huì)將他當(dāng)做索引key處理
5.2 PHP變量的實(shí)現(xiàn)原理
PHP是一門弱類型語(yǔ)言谤专,不嚴(yán)格區(qū)分變量的類型。PHP的變量可以分為簡(jiǎn)單類型(int午绳、sting置侍、bool)、集合類型(array, resource, object) 和常量(const),所有的變量在底層都所以同一種結(jié)構(gòu)zval
zval是zend中非常重要的數(shù)據(jù)結(jié)構(gòu)蜡坊,用來(lái)標(biāo)示并實(shí)現(xiàn)php的變量杠输,其數(shù)據(jù)結(jié)構(gòu)如下:
struct _zval_struct {
zvalue_value value; /* value */
zend_uint refcount__gc; /* variable ref count */
zend_uchar type; /* active type */
zend_uchar is_ref__gc; /* if it is a ref variable */
};
typedef struct _zval_struct zval;
其中,
- zval_value value是變量的實(shí)際值秕衙,具體來(lái)說(shuō)是一個(gè)zvalue_value聯(lián)合體:
typedef union _zvalue_value {
long lval; /* long value */
double dval; /* double value */
struct { /* string */
char *val;
int len;
} str;
HashTable *ht; /* hash table value,used for array */
zend_object_value obj; /* object */
} zvalue_value;
- zend_uint refcount__gc是一個(gè)計(jì)數(shù)器蠢甲,用來(lái)保存多少變量(或者符號(hào),symbols )指向了該zval据忘。在變量生成時(shí)鹦牛,其refcount=1,典型的賦值操作如$a = $b會(huì)令zval的refcount加1勇吊,而unset操作會(huì)相應(yīng)的減1曼追。在PHP5.3之前,使用引用計(jì)數(shù)的機(jī)制來(lái)實(shí)現(xiàn)GC汉规,如果一個(gè)zval的refcount較少到0礼殊,那么Zend引擎會(huì)認(rèn)為沒(méi)有任何變量指向該zval,因此會(huì)釋放該zval所占的內(nèi)存空間针史。但晶伦,事情有時(shí)并不會(huì)那么簡(jiǎn)單。后面我們會(huì)看到啄枕,單純的引用計(jì)數(shù)機(jī)制無(wú)法GC掉循環(huán)引用的zval坝辫,即使指向該zval的變量已經(jīng)被unset,從而導(dǎo)致了內(nèi)存泄露(Memory Leak)射亏。
- zend_uchar type該字段用于表明變量的實(shí)際類型。PHP中的變量包括四種標(biāo)量類型(bool,int,float,string)竭业,兩種復(fù)合類型(array, object)和兩種特殊的類型(resource 和NULL)智润。在zend內(nèi)部,這些類型對(duì)應(yīng)于下面的宏(代碼位置 phpsrc/Zend/zend.h)
#define IS_NULL 0
#define IS_LONG 1
#define IS_DOUBLE 2
#define IS_BOOL 3
#define IS_ARRAY 4
#define IS_OBJECT 5
#define IS_STRING 6
#define IS_RESOURCE 7
#define IS_CONSTANT 8
#define IS_CONSTANT_ARRAY 9
#define IS_CALLABLE 10
- is_ref__gc這個(gè)字段用于標(biāo)記變量是否是引用變量未辆。對(duì)于普通的變量窟绷,該值為0,而對(duì)于引用型的變量咐柜,該值為1兼蜈。這個(gè)變量會(huì)影響zval的共享、分離等
5.2.1 整數(shù)拙友、浮點(diǎn)數(shù)變量
整數(shù)为狸、浮點(diǎn)數(shù)是PHP中的基礎(chǔ)類型之一,也是一個(gè)簡(jiǎn)單型變量遗契。對(duì)于整數(shù)和浮點(diǎn)數(shù)辐棒,在zvalue中直接存儲(chǔ)對(duì)應(yīng)的值。其類型分別是long和double。
從zvalue結(jié)構(gòu)中可以看出漾根,對(duì)于整數(shù)類型泰涂,和c等強(qiáng)類型語(yǔ)言不同,PHP是不區(qū)分int辐怕、unsigned int逼蒙、long、long long等類型的寄疏,對(duì)它來(lái)說(shuō)是牢,整數(shù)只有一種類型也就是long。由此赁还,可以看出妖泄,在PHP里面,整數(shù)的取值范圍是由編譯器位數(shù)來(lái)決定而不是固定不變的艘策。在php中如果整數(shù)越界了會(huì)發(fā)生什么蹈胡?php會(huì)自動(dòng)給整數(shù)轉(zhuǎn)換成浮點(diǎn)數(shù)類型
對(duì)于浮點(diǎn)數(shù),類似整數(shù)朋蔫,它也不區(qū)分float和double而是統(tǒng)一只有double一種類型
5.2.2 字符變量
和整數(shù)一樣罚渐,字符變量也是PHP中的基礎(chǔ)類型和簡(jiǎn)單型變量。通過(guò)zvalue結(jié)構(gòu)可以看出驯妄,在PHP中荷并,字符串是由由指向?qū)嶋H數(shù)據(jù)的指針和長(zhǎng)度結(jié) 構(gòu)體組成,這點(diǎn)和c++中的string比較類似青扔。由于通過(guò)一個(gè)實(shí)際變量表示長(zhǎng)度源织,和c不同,它的字符串可以是2進(jìn)制數(shù)據(jù)(包含\0)微猖,同時(shí)在PHP中谈息, 求字符串長(zhǎng)度strlen是O(1)操作
常見(jiàn)的字符串拼接方式及速度比較:
假設(shè)有如下4個(gè)變量:strA=‘123’; strB = ‘456’; intA=123; intB=456;
現(xiàn)在對(duì)如下的幾種字符串拼接方式做一個(gè)比較和說(shuō)明:
1 res = strA.strB和res = “strAstrB”
這種情況下,zend會(huì)重新malloc一塊內(nèi)存并進(jìn)行相應(yīng)處理凛剥,其速度一般侠仇。
2 strA = strA.strB
這種是速度最快的,zend會(huì)在當(dāng)前strA基礎(chǔ)上直接relloc犁珠,避免重復(fù)拷貝
3 res = intA.intB
這種速度較慢逻炊,因?yàn)樾枰鲭[式的格式轉(zhuǎn)換,實(shí)際編寫程序中也應(yīng)該注意盡量避免
4 strA = sprintf (“%s%s”,strA犁享,strB);
這會(huì)是最慢的一種方式余素,因?yàn)閟printf在PHP中并不是一個(gè)語(yǔ)言結(jié)構(gòu),本身對(duì)于格式識(shí)別和處理就需要耗費(fèi)比較多時(shí)間饼疙,另外本身機(jī)制也是malloc溺森。不過(guò)sprintf的方式最具可讀性慕爬,實(shí)際中可以根據(jù)具體情況靈活選擇。
5.2.3 數(shù)組變量
PHP的數(shù)組是通過(guò)Zend Hash Table來(lái)天然實(shí)現(xiàn)屏积。
foreach操作如何實(shí)現(xiàn)医窿?對(duì)一個(gè)數(shù)組的foreach就是通過(guò)遍歷hashtable中的雙向鏈表完成。對(duì)于索引數(shù)組炊林,通過(guò)foreach遍 歷效率比f(wàn)or高很多姥卢,省去了key->value的查找。count操作直接調(diào)用 HashTable->NumOfElements渣聚,O(1)操作独榴。對(duì)于’123’這樣的字符串,zend會(huì)轉(zhuǎn)換為其整數(shù)形 式奕枝。arr[‘123’]和arr[123]
5.3 PHP變量管理-引用計(jì)數(shù)和寫時(shí)拷貝
引用計(jì)數(shù)在內(nèi)存回收棺榔、字符串操作等地方使用非常廣泛。Zval的引用計(jì)數(shù)通過(guò)成員變量is_ref和ref_count實(shí)現(xiàn)隘道,通過(guò)引用計(jì)數(shù)症歇,多個(gè)變量可以共享同一份數(shù)據(jù)。避免頻繁拷貝帶來(lái)的大量消耗谭梗。在進(jìn)行賦值操作時(shí)忘晤,zend將變量指向相同的zval同時(shí)ref_count++,在unset操作時(shí)激捏,對(duì)應(yīng)的ref_count-1设塔。只有ref_count減為0時(shí)才會(huì)真正執(zhí)行銷毀操作。如果是引用賦值远舅,則zend會(huì)修改is_ref為1闰蛔。
PHP變量通過(guò)引用計(jì)數(shù)實(shí)現(xiàn)變量共享數(shù)據(jù),那如果改變其中一個(gè)變量值呢图柏?當(dāng)試圖寫入一個(gè)變量時(shí)钞护,Zend若發(fā)現(xiàn)該變量指向的zval被多個(gè)變量共享,則為其復(fù)制一份ref_count為1的zval爆办,并遞減原zval的refcount,這個(gè)過(guò)程稱為“zval分離”课梳【嗔荆可見(jiàn),只有在有寫操作發(fā)生時(shí) zend才進(jìn)行拷貝操作暮刃,因此也叫copy-on-write(寫時(shí)拷貝)
對(duì)于引用型變量跨算,其要求和非引用型相反,引用賦值的變量間必須是捆綁的椭懊,修改一個(gè)變量就修改了所有捆綁變量诸蚕。
5.4 PHP局部變量和全局變量的實(shí)現(xiàn):
PHP中的局部變量和全局變量是如何實(shí)現(xiàn)的?對(duì)于一個(gè)請(qǐng)求,任意時(shí)刻PHP都可以看到兩個(gè)符號(hào)表(symbol_table和 active_symbol_table)背犯,其中前者用來(lái)維護(hù)全局變量坏瘩。后者是一個(gè)指針,指向當(dāng)前活動(dòng)的變量符號(hào)表漠魏,當(dāng)程序進(jìn)入到某個(gè)函數(shù)中時(shí)倔矾,zend 就會(huì)為它分配一個(gè)符號(hào)表x同時(shí)將active_symbol_table指向a。通過(guò)這樣的方式實(shí)現(xiàn)全局柱锹、局部變量的區(qū)分哪自。
獲取變量值:PHP的符號(hào)表是通過(guò)hash_table實(shí)現(xiàn)的,對(duì)于每個(gè)變量都分配唯一標(biāo)識(shí)禁熏,獲取的時(shí)候根據(jù)標(biāo)識(shí)從表中找到相應(yīng)zval返回壤巷。
函數(shù)中使用全局變量:在函數(shù)中,我們可以通過(guò)顯式申明global來(lái)使用全局變量瞧毙。在active_symbol_table中創(chuàng)建symbol_table中同名變量的引用(引用變量的值要更新大家會(huì)一起更新)胧华,如果symbol_table中沒(méi)有同名變量則會(huì)先創(chuàng)建。
參考: