要想研究一個世界竖瘾,要從宏觀和微觀兩個角度來看沟突。研究php也是一樣的。直接寫php代碼算是從宏觀角度去研究了php捕传,而從微觀角度開始研究php惠拭,自然就要從zval開始了。
如果把php比作一個世界的話庸论,zval可以算是這個世界的原子了职辅。它是php變量的實際存儲單元,貫通了整個php的世界聂示。
zval是在Zend2中引入的域携,后來在php7中,zval的結(jié)構(gòu)做了擴展鱼喉。不過這次主要研究的是php5的zval秀鞭,php7的有機會再研究。
首先拉下來一份php的源碼(https://github.com/php/php-src)扛禽。切到分支PHP-5.6.26锋边,打開Zend/zend_types.h,在55行能看到如下代碼:
而在Zend/zend.h的334行编曼,能看到_zval_struct的定義豆巨。
可以看出,zval這個結(jié)構(gòu)體有4個部分掐场,value保存了具體的值往扔,而type則指明了這個具體值的類型。refcount__gc和is_ref__gc從名字能看出跟gc有關(guān)熊户,但其實他們不僅僅是跟gc有關(guān)萍膛,還有更重要的用途。
is_ref__gc說明了這個zval是否被是引用的嚷堡。而refcount__gc說明了有幾個變量是這個值:比如有兩個變量都是一樣的值卦羡,那么在底層這兩個變量指向的都是同一個zval,然后refcount__gc會被設(shè)為2。如果有三個變量都指向這個值绿饵,那么refcount__gc就是3欠肾。如果其中一個變量發(fā)生變化的話,才會建立新的zval拟赊,原來的zval的refcount__gc減1刺桃。這種機制就是寫時復(fù)制,copy-on-write吸祟。
上面是zvalue_value的定義瑟慈,這是個union。它可以被解讀為長整數(shù)屋匕,雙精度浮點數(shù)葛碧,一個字符串指針和相應(yīng)的字符串長度,hashtable指針过吻,php對象或者是php常量的表達式抽象樹进泼。具體采用哪種解讀,則是看zval結(jié)構(gòu)體的type字段纤虽。
接下來要隆重介紹一個壓箱底的函數(shù)乳绕,它可以查看每個變量的zval:debug_zval_dump()。配合這個函數(shù)逼纸,我們可以看看refcount__gc是怎么變化的洋措。
這段代碼的結(jié)果如下:
我們來一個個分析。
首先是上面的$a杰刽、$b和$c菠发,它們的refcount都是4,明明只有三個變量但為啥是4呢贺嫂?其實除了它們3個自身之外滓鸠,在函數(shù)調(diào)用傳值時也復(fù)制了一次變量,所以在3個之外還得加1涝婉,也就成了4哥力。
而中間的三個怎么又變成了3蔗怠、3墩弯、2呢?簡單想想就能發(fā)現(xiàn)寞射,因為發(fā)生了寫時復(fù)制渔工,建立了新的zval給了$c,所以它的refcount成了1桥温,傳入函數(shù)變成了2引矩。而$a和$b指向的zval少了$c,自然refcount就會減1了。
至于最后三個旺韭,$d成了$a的引用氛谜,需要改寫zval的is_ref為1,于是發(fā)生了寫時復(fù)制区端,所以$b的zval的refcount再次減1值漫。而$a和$d都指向同一個zval,而且它們是引用就不再發(fā)生寫時復(fù)制织盼,自然refcount就保持在了1杨何。
大概zval就介紹完了,其實很簡單沥邻。但是有個思考題:
相信你這么聰明危虱,應(yīng)該能想明白為啥改了$c[1],$a[1]也發(fā)生了變化了吧唐全?