新聞中心
本教程操作環(huán)境:windows7系統(tǒng)、php7.1版、DELL G3電腦

為灣里等地區(qū)用戶提供了全套網頁設計制作服務,及灣里網站建設行業(yè)解決方案。主營業(yè)務為成都網站設計、網站制作、灣里網站設計,以傳統(tǒng)方式定制建設網站,并提供域名空間備案等一條龍服務,秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!
在php中,gc全稱“Garbage Collection”,中文意思為“垃圾回收”,是一種動態(tài)內存管理機制。
垃圾回收機制(GC)會自動釋放程序不再需要的已分配的內存塊。自動回收內存的過程叫垃圾收集。
垃圾回收機制(GC)可以讓程序員不必過分關心程序內存分配,從而將更多的精力投入到業(yè)務邏輯。
在現(xiàn)在的流行各種語言當中,垃圾回收機制是新一代語言所共有的特征。
垃圾的產生
PHP7 中復雜類型,像字符串、數(shù)組、對象等的數(shù)據(jù)結構中,頭部都有一個 gc, 這個 gc 的作用就是用來對垃圾回收的支持。當變量賦值、傳遞時,會增加 value 的引用數(shù), unset、return 等釋放變量時再減掉引用數(shù),減掉后如果發(fā)現(xiàn) refcount 變?yōu)?0 則直接釋放 value,這是變量的基本回收過程。
不過有一種問題是這個機制無法解決的,就是循環(huán)引用的問題。
什么是循環(huán)引用呢? 簡單說就是變量的內部里存的 value 又引用了變量自身。 這種比較經常發(fā)生在數(shù)組和對象類型的變量上。
這里先講一下引用,即 zend_reference 這個類型,這個是 PHP7 新增的變量類型,當對變量使用 “&” 操作時,會創(chuàng)建新的中間結構體 zend_reference,這個結構體會真正的指向對應的 value 結構。
舉個例子:
// 當進行如下賦值操作時 $a = 'hello'; // $a -> zend_string $b = $a; // $b,$a -> zend_string $c = &$b; // $c,$b -> zval(type = IS_REFERENCE, refcount = 2) -> zend_string
最終會變成如下這樣:
即 $b 和 $c 的 zval 是通過中間結構體 zend_reference 再指向最終的 zend_string。
回到循環(huán)引用的問題,舉個數(shù)組循環(huán)引用例子:
$a = [1]; $a[] = &$a; unset($a);
使用 & 操作之后,變量 a 就變成了引用類型且引用計數(shù) refcount 為 2,而又賦值給自己里面的元素,即變量 a 變成了自己引用自己。
具體如下如所示:
當 unset 之后就變成下圖這樣:
即 $a 所在的 zval 類型已經變成了 IS_UNDEF 了,zend_reference 結構體的引用計數(shù)減 1,但是仍然大于 0,這時候,這部分結構體就變成了垃圾,對此不處理的話,就可能會造成內存泄露。這里就需要垃圾收集器將這部分收集到緩沖區(qū),之后進行回收處理。
回收過程
如果當變量的 refcount 減小后大于 0,PHP 并不會立即對這個變量進行垃圾鑒定和回收,而是放入一個緩沖區(qū)中,等這個緩沖區(qū)滿了以后 (10000 個值) 再統(tǒng)一進行處理,加入緩沖區(qū)的是變量 zend_value 里的 gc,目前垃圾只會出現(xiàn)在數(shù)組和對象兩種類型中,數(shù)組的情況上面已經介紹了,對象的情況則是成員屬性引用對象本身導致的,其它類型不會出現(xiàn)這種變量中的成員引用變量自身的情況,所以垃圾回收只會處理這兩種類型的變量。
gc 的結構 zend_refcounted_h 具體如下:
typedef struct _zend_refcounted_h {
uint32_t refcount; // 記錄 zend_value 的引用數(shù)
union {
struct {
zend_uchar type, // zend_value的類型, 與zval.u1.type一致
zend_uchar flags,
uint16_t gc_info // GC信息,記錄在 gc 池中的位置和顏色,垃圾回收的過程會用到
} v;
uint32_t type_info;
} u;
} zend_refcounted_h;
一個變量只能加入一次緩沖區(qū),為了防止重復加入,變量加入后會把 zend_refcounted_h.gc_info 置為 GC_PURPLE,即標為紫色,后續(xù)不會重復插入。
垃圾緩沖區(qū)是一個雙向鏈表,等到緩存區(qū)滿了以后則啟動垃圾檢查過程:遍歷緩沖區(qū),對當前變量的所有成員進行遍歷,然后把成員的 refcount 減 1 (如果成員還包含子成員則也進行遞歸遍歷,即深度優(yōu)先遍歷),最后再檢查當前變量的引用,如果減為了 0 則為垃圾。這個算法的原理核心是:垃圾是由于成員引用自身導致的,那么就對所有的成員減一遍引用,如果發(fā)現(xiàn)最后變量本身的 refcount 變?yōu)榱?0 則就表明其引用全部來自自身成員,即其他任何地方都不再使用它,那么它就是垃圾,需要被回收掉。反之說明不是垃圾,需要將其從緩沖區(qū)移出去。具體的過程如下:
(1) 從緩沖區(qū)鏈表的 roots 開始遍歷,把當前 value 標為灰色 (zend_refcounted_h.gc_info 置為 GC_GREY),然后對當前 value 的成員進行深度優(yōu)先遍歷,把成員 value 的 refcount 減 1,并且也標為灰色;
(2) 重復遍歷緩沖區(qū)鏈表,檢查當前 value 引用是否為 0,為 0 則表示確實是垃圾,把它標為白色 (GC_WHITE),如果不為 0 則排除了引用全部來自自身成員的可能,表示還有外部的引用,并不是垃圾,這時候因為步驟 (1) 對成員進行了 refcount 減 1 操作,需要再還原回去,對所有成員進行深度遍歷,把成員 refcount 加 1,同時標為黑色;
(3) 再次遍歷緩沖區(qū)鏈表,將非 GC_WHITE 的節(jié)點從 roots 鏈表中移出,最終 roots 鏈表中全部為真正的垃圾,最后將這些垃圾清除。
當前題目:php中gc是什么意思
本文路徑:http://fisionsoft.com.cn/article/cohciho.html


咨詢
建站咨詢
