序言
不同于C/C++,像Python這樣的語言是不需要程序員寫代碼來管理內(nèi)存的益涧,它的GC(Garbage Collection)機(jī)制 實(shí)現(xiàn)了自動內(nèi)存管理。GC做的事情就是解放程序員的雙手驯鳖,找出內(nèi)存中不用的資源并釋放這塊內(nèi)存闲询。 下面我們來看看Python的GC是怎么做的:
Python自帶的解釋器CPython主要使用了三種垃圾回收機(jī)制(引用計數(shù)為主,標(biāo)記-清除和分代回收為輔):
- 引用計數(shù)
- 標(biāo)記清除
- 分代回收
下面讓我們分別了解下這幾種機(jī)制:
引用計數(shù)
引用計數(shù)法Reference Counting的原理是浅辙,每個對象都維護(hù)一個引用計數(shù)字段扭弧,記錄這個對象被引用的次數(shù)(如果不清楚變量->引用->對象 的問題,可以查看這篇文章Python的深拷貝和淺拷貝),如果有新的引用指向?qū)ο蠹怯撸瑢ο笠糜嫈?shù)就加一鸽捻,引用被銷毀時,對象引用計數(shù)減一泽腮,當(dāng)用戶的引用計數(shù)為0時御蒲,該內(nèi)存被釋放∈⒄可以通過sys.getrefcount()
函數(shù)查看對象被引用的個數(shù)删咱。
這種方法主要存在兩種問題:
- 需要去維護(hù)引用計數(shù),存在執(zhí)行效率問題
- 無法解決循環(huán)引用問題
所謂循環(huán)引用就是:有一組對象的引用計數(shù)不為0豪筝,但是這組對象實(shí)際上并沒有被變量引用,它們之間是相互引用摘能,而且也不會有其他的變量再去引用這組對象续崖,最終導(dǎo)致如果使用 引用計數(shù)法 這些對象占用的內(nèi)存永遠(yuǎn)不會被釋放。
寫一段代碼舉個例子:
In [23]: a = []
In [24]: b = []
In [25]: a.append(b)
In [26]: b.append(a)
In [27]: a
Out[27]: [[[...]]]
In [28]: b
Out[28]: [[[...]]]
可以看到团搞,現(xiàn)在a
b
都出現(xiàn)了循環(huán)引用严望,此時就算使用del
語句刪除變量,被使用的內(nèi)存也不會被回收逻恐,所以就需要第二種GC機(jī)制:
標(biāo)記清除
標(biāo)記清除Mark-Sweep是針對循環(huán)引用問題的回收機(jī)制像吻,作用的對象是容器類型的對象(比如:list、set复隆、dict等)拨匆。
原理是:通過根節(jié)點(diǎn)對象(不會被刪除的對象)對有向圖把所有活動對象打上標(biāo)記,然后回收沒有被標(biāo)記的非活動對象挽拂。
分代回收
分代回收是建立在標(biāo)記清除基礎(chǔ)上的一種輔助回收容器對象的GC機(jī)制惭每。 無論開發(fā)的程序類型如何,規(guī)模如何亏栈,都有這樣的相同之處:一些比例的內(nèi)存生存周期都很短台腥,而另一些內(nèi)存的生存周期比較長宏赘,可能會伴隨著整個程序的開始和結(jié)束。 所以分代回收就根據(jù)系統(tǒng)中內(nèi)存存活時間把它們劃分成不同的集合:一共分成三個集合黎侈,每個集合稱為一個代察署。 它們的垃圾收集頻率 隨 對象 存活存活時間的增大 而 減小。也就是說:對于存活時間越長的對象峻汉,就越不可能是垃圾贴汪,減少對其的收集頻率。而新創(chuàng)建的對象都在第一代俱济,第一代集合總數(shù)達(dá)到上限后嘶是,會觸發(fā)GC機(jī)制:可以回收的對象所占的內(nèi)存被釋放,不能被回收的移到中年代蛛碌。