本文轉(zhuǎn)自開源中國
超過十年以上,沒有比解釋器全局鎖(GIL)讓Python新手和專家更有挫折感或者更有好奇心卓研。
未解決的問題
隨處都是問題绍豁。難度大、耗時多肯定是其中一個問題驶悟。僅僅是嘗試解決這個問題就會讓人驚訝胡野。之前是整個社區(qū)的嘗試,但現(xiàn)在只是外圍的開發(fā)人員在努力痕鳍。對于新手硫豆,去嘗試解決這樣的問題,主要是因為問題難度足夠大笼呆,解決之后可以獲得相當(dāng)?shù)臉s譽熊响。計算機科學(xué)中未解決的 P = NP 就是這樣的問題。對此如果能給出多項式時間復(fù)雜度的答案抄邀,那簡直就可以改變世界了耘眨。Python最困難的問題比證明P = NP要容易一些昼榛,不過迄今仍然沒有一個滿意的解決境肾,要知道,這個問題的實用的解決方案同樣能起著變革性的作用胆屿。正因為如此奥喻,很容易看到Python社區(qū)會有如此多的人關(guān)注于這樣的問題: “對于解釋器全局鎖能做什么?”
Python的底層
要理解GIL的含義,我們需要從Python的基礎(chǔ)講起非迹。像C++這樣的語言是編譯型語言环鲤,所謂編譯型語言,是指程序輸入到編譯器憎兽,編譯器再根據(jù)語言的語法進(jìn)行解析冷离,然后翻譯成語言獨立的中間表示,最終鏈接成具有高度優(yōu)化的機器碼的可執(zhí)行程序纯命。編譯器之所以可以深層次的對代碼進(jìn)行優(yōu)化西剥,是因為它可以看到整個程序(或者一大塊獨立的部分)。這使得它可以對不同的語言指令之間的交互進(jìn)行推理亿汞,從而給出更有效的優(yōu)化手段瞭空。
與此相反,Python是解釋型語言。程序被輸入到解釋器來運行咆畏。解釋器在程序執(zhí)行之前對其并不了解南捂;它所知道的只是Python的規(guī)則,以及在執(zhí)行過程中怎樣去動態(tài)的應(yīng)用這些規(guī)則旧找。它也有一些優(yōu)化溺健,但是這基本上只是另一個級別的優(yōu)化。由于解釋器沒法很好的對程序進(jìn)行推導(dǎo)钦讳,Python的大部分優(yōu)化其實是解釋器自身的優(yōu)化矿瘦。更快的解釋器自然意味著程序的運行也能“免費”的更快。也就是說愿卒,解釋器優(yōu)化后缚去,Python程序不用做修改就可以享受優(yōu)化后的好處。
這一點很重要琼开,讓我們再強調(diào)一下易结。如果其他條件不變,Python程序的執(zhí)行速度直接與解釋器的“速度”相關(guān)柜候。不管你怎樣優(yōu)化自己的程序搞动,你的程序的執(zhí)行速度還是依賴于解釋器執(zhí)行你的程序的效率。這就很明顯的解釋了為什么我們需要對優(yōu)化Python解釋器做這么多的工作了渣刷。對于Python程序員來說鹦肿,這恐怕是與免費午餐最接近的了。
免費午餐結(jié)束了
還是沒有結(jié)束辅柴?摩爾定律給出了硬件速度會按照確定的時間周期增長箩溃,與此同時,整整一代程序員學(xué)會了如何編碼碌嘀。如果一個人寫了比較慢的代碼涣旨,最簡單的結(jié)果通常是更快的處理器去等待代碼的執(zhí)行。顯然股冗,摩爾定律仍然是正確的霹陡,并且還會在很長一段時間生效,不過它提及的方式有了根本的變化止状。并非是時鐘頻率增長到一個高不可攀的速度烹棉,而是通過多核來利用晶體管密度提高帶來的好處。在新處理器上運行的程序要想充分利用其性能怯疤,必須按照并發(fā)方式進(jìn)行重寫浆洗。
大部分開發(fā)者聽到“并發(fā)”通常會立刻想到多線程的程序。目前來說旅薄,多線程執(zhí)行還是利用多核系統(tǒng)最常用的方式辅髓。盡管多線程編程大大好于“順序”編程泣崩,不過即便是仔細(xì)的程序員也沒法在代碼中將并發(fā)性做到最好。編程語言在這方面應(yīng)該做的更好洛口,大部分應(yīng)用廣泛的現(xiàn)代編程語言都會支持多線程編程矫付。
意外的事實
現(xiàn)在我們來看一下問題的癥結(jié)所在。要想利用多核系統(tǒng)第焰,Python必須支持多線程運行买优。作為解釋型語言,Python的解釋器必須做到既安全又高效挺举。我們都知道多線程編程會遇到的問題杀赢。解釋器要留意的是避免在不同的線程操作內(nèi)部共享的數(shù)據(jù)。同時它還要保證在管理用戶線程時保證總是有最大化的計算資源湘纵。
那么脂崔,不同線程同時訪問時,數(shù)據(jù)的保護機制是怎樣的呢梧喷?答案是解釋器全局鎖砌左。從名字上看能告訴我們很多東西,很顯然铺敌,這是一個加在解釋器上的全局(從解釋器的角度看)鎖(從互斥或者類似角度看)汇歹。這種方式當(dāng)然很安全,但是它有一層隱含的意思(Python初學(xué)者需要了解這個):對于任何Python程序偿凭,不管有多少的處理器产弹,任何時候都總是只有一個線程在執(zhí)行。
許多人都是偶然發(fā)現(xiàn)這個事實的弯囊。網(wǎng)上的很多討論組和留言板都充斥著來自Python初學(xué)者和專家的類似這樣的問題——”為什么我全新的多線程Python程序運行得比其只有一個線程的時候還要慢痰哨?“許多人在問這個問題時還是非常犯暈的,因為顯然一個具有兩個線程的程序要比其只有一個線程時要快(假設(shè)該程序確實是可并行的)常挚。事實上作谭,這個問題被問得如此頻繁以至于Python的專家們精心制作了一個標(biāo)準(zhǔn)答案:”不要使用多線程稽物,請使用多進(jìn)程奄毡。“但這個答案比那個問題更加讓人困惑贝或。難道我不能在Python中使用多線程吼过?在Python這樣流行的一個語言中使用多線程究竟是有多糟糕,連專家都建議不要使用咪奖。難道我真的漏掉了一些東西盗忱?
很遺憾,沒有任何東西被漏掉羊赵。由于Python解釋器的設(shè)計趟佃,使用多線程以提高性能應(yīng)該算是一個困難的任務(wù)扇谣。在最壞的情況下,它將會降低(有時很明顯)你的程序的運行速度闲昭。一個計算機科學(xué)與技術(shù)專業(yè)的大學(xué)生新手可能會告訴你當(dāng)多個線程都在競爭一個共享資源時將會發(fā)生什么罐寨。結(jié)果通常不會非常理想。很多情況下多線程都能很好地工作序矩,可能對于解釋器的實現(xiàn)和內(nèi)核開發(fā)人員來說鸯绿,沒有關(guān)于Python多線程性能的過多抱怨。
現(xiàn)在該怎么辦簸淀?驚慌瓶蝴?
那么,這又能怎樣租幕?問題解決了嗎舷手?難道我們作為Python開發(fā)人員就意味著要放棄使用多線程來探索并行的想法了?為什么無論怎樣劲绪,GIL需要保證只有一個線程在某一時刻處于運行中聚霜?難道不可以添加細(xì)粒度的鎖來阻止多個獨立對象的同時訪問?并且為什么之前沒有人去嘗試過類似的事情珠叔?
這些實用的問題有著十分有趣的回答蝎宇。GIL對諸如當(dāng)前線程狀態(tài)和為垃圾回收而用的堆分配對象這樣的東西的訪問提供著保護。然而祷安,這對Python語言來說沒什么特殊的姥芥,它需要使用一個GIL。這是該實現(xiàn)的一種典型產(chǎn)物』惚蓿現(xiàn)在也有其它的Python解釋器(和編譯器)并不使用GIL凉唐。雖然,對于CPython來說霍骄,自其出現(xiàn)以來已經(jīng)有很多不使用GIL的解釋器台囱。
那么為什么不拋棄GIL呢?許多人也許不知道读整,在1999年簿训,針對Python 1.5,一個經(jīng)常被提到但卻不怎么理解的“free threading”補丁已經(jīng)嘗試實現(xiàn)了這個想法米间,該補丁來自Greg Stein强品。在這個補丁中,GIL被完全的移除屈糊,且用細(xì)粒度的鎖來代替的榛。然而,GIL的移除給單線程程序的執(zhí)行速度帶來了一定的代價逻锐。當(dāng)用單線程執(zhí)行時夫晌,速度大約降低了40%雕薪。使用兩個線程展示出了在速度上的提高,但除了這個提高晓淀,這個收益并沒有隨著核數(shù)的增加而線性增長蹦哼。由于執(zhí)行速度的降低,這一補丁被拒絕了要糊,并且?guī)缀醣蝗诉z忘纲熏。
移除GIL非常困難,讓我們?nèi)ベ徫锇桑?/p>
(譯者注:XXX is hard. Let’s go shopping!在英語中類似于中文的咆哮體锄俄。其隱含意思為想成功完成某件事情非常困難局劲,我們?nèi)ブ苯訉ふ业谌降漠a(chǎn)品替代吧。)
不過奶赠,“free threading”這個補丁是有啟發(fā)性意義的鱼填,其證明了一個關(guān)于Python解釋器的基本要點:移除GIL是非常困難的。由于該補丁發(fā)布時所處的年代毅戈,解釋器變得依賴更多的全局狀態(tài)苹丸,這使得想要移除當(dāng)今的GIL變得更加困難。值得一提的是苇经,也正是因為這個原因赘理,許多人對于嘗試移除GIL變得更加有興趣。困難的問題往往很有趣扇单。
但是這可能有點被誤導(dǎo)了商模。讓我們考慮一下:如果我們有了一個神奇的補丁,其移除了GIL蜘澜,并且沒有對單線程的Python代碼產(chǎn)生性能上的下降施流,那么什么事情將會發(fā)生?我們將會獲得我們一直想要的:一個線程API可能會同時利用所有的處理器鄙信。那么現(xiàn)在瞪醋,我們已經(jīng)獲得了我們希望的,但這確實是一個好事嗎装诡?
基于線程的編程毫無疑問是困難的银受。每當(dāng)某個人覺得他了解關(guān)于線程是如何工作的一切的時候,總是會悄無聲息的出現(xiàn)一些新的問題慎王。因為在這方面想要得到正確合理的一致性真的是太難了蚓土,因此有一些非常知名的語言設(shè)計者和研究者已經(jīng)總結(jié)得出了一些線程模型宏侍。就像某個寫過多線程應(yīng)用的人可以告訴你的一樣赖淤,不管是多線程應(yīng)用的開發(fā)還是調(diào)試都會比單線程的應(yīng)用難上數(shù)倍。程序員通常所具有的順序執(zhí)行的思維模恰恰就是與并行執(zhí)行模式不相匹配谅河。GIL的出現(xiàn)無意中幫助了開發(fā)者免于陷入困境咱旱。在使用多線程時仍然需要同步原語的情況下确丢,GIL事實上幫助我們保持不同線程之間的數(shù)據(jù)一致性問題。
那么現(xiàn)在看起來討論Python最難得問題是有點問錯了問題吐限。我們有非常好的理由來說明為什么Python專家推薦我們使用多進(jìn)程代替多線程鲜侥,而不是去試圖隱藏Python線程實現(xiàn)的不足。更進(jìn)一步诸典,我們鼓勵開發(fā)者使用更安全更直接的方式實現(xiàn)并發(fā)模型描函,同時保留使用多線程進(jìn)行開發(fā)除非你覺的真的非常必要的話。對于大多數(shù)人來說什么是最好的并行編程模型可能并不是十分清楚狐粱。但是目前我們清楚的是多線程的方式可能并不是最好的舀寓。
至于GIL,不要認(rèn)為它在那的存在就是靜態(tài)的和未經(jīng)分析過的肌蜻。Antoine Pitrou 在Python 3.2中實現(xiàn)了一個新的GIL互墓,并且?guī)е恍┓e極的結(jié)果。這是自1992年以來蒋搜,GIL的一次最主要改變篡撵。這個改變非常巨大,很難在這里解釋清楚豆挽,但是從一個更高層次的角度來說育谬,舊的GIL通過對Python指令進(jìn)行計數(shù)來確定何時放棄GIL。這樣做的結(jié)果就是帮哈,單條Python指令將會包含大量的工作斑司,即它們并沒有被1:1的翻譯成機器指令。在新的GIL實現(xiàn)中但汞,用一個固定的超時時間來指示當(dāng)前的線程以放棄這個鎖宿刮。在當(dāng)前線程保持這個鎖,且當(dāng)?shù)诙€線程請求這個鎖的時候私蕾,當(dāng)前線程就會在5ms后被強制釋放掉這個鎖(這就是說僵缺,當(dāng)前線程每5ms就要檢查其是否需要釋放這個鎖)。當(dāng)任務(wù)是可行的時候踩叭,這會使得線程間的切換更加可預(yù)測磕潮。
然而,這并不是一個完美的改變容贝。對于在各種類型的任務(wù)上有效利用GIL這個領(lǐng)域里自脯,最活躍的研究者可能就是David Beazley了。除了對Python 3.2之前的GIL研究最深入斤富,他還研究了這個最新的GIL實現(xiàn)膏潮,并且發(fā)現(xiàn)了很多有趣的程序方案。對于這些程序满力,即使是新的GIL實現(xiàn)焕参,其表現(xiàn)也相當(dāng)糟糕轻纪。他目前仍然通過一些實際的研究和發(fā)布一些實驗結(jié)果來引領(lǐng)并推進(jìn)著有關(guān)GIL的討論。
不管某一個人對Python的GIL感覺如何叠纷,它仍然是Python語言里最困難的技術(shù)挑戰(zhàn)刻帚。想要理解它的實現(xiàn)需要對操作系統(tǒng)設(shè)計、多線程編程涩嚣、C語言崇众、解釋器設(shè)計和CPython解釋器的實現(xiàn)有著非常徹底的理解。單是這些所需準(zhǔn)備的就妨礙了很多開發(fā)者去更徹底的研究GIL航厚。雖然如此校摩,并沒有跡象表明GIL在不久以后的任何一段時間內(nèi)會遠(yuǎn)離我們。目前阶淘,它將繼續(xù)給那些新接觸Python衙吩,并且與此同時又對解決非常困難的技術(shù)問題感興趣的人帶來困惑和驚喜。
以上內(nèi)容是基于我目前對Python解釋器所做出的研究而寫溪窒。雖然我還希望寫一些有關(guān)解釋器的其它方面內(nèi)容坤塞,但是沒有任何一個比全局解釋器鎖(GIL)更為人所知。雖然我認(rèn)為這里有些內(nèi)容是不準(zhǔn)確的澈蚌,但是這些技術(shù)上的細(xì)節(jié)與CPython的很多資源條目是不同的摹芙。如果你發(fā)現(xiàn)了不準(zhǔn)確的內(nèi)容,請及時告知我宛瞄,這樣我就會盡快對其進(jìn)行改正浮禾。