進(jìn)程與線程
進(jìn)程是計(jì)算機(jī)中數(shù)據(jù)分配苗膝、資源調(diào)度的最小單元,一個(gè)程序可以包含多個(gè)進(jìn)程植旧,至少也會(huì)有一個(gè)主進(jìn)程。一個(gè)進(jìn)程內(nèi)的所有線程共享該進(jìn)程的資源病附。
線程是計(jì)算機(jī)中的最小執(zhí)行單元,一個(gè)進(jìn)程可以包含多個(gè)線程完沪,但是至少會(huì)有一個(gè)主線程嵌戈,由CPU調(diào)度完成具體的數(shù)據(jù)運(yùn)算听皿。寫的程序如果沒(méi)有手動(dòng)開(kāi)啟多線程熟呛,則全部都是單線程程序尉姨。
并行與并發(fā)
并行指在同一時(shí)刻庵朝,有多條指令在多個(gè)處理器上同時(shí)執(zhí)行又厉。所以無(wú)論從微觀還是從宏觀來(lái)看九府,二者都是一起執(zhí)行的覆致,是指兩個(gè)或者多個(gè)事件在同一時(shí)刻發(fā)生。并行的關(guān)鍵是你有同時(shí)處理多個(gè)任務(wù)的能力煌妈。 在Python中,多進(jìn)程才是并行声旺。
并發(fā)指在同一時(shí)刻只能有一條指令執(zhí)行段只,但多個(gè)進(jìn)程指令被快速的輪換執(zhí)行腮猖,使得在宏觀上具有多個(gè)進(jìn)程同時(shí)執(zhí)行的效果赞枕,但在微觀上并不是同時(shí)執(zhí)行的,只是把時(shí)間分成若干段炕婶,使多個(gè)進(jìn)程快速交替的執(zhí)行,是指兩個(gè)或多個(gè)事件在同一時(shí)間間隔發(fā)生柠掂。并發(fā)的關(guān)鍵是你有處理多個(gè)任務(wù)的能力,但不一定要同時(shí)涯贞。
在Python中,多線程指的便是并發(fā)宋渔。
GIL鎖
GIL即CPython的全局解釋器鎖(Global Interpreter Lock)州疾。首先需要明確的一點(diǎn)是GIL并不是Python的特性皇拣,它是在實(shí)現(xiàn)Python解析器(CPython)時(shí)所引入的一個(gè)概念薄嫡,JPython就沒(méi)有GIL颗胡。
解決多線程之間數(shù)據(jù)完整性和狀態(tài)同步毫深,即數(shù)據(jù)安全毒姨,最簡(jiǎn)單方法就是加鎖。于是CPython才出現(xiàn)了GIL這把超級(jí)大鎖手素。因?yàn)榇罅縋ython庫(kù)代碼的開(kāi)發(fā)者已經(jīng)重度依賴GIL鸳址,所以說(shuō)這把鎖已經(jīng)變成了Python的一個(gè)比較嚴(yán)重的歷史遺留問(wèn)題泉懦。正因?yàn)檫@把鎖,導(dǎo)致Python幾乎等于一個(gè)單線程的程序崩哩。
GIL會(huì)阻止多個(gè)線程運(yùn)行同一代碼,確保由所有進(jìn)程共享的內(nèi)存不會(huì)中斷邓嘹,但這樣做存在性能瓶頸。
I\O密集型(文件處理汹押、網(wǎng)絡(luò)爬蟲)代碼開(kāi)啟多線程則是一個(gè)并發(fā)執(zhí)行的過(guò)程,由于會(huì)進(jìn)行I/O等待棚贾,并發(fā)也就會(huì)充分利用等待時(shí)間,于是可以做到提高效率妙痹。
多線程遇到CPU密集型(循環(huán)、計(jì)算)代碼時(shí)怯伊,單線程會(huì)比多線程的快。因?yàn)橛?jì)算量太大耿芹,會(huì)觸發(fā)GIL的釋放與在競(jìng)爭(zhēng),多個(gè)線程間來(lái)回切換也會(huì)過(guò)度損耗資源媚送。
因?yàn)镚IL的存在,只有IO密集型場(chǎng)景下的多線程會(huì)得到較好的性能塘偎,而在CPU密集型(計(jì)算密集型)或者高并發(fā)場(chǎng)景下疗涉,推薦使用多進(jìn)程效率會(huì)更快吟秩。畢竟每個(gè)進(jìn)程有各自獨(dú)立的GIL,互不干擾涵防,即真正意義上的并行執(zhí)行。但多進(jìn)程占用的資源更多壮池,所以仍然需要酌情考慮。
更多關(guān)于Python的GIL鎖的內(nèi)容可參考下列鏈接的文章: