- Python是一門解釋型語言纯赎?
我初學(xué)Python時哮塞,聽到的關(guān)于Python的第一句話就是,Python是一門解釋性語言算凿,我就這樣一直相信下去份蝴,直到發(fā)現(xiàn)了.pyc文件的存在。如果是解釋型語言氓轰,那么生成的.pyc文件是什么呢婚夫?c應(yīng)該是compiled的縮寫才對啊署鸡!
為了防止其他學(xué)習(xí)Python的人也被這句話誤解案糙,那么我們就在文中來澄清下這個問題,并且把一些基礎(chǔ)概念給理清靴庆。
- 解釋型語言和編譯型語言
計算機是不能夠識別高級語言的时捌,所以當(dāng)我們運行一個高級語言程序的時候,就需要一個“翻譯機”來從事把高級語言轉(zhuǎn)變成計算機能讀懂的機器語言的過程炉抒。這個過程分成兩類奢讨,第一種是編譯,第二種是解釋焰薄。
編譯型語言在程序執(zhí)行之前拿诸,先會通過編譯器對程序執(zhí)行一個編譯的過程,把程序轉(zhuǎn)變成機器語言塞茅。運行時就不需要翻譯佳镜,而直接執(zhí)行就可以了。最典型的例子就是c語言凡桥。
解釋型語言就沒有這個編譯的過程蟀伸,而是在程序運行的時候,通過解釋器對程序逐行作出解釋缅刽,然后直接運行啊掏,最典型的例子是Ruby。
通過以上的例子衰猛,我們可以來總結(jié)一下解釋型語言和編譯型語言的優(yōu)缺點迟蜜,因為編譯型語言在程序運行之前就已經(jīng)對程序做出了“翻譯”,所以在運行時就少掉了“翻譯”的過程啡省,所以效率比較高娜睛。但是我們也不能一概而論髓霞,一些解釋型語言也可以通過解釋器的優(yōu)化來在對程序做出翻譯時對整個程序做出優(yōu)化,從而在效率上超過編譯型語言。
此外,隨著Java等基于虛擬機的語言的興起瑟俭,我們又不能把語言純粹地分成解釋型和編譯型這兩種。
用Java來舉例纵潦,Java首先是通過編譯器編譯成字節(jié)碼文件,然后在運行時通過解釋器給解釋成機器文件垃环。所以我們說Java是一種先編譯后解釋的語言邀层。
再換成C#,C#首先是通過編譯器將C#文件編譯成IL文件遂庄,然后在通過CLR將IL文件編譯成機器文件寥院。所以我們說C#是一門純編譯語言,但是C#是一門需要二次編譯的語言涛目。同理也可等效運用到基于.NET平臺上的其他語言秸谢。
- Python到底是什么
其實Python和Java/C#一樣,也是一門基于虛擬機的語言泌绣,我們先來從表面上簡單地了解一下Python程序的運行過程吧钮追。
當(dāng)我們在命令行中輸入python hello.py時预厌,其實是激活了Python的“解釋器”阿迈,告訴“解釋器”:你要開始工作了≡矗可是在“解釋”之前苗沧,其實執(zhí)行的第一項工作和Java一樣,是編譯炭晒。
熟悉Java的同學(xué)可以想一下我們在命令行中如何執(zhí)行一個Java的程序:
javac hello.java
Java hello
只是我們在用Eclipse之類的IDE時待逞,將這兩部給融合成了一部而已。其實Python也一樣网严,當(dāng)我們執(zhí)行python hello.py時识樱,他也一樣執(zhí)行了這么一個過程,所以我們應(yīng)該這樣來描述Python震束,Python是一門先編譯后解釋的語言怜庸。
- 簡述Python的運行過程
在說這個問題之前,我們先來說兩個概念垢村,PyCodeObject和pyc文件割疾。
我們在硬盤上看到的pyc自然不必多說,而其實PyCodeObject則是Python編譯器真正編譯成的結(jié)果嘉栓。我們先簡單知道就可以了宏榕,繼續(xù)向下看拓诸。
當(dāng)python程序運行時,編譯的結(jié)果則是保存在位于內(nèi)存中的PyCodeObject中麻昼,當(dāng)Python程序運行結(jié)束時奠支,Python解釋器則將PyCodeObject寫回到pyc文件中。
當(dāng)python程序第二次運行時涌献,首先程序會在硬盤中尋找pyc文件胚宦,如果找到,則直接載入燕垃,否則就重復(fù)上面的過程枢劝。
所以我們應(yīng)該這樣來定位PyCodeObject和pyc文件,我們說pyc文件其實是PyCodeObject的一種持久化保存方式卜壕。
- 運行一段Python程序
我們來寫一段程序?qū)嶋H運行一下:
程序本身毫無意義您旁。我們繼續(xù)看:
然而我們在程序中并沒有看到pyc文件,仍然是test.py孤零零地呆在那轴捎!
那么我們換一種寫法鹤盒,我們把print_str方法換到另外的一個python模塊中:
然后運行程序:
這個時候pyc文件出現(xiàn)了,其實認真思考一下不難得到原因侦副,我們考慮一下實際的業(yè)務(wù)情況侦锯。
- pyc的目的是重用
回想本文的第二段在解釋編譯型語言和解釋型語言的優(yōu)缺點時,我說編譯型語言的優(yōu)點在于秦驯,我們可以在程序運行時不用解釋尺碰,而直接利用已經(jīng)“翻譯”過的文件。也就是說译隘,我們之所以要把py文件編譯成pyc文件亲桥,最大的優(yōu)點在于我們在運行程序時,不需要重新對該模塊進行重新的解釋固耘。
所以题篷,我們需要編譯成pyc文件的應(yīng)該是那些可以重用的模塊,這于我們在設(shè)計軟件類時是一樣的目的厅目。所以Python的解釋器認為:只有import進來的模塊番枚,才是需要被重用的模塊。
這個時候也許有人會說损敷,不對昂!你的這個問題沒有被解釋通啊嗤锉,我的test.py不是也需要運行么渔欢,雖然不是一個模塊,但是以后我每次運行也可以節(jié)省時間拔脸馈奥额!
OK苫幢,我們從實際情況出發(fā),思考下我們在什么時候才可能運行python xxx.py文件:
A. 執(zhí)行測試時垫挨。
B. 開啟一個Web進程時韩肝。
C. 執(zhí)行一個程序腳本。
我們逐個來說九榔,第一種情況我們就不用多說了哀峻,這個時候哪怕所有的文件都沒有pyc文件都是無所謂的。
第二種情況哲泊,我們試想一個webpy的程序把剩蟀,我們通常這樣執(zhí)行:
抑或者:
然后這個程序就類似于一個守護進程一樣一直監(jiān)視著8181/9002端口,而一旦中斷切威,只可能是程序被殺死育特,或者其他的意外情況,那么你需要恢復(fù)要做的是把整個的Web服務(wù)重啟先朦。那么既然一直監(jiān)視著缰冤,把PyCodeObject一直放在內(nèi)存中就足夠了,完全沒必要持久化到硬盤上喳魏。
最后一個情況棉浸,執(zhí)行一個程序腳本,一個程序的主入口其實很類似于Web程序中的Controller刺彩,也就是說迷郑,他負責(zé)的應(yīng)該是Model之間的調(diào)度,而不包含任何的主邏輯在內(nèi)迂苛,如我在http://www.cnblogs.com/kym/archive/2010/07/19/1780407.html中所提到三热,Controller應(yīng)該就是一個Facade鼓择,無任何的細節(jié)邏輯三幻,只是把參數(shù)轉(zhuǎn)來轉(zhuǎn)去而已,那么如果做算法的同學(xué)可以知道呐能,在一段算法腳本中念搬,最容易改變的就是算法的各個參數(shù),那么這個時候給持久化成pyc文件就未免有些畫蛇添足了摆出。
所以我們可以這樣理解Python解釋器的意圖朗徊,Python解釋器只把我們可能重用到的模塊持久化成pyc文件。
- pyc的過期時間
說完了pyc文件偎漫,可能有人會想到爷恳,每次Python的解釋器都把模塊給持久化成了pyc文件,那么當(dāng)我的模塊發(fā)生了改變的時候象踊,是不是都要手動地把以前的pyc文件remove掉呢温亲?
當(dāng)然Python的設(shè)計者是不會犯這么白癡的錯誤的棚壁。而這個過程其實就取決于PyCodeObject是如何寫入pyc文件中的。
我們來看一下import過程的源碼吧:
這段代碼比較長栈虚,我們只來看我標(biāo)注了的代碼袖外,其實他在寫入pyc文件的時候,寫了一個Long型變量魂务,變量的內(nèi)容則是文件的最近修改日期曼验,同理,我們再看下載入pyc的代碼:
不用仔細看代碼粘姜,我們可以很清楚地看到原理鬓照,其實每次在載入之前都會先檢查一下py文件和pyc文件保存的最后修改日期,如果不一致則重新生成一份pyc文件孤紧。
- 寫在最后的
其實了解Python程序的執(zhí)行過程對于大部分程序員颖杏,包括Python程序員來說意義都是不大的,那么真正有意義的是坛芽,我們可以從Python的解釋器的做法上學(xué)到什么留储,我認為有這樣的幾點:
A. 其實Python是否保存成pyc文件和我們在設(shè)計緩存系統(tǒng)時是一樣的,我們可以仔細想想咙轩,到底什么是值得扔在緩存里的获讳,什么是不值得扔在緩存里的。
B. 在跑一個耗時的Python腳本時活喊,我們?nèi)绾文軌蛏晕赫ヒ恍┏绦虻倪\行時間丐膝,就是將模塊從主模塊分開。(雖然往往這都不是瓶頸)
C. 在設(shè)計一個軟件系統(tǒng)時钾菊,重用和非重用的東西是不是也應(yīng)該分開來對待帅矗,這是軟件設(shè)計原則的重要部分。
D. 在設(shè)計緩存系統(tǒng)(或者其他系統(tǒng))時煞烫,我們?nèi)绾蝸肀苊獬绦虻倪^期浑此,其實Python的解釋器也為我們提供了一個特別常見而且有效的解決方案。