這篇文章會(huì)提供一些優(yōu)化代碼的工具矾飞。會(huì)讓代碼變得更簡(jiǎn)潔,或者更迅速呀邢。
當(dāng)然這些并不能代替算法設(shè)計(jì)洒沦,但是還是能讓Python加速很多倍价淌。
其實(shí)前面講算法的文章,也有提到過(guò)蝉衣。比如適用于雙向隊(duì)列的 deque,以及在合適的條件下運(yùn)用 bisect 和 heapq 來(lái)提升算法的性能濒翻。
而且前面也提到過(guò)剪验,Python提供了當(dāng)今最高級(jí)也是最有效的排序算法(list.sort)肴焊。
另外還有一個(gè)功能多樣又迅速的散列表(dict)功戚。而且如果寫迭代器封裝、功能性代碼或者是某種額外擴(kuò)展的時(shí)候啸臀,或許?CyToolz可以用得到。當(dāng)然在itertools和 functools模塊?中豌注,還有很多函數(shù)可以帶來(lái)很高效的代碼灯萍。
這篇文章主要講優(yōu)化單處理器的代碼轧铁,下面會(huì)介紹一些一些高效的函數(shù)實(shí)現(xiàn)旦棉,也有已經(jīng)封裝好的拓展模塊,還包括速度更快的Python解釋器救斑。
當(dāng)然多處理器版本確實(shí)能大幅提高運(yùn)行效率真屯。如果想了解多核編程,可以從multiprocessing模塊開始。而且也能找到非常多的關(guān)于分布式計(jì)算的第三方工具运沦。這里可以看一下Python wiki上的關(guān)于Parallel Processing的內(nèi)容。
接下來(lái)梯刚,會(huì)說(shuō)一些關(guān)于Python加速工具的選單薪寓。
1.NumPy澜共、SciPy向叉、Sage和Pandas
先說(shuō)嗦董,NumPy母谎。它的核心是一個(gè)多維數(shù)字?jǐn)?shù)組的實(shí)現(xiàn)京革。除了這個(gè)數(shù)據(jù)結(jié)構(gòu)之外奇唤,還實(shí)現(xiàn)了若干個(gè)函數(shù)和運(yùn)算符匹摇,可以高效地進(jìn)行數(shù)組運(yùn)算。并且對(duì)于被調(diào)用的次數(shù)進(jìn)行了精簡(jiǎn)懈贺。它可以被用來(lái)進(jìn)行極其高效的數(shù)學(xué)運(yùn)算坡垫。
SciPy和Sage都將NumPy內(nèi)置為自身的一部分,同時(shí)內(nèi)置了其他的不同的工具冰悠,從而可以用于特定科學(xué)、數(shù)學(xué)和高性能計(jì)算的模塊溉卓。
Pandas是一個(gè)側(cè)重于數(shù)據(jù)分析的工具。如果處理大量半結(jié)構(gòu)化數(shù)據(jù)的時(shí)候万栅,可能也會(huì)用到Pandas相關(guān)的工具西疤,比如Blaze。
2.PyPy、Pyston兽掰、Parakeet徒役、Psyco和Unladen Swallow
讓代碼運(yùn)行的更快孽尽,侵入性最小的就是使用實(shí)時(shí)編譯器(JIT編譯)忧勿。以前的話我們可以直接安裝Psyco。安裝之后導(dǎo)入psyco熏挎,然后調(diào)用psyco.full()晌砾。代碼運(yùn)行速度就可以明顯提升。運(yùn)行Python代碼的時(shí)候养匈,它可以實(shí)時(shí)監(jiān)控程序,會(huì)將一部分代碼編譯為了機(jī)器碼呕乎。
現(xiàn)在好多Psyco等加速器的項(xiàng)目已經(jīng)停止維護(hù)了,不過(guò)類似的功能在PyPy中得到了繼承磅轻。
PyPy為了方便分析逐虚、優(yōu)化和翻譯,用Python語(yǔ)言將Python重新實(shí)現(xiàn)了一遍叭爱,這樣就可以JIT編譯。而且PyPy可以直接將代碼翻譯成像C那樣的性能更高的語(yǔ)言把曼。
Unladen Swallow是一個(gè)Python的JIT編譯器。是Python解釋器的一本版本嗤军,被稱為底層虛擬機(jī)(LLVM)晃危。不過(guò)這個(gè)開發(fā)已經(jīng)停止了老客。
Pyston是一個(gè)與LLVM平臺(tái)較為接近的Python的JIT編譯器震叮。很多時(shí)候已經(jīng)優(yōu)于Python的實(shí)現(xiàn),但不過(guò)還有很多地方不完善苇瓣。
3.GPULib、PyStream哲嘲、PyCUDA和PyOpenCL
這四個(gè)都是用在圖像處理單元來(lái)實(shí)現(xiàn)代碼的加速媳禁。前面講的都是用代碼優(yōu)化來(lái)實(shí)現(xiàn)加速的撤蚊。而這些都是從硬件層面上進(jìn)行加速损话,如果有一個(gè)強(qiáng)大的GPU槽唾,我們可以用GPU來(lái)計(jì)算,從而減少CPU寶貴的資源拧烦。
PyStream古老一點(diǎn)钝计。GPULib提供了基于GPU的各種形式的數(shù)據(jù)計(jì)算。
如果用GPU加速自己的代碼私恬,可以用PyCUDA和PyOpenCL。
4.Pyrex疫衩、Cython、Numba和Shedskin
這四個(gè)項(xiàng)目都致力于將Python代碼翻譯為C闷煤、C++和LLVM的代碼涮瞻。Shedskin會(huì)將代碼編譯為C++語(yǔ)言。Pyrex署咽、Cython編譯的主要目標(biāo)是C語(yǔ)言。Cython也是Pyrex的一個(gè)分支幕庐。
而且,Cython還有NumPy數(shù)組的額外支持异剥。
如果面向數(shù)組和數(shù)學(xué)計(jì)算的時(shí)候,Numba是更好的選擇導(dǎo)入時(shí)會(huì)自動(dòng)生成相應(yīng)的LLVM的代碼歹苦。升級(jí)版本是NumbaPro,還提供了對(duì)GPU的支持殴瘦。
5.SWIG号杠、F2PY和Boost.Python
這些工具可以將其他的語(yǔ)言封裝為Python的模塊。第一個(gè)可以封裝C/C++語(yǔ)言姨蟋。F2PY可以封裝Fortran。Boost.Python可以封裝C++語(yǔ)言悠砚。
SUIG只要啟動(dòng)一個(gè)命令行工具堂飞,往里面輸入C或者C++的頭文件,封裝器代碼就會(huì)自動(dòng)生成绰筛。除了Python,而且可以成為其他語(yǔ)言的封裝器铝噩,比如Java和PHP。
6.ctypes讳窟、llvm-py和CorePy2
這些模塊可以幫助我們實(shí)現(xiàn)Python底層對(duì)象的操作敞恋。ctypes模塊可以用于在內(nèi)存中構(gòu)建編譯C的對(duì)象。并且調(diào)用共享庫(kù)中的C的函數(shù)硬猫。不過(guò)ctypes已經(jīng)包含在Python的標(biāo)準(zhǔn)庫(kù)里面了改执。
llvm-py主要提供LLVM的Python接口坑雅。以便于構(gòu)建代碼,然后編譯他們终蒂。也可以在Python中構(gòu)建它的編譯器遥诉。當(dāng)然搞出自己編程語(yǔ)言也是可以的。
CorePy2也可以進(jìn)行加速矮锈,不過(guò)這個(gè)加速是運(yùn)行在匯編層的。
7.Weave债朵、Cinpy和PyInline
這三個(gè)包,就可以讓我們?cè)赑ython代碼中直接使用C語(yǔ)言或者其他的高級(jí)語(yǔ)言序芦〔碌ぃ混合代碼硅卢,依然可以保持整潔〗埽可以使用Python代碼的字符串的多行特性,可以使其他的代碼按照自身的風(fēng)格來(lái)進(jìn)行排版艾疟。
8.其他工具
如果我們要節(jié)省內(nèi)存敢辩,就不能使用JIT了。一般JIT都太耗費(fèi)內(nèi)存戚长。有一句話說(shuō)的很對(duì),時(shí)間和內(nèi)存經(jīng)常不能兼得同廉,而我們?cè)诠こ涕_發(fā)中柑司,總是要尋找他們的平衡點(diǎn)锅劝。
至于其他的一些東西,比如Micro Python項(xiàng)目玻粪,這個(gè)是用在嵌入式設(shè)備或者微控制器上面使用的稠集。
如果只是想在Python環(huán)境中工作,然后想用別的語(yǔ)言剥纷,可以看看這個(gè)項(xiàng)目Julia。