IPython notebook目前已經(jīng)成為用Python做教學(xué)、計算扼褪、科研的一個重要工具。本文介紹IPython notebook的一些基本用法,以及如何使用它調(diào)試Cython程序嫌吠。
IPython Notebook使用瀏覽器作為界面忌警,向后臺的IPython服務(wù)器發(fā)送請求搁拙,并顯示結(jié)果秒梳。在瀏覽器的界面中使用單元(Cell)保存各種信息。Cell有多種類型箕速,經(jīng)常使用的有表示格式化文本的Markdown單元酪碘,和表示代碼的Code單元。
每個代碼單元都有一個輸出區(qū)域盐茎,在Code單元中輸入代碼兴垦,按 Shift-Enter 將運行此代碼,代碼中最后一個表達(dá)式的值將輸出區(qū)域顯示字柠。如果希望屏蔽輸出探越,可以在最后一條語句之后添加一個分號:”;”。此外窑业,代碼中還可以使用print語句在輸出區(qū)域中顯示信息钦幔。
在Markdown單元中還可以直接使用Html和Javascript。
在Markdown單元中可以使用LaTeX表示數(shù)學(xué)公式常柄,例如
fromIPython.external.mathjaximportinstall_mathjaxinstall_mathjax()
Code單元的輸出也可以顯示為數(shù)學(xué)公式揍庄,例如在單元中輸入如下代碼,將顯示為數(shù)學(xué)公式:
fromIPython.displayimportLatexLatex(r"$\sqrt{x^2+y^2}$")
SymPy的表達(dá)式也可以顯示為LaTex东抹,例如:
%load_extsympyprintingfromsympyimport*x,y=symbols("x,y")sqrt(x**2+y**2)
以%開頭的為IPython的命令(Magic Command)蚂子,這里通過%load_ext命令載入sympyprinting擴展插件,載入此插件之后缭黔,所有的SymPy表達(dá)式都顯示為數(shù)學(xué)公式食茎。
IPython.display模塊中提供了許多顯示Python返回值的類,例如下面的代碼用Image類顯示”python.png”圖片馏谨,缺省路徑為Notebook文件所在的目錄:
fromIPython.displayimportImageImage(filename="python.png")
Image還可以用來顯示表示圖像的字符串别渔。例如下面的代碼通過cv2的imencode()將NumPy數(shù)組轉(zhuǎn)換為一個表示PNG圖像數(shù)據(jù)的數(shù)組,然后將此數(shù)組轉(zhuǎn)換為字符串之后通過Image()將顯示為圖像:
importcv2importnumpyasnpfromIPython.displayimportImageimg=np.random.randint(0,255,(250,250,3))cv2.blur(img,(11,11),img)r,dat=cv2.imencode(".png",img)Image(dat.tostring())
此外惧互,還可以通過HTML和Javascript將Python代碼的輸出顯示為Html哎媚,或者作為Javascript運行。
fromIPython.displayimportJavascriptJavascript("alert('ok')")
將在瀏覽器中運行Javascript代碼喊儡。
IPython中Magic命令有兩種執(zhí)行方式拨与,以%開始的命令被稱為行命令,它只對單行有效艾猜,以%%開頭的為單元命令买喧,它放在單元的第一行捻悯,對整個單元有效。例如timeit命令可以快速測試代碼的執(zhí)行效率淤毛,它可以作為行命令或者單元命令今缚。
%timeit1+1%timeit1.0+1.0%timeit"1"+"1"
10000000 loops, best of 3: 52 ns per loop
10000000 loops, best of 3: 53.4 ns per loop
10000000 loops, best of 3: 50.9 ns per loop
%%timeits=0foriinxrange(100):s+=i
100000 loops, best of 3: 11 us per loop
每個Magic命令都可以指定參數(shù),可以輸入timeit?查看其幫助文檔钱床。下面讓我們看看一些常用的Magic命令荚斯。
%pylab命令將載入numpy和pylab埠居,并且將這兩個模塊中的名字載入到全局名字空間中查牌。缺省參數(shù)時,它使用matplotlib的缺省界面庫顯示圖表滥壕,如果帶inline參數(shù)則將圖表作為圖像插入到Notebook中纸颜。使用界面庫顯示圖像時可以使用交互工具,而將圖表直接插入到Notebook中則有利于編寫文檔绎橘。
下面的例子胁孙,plot和random是從pylab和numpy中載入的。
%pylabinlineplot(random.randn(100));
Welcome to pylab, a matplotlib-based Python environment [backend: module://IPython.zmq.pylab.backend_inline].
For more information, type 'help(pylab)'.
%load可以從文件或者網(wǎng)址載入代碼到一個新的單元中称鳞,例如下面載入某個matplotlib的示例程序涮较,并執(zhí)行:
%loadhttp://matplotlib.org/mpl_examples/pylab_examples/histogram_demo.py
#!/usr/bin/env pythonimportnumpyasnpimportmatplotlib.mlabasmlabimportmatplotlib.pyplotaspltmu,sigma=100,15x=mu+sigma*np.random.randn(10000)# the histogram of the datan,bins,patches=plt.hist(x,50,normed=1,facecolor='green',alpha=0.75)# add a 'best fit' liney=mlab.normpdf(bins,mu,sigma)l=plt.plot(bins,y,'r--',linewidth=1)plt.xlabel('Smarts')plt.ylabel('Probability')plt.title(r'$\mathrm{Histogram\ of\ IQ:}\ \mu=100,\ \sigma=15$')plt.axis([40,160,0,0.03])plt.grid(True)plt.show()
%prun用于代碼的執(zhí)行性能分析,可以作為行命令和單元命令使用冈止。下面的程序分析numpy.linalg.det()的性能:
%%prunforiinxrange(100):linalg.det(random.rand(10,10))
其輸出如下:
3402 function calls in 0.096 seconds
Ordered by: internal time
ncalls? tottime? percall? cumtime? percall filename:lineno(function)
100? ? 0.032? ? 0.000? ? 0.091? ? 0.001 linalg.py:1560(slogdet)
300? ? 0.022? ? 0.000? ? 0.022? ? 0.000 {method 'reduce' of 'numpy.ufunc' objects}
200? ? 0.011? ? 0.000? ? 0.012? ? 0.000 numeric.py:167(asarray)
100? ? 0.006? ? 0.000? ? 0.006? ? 0.000 linalg.py:84(_realType)
100? ? 0.005? ? 0.000? ? 0.005? ? 0.000 linalg.py:151(_assertRank2)
...
%load_ext載入IPython的擴展模塊狂票,通過它可以載入更多的Magic命令。下面我們載入cythonmagic模塊熙暴,并使用%%cython命令編譯一個高效的頻率統(tǒng)計函數(shù)count()闺属。
%load_extcythonmagic
Cython的代碼基本和Python的代碼類似,但是可以使用類型聲明周霉,Cython可以使用這些類型聲明產(chǎn)生更高效的C語言代碼掂器,并編譯成Python的擴展模塊。使用%%cython命令簡化了編譯擴展模塊的過程俱箱,它會自動創(chuàng)建C語言程序国瓮,編譯并載入。由于擴展模塊無法卸載狞谱,因此IPython采用的策略是每次編譯不同的代碼都會產(chǎn)生一個全新的擴展模塊乃摹。方便我們不退出Python環(huán)境即可運行新的代碼。
%%cythondefcount(listdata):cdef:dictresult={}inti,length=len(data)objectitemforiinrange(length):item=data[i]ifiteminresult:(result[item]).append(i)else:result[item]=[i]returnresult
下面是count()的Python版本芋簿。
fromcollectionsimportdefaultdictdefcountpy(data):result=defaultdict(list)fori,iteminenumerate(data):result[item].append(i)returnresult
先測試二者的結(jié)果是否相同:
importrandomdata=[random.randint(0,100)for_inxrange(10000)]count(data)==countpy(data)
True
然后測試它們的執(zhí)行速度峡懈,可以看出Cython版本比Python的要快2倍多。在這個測試中与斤,Cython程序也同樣使用列表和字典等對象肪康,但是由于可以直接調(diào)用Python的C API荚恶,因此Cython版本的效率能提高幾倍。如果只是單純的數(shù)值運算磷支,Cython能將程序提升到與C語言相近的速度谒撼。
%timeitcountpy(data)%timeitcount(data)
100 loops, best of 3: 4.52 ms per loop
1000 loops, best of 3: 1.8 ms per loop