1嫂沉、安裝Anaconda
Anaconda是基于Python的科學(xué)計(jì)算和數(shù)據(jù)分析的集成環(huán)境包遏考,我們安裝的是Anaconda 3.6的64位版本,集成了Python 3.6以及在科學(xué)計(jì)算和數(shù)據(jù)分析中常用的Python模塊,包括numpy包个、scipy、matplotlib、pandas等碧囊。同時(shí)提供IPython树灶、Spyder、Jupyter Notebook等流行的開發(fā)工具糯而。我們課程主要采用Jupyter Notebook和Pycharm作為開發(fā)環(huán)境天通。
2、配置Anaconda
主要配置Anaconda的缺省目錄等
為anaconda的jupyter notebook設(shè)置初始化目錄
在使用jupyter進(jìn)行編程時(shí)熄驼,初始化目錄可能不是自己想要的目錄像寒,那么下面講解修改成自己想要的目錄。
1) 在命令行中輸入:
jupyter notebook --generate-config
會產(chǎn)生一個(gè)配置文件
我的會顯示:
Writing default config to: C:\Users\jplee\.jupyter\jupyter_notebook_config.py
2) 找到對應(yīng)的文件瓜贾,搜索c.NotebookApp.notebook_dir诺祸,將前面的#注釋去掉,在后面填上自己想要設(shè)置的初始化目錄祭芦。比如我設(shè)置成:
c.NotebookApp.notebook_dir = u'D:\Python'
以后就會將'D:\Python'這個(gè)目錄成為初始化的目錄筷笨。
3)找到Jupyter Notebook的快捷方式,右鍵打開屬性龟劲,將“目標(biāo)”最后的“User Profile”去掉奥秆,將“起始位置”修改為初始化目錄。
設(shè)置Anaconda的鏡像網(wǎng)站
如果需要安裝很多packages咸灿,你會發(fā)現(xiàn)conda下載的速度經(jīng)常很慢构订,因?yàn)锳naconda.org的服務(wù)器在國外。所幸的是避矢,清華TUNA鏡像源有Anaconda倉庫的鏡像悼瘾,我們將其加入conda的配置即可,在命令行中運(yùn)行以下命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
3审胸、安裝PyCharm
PyCharm是目前最流行的用于Python開發(fā)的IDE亥宿,課程中主要用來開發(fā)稍大的程序。提供智能提示砂沛、調(diào)試烫扼、即時(shí)語法糾錯(cuò)等功能。
官網(wǎng)下載其最新版本即可碍庵。安裝完成后映企,需簡單配置其Python解釋器、字體等静浴。
4堰氓、簡單實(shí)例
本文在Jupyter Notebook中完成,體現(xiàn)數(shù)據(jù)分析中“文學(xué)編程”的理念苹享。下面的例子代碼双絮、結(jié)果和文本很好地結(jié)合在一起。
# 定義兩個(gè)列表變量
x = range(20)
y = [i ** 2 + i * 2 - 3 for i in x]
# 引入matplotlib模塊繪圖
%matplotlib inline
import matplotlib.pyplot as plt
plt.scatter(x,y)
plt.show()
再來一個(gè)三維繪圖的實(shí)例,當(dāng)然事先需要安裝mpl_toolkits模塊:
pip install mpl_toolkits
import numpy as np
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure()
ax = Axes3D(fig)
X = np.arange(-4, 4, 0.25)
Y = np.arange(-4, 4, 0.25)
X, Y = np.meshgrid(X, Y)
R = np.sqrt(X**2 + Y**2)
Z = np.sin(R)
# 具體函數(shù)方法可用 help(function) 查看囤攀,如:help(ax.plot_surface)
ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='rainbow')
plt.show()
我們可以在這里寫下對數(shù)據(jù)和圖形的分析软免,最終形成完整的分析報(bào)告。
5焚挠、文學(xué)編程
- 為了能與同行們有效溝通或杠,你需要重現(xiàn)整個(gè)分析過程,并將說明文字宣蔚、代碼向抢、圖表、公式胚委、結(jié)論都整合在一個(gè)文檔中挟鸠。顯然傳統(tǒng)的文本編輯工具并不能滿足這一需求,所以這兒隆重推薦數(shù)據(jù)分析神器 Jupyter Notebook亩冬,不僅能在文檔中執(zhí)行代碼艘希,還能以網(wǎng)頁形式分享。
- 文學(xué)編程 ( Literate programming )硅急,這是由 Donald Knuth 提出的編程方法覆享。傳統(tǒng)的結(jié)構(gòu)化編程,人們需要按計(jì)算機(jī)的邏輯順序來編寫代碼营袜;與此相反撒顿,文學(xué)編程則可以讓人們按照自己的思維邏輯來開發(fā)程序。
- 簡單來說荚板,文學(xué)編程的讀者不是機(jī)器凤壁,而是人。 我們從寫出讓機(jī)器讀懂的代碼跪另,過渡到向人們解說如何讓機(jī)器實(shí)現(xiàn)我們的想法拧抖,其中除了代碼,更多的是敘述性的文字免绿、圖表等內(nèi)容唧席。這么一看,這不正是數(shù)據(jù)分析人員所需要的編碼風(fēng)格么嘲驾?不僅要當(dāng)好一個(gè)程序員淌哟,還得當(dāng)好一個(gè)作家。那么 Jupyter Notebook 就是不可或缺的一款集編程和寫作于一體的效率工具距淫。
7绞绒、安裝Chrome瀏覽器
安裝Chrome瀏覽器,并將其設(shè)為默認(rèn)瀏覽器榕暇。Jupyter Notebook在IE內(nèi)核的瀏覽器中運(yùn)行體驗(yàn)不是很好,經(jīng)過試驗(yàn),Chrome瀏覽器是最佳選擇彤枢。
8狰晚、安裝Jupyter Notebook擴(kuò)展
以管理員方式打開命令行,執(zhí)行兩條命令:
pip install jupyter_contrib_nbextensions
jupyter contrib nbextension install --user