引子
最近在學(xué)習(xí)數(shù)據(jù)分析捌朴,發(fā)現(xiàn)pythonprogramming上的教學(xué)非常不錯(cuò)津函,只可惜是英文的蛉幸。學(xué)著學(xué)著發(fā)現(xiàn)破讨,其中有許多需要注釋之處。于是決定發(fā)一篇關(guān)于python機(jī)器學(xué)習(xí)-數(shù)據(jù)分析的教程奕纫,正好也能作為一種“溫故而知新”的手段提陶。
文中的許多知識(shí),是摘自以上這個(gè)網(wǎng)站的匹层,起地址為:pythonprogramming.net隙笆,也可以直接上那里學(xué)習(xí),再來(lái)看看我的注釋升筏。
下面我先來(lái)寫(xiě)環(huán)境變量配置撑柔。
1. 環(huán)境配置
這里的環(huán)境配置就是配置一個(gè)python開(kāi)發(fā)環(huán)境,同時(shí)安裝教程所需要的python庫(kù)您访。機(jī)器學(xué)習(xí)主要在Linux上搭建環(huán)境铅忿,Windows并非主流,因此也就不寫(xiě)Windows方面的教程(其實(shí)是因?yàn)槲也粫?huì)…)灵汪;
Mac系統(tǒng)由于基于Unix辆沦,與Linux同根同源,因此方法上也有類(lèi)似之處识虚,但我并不是非常推薦(麻煩挺多);
如果你仍堅(jiān)持使用Windows妒茬,我推薦使用一臺(tái)云主機(jī)或者VPS担锤,搭建一個(gè)云計(jì)算python環(huán)境,這樣可不限于任意系統(tǒng)乍钻,只要有瀏覽器就可以肛循。
1.1 linux環(huán)境下
1.1.1 安裝系統(tǒng),安裝pip
首先是在你的電腦上安裝Linux银择,系統(tǒng)建議使用Ubuntu 16.04或是基于它的發(fā)行版(例如Mint18)多糠。具體教程網(wǎng)上非常多,這里就不贅述了浩考。
裝完系統(tǒng)以后第一件事是更新包管理源:
$ sudo apt-get update
然后試試系統(tǒng)有沒(méi)有安裝pip(pip是基于python的包管理器):
$ pip
如果沒(méi)出來(lái)夹孔,需要安裝pip:
$ sudo apt-get install python-pip
然后我們要安裝后面需要用到的python庫(kù):
$ sudo pip install numpy
$ sudo pip install scipy
$ sudo pip install pandas
$ sudo pip install sklearn
$ sudo pip install matplotlib
先下載這么多,后面需要再安裝。這些都是后面教程里面需要用到的工具包搭伤。
如果你覺(jué)得下載速度慢(因?yàn)檫@是鏈接到python官方源的下載方式)只怎,你可以使用:
$ sudo pip install numpy -i https://pypi.douban.com/simple
這樣就連接到了豆瓣的python鏡像源。
1.1.2 運(yùn)行python代碼
命令行模式
Linux下一般已經(jīng)配置好了python環(huán)境怜俐,在命令行下輸入$ python
一般可直接進(jìn)入身堡。因此只需要一個(gè)文本編輯器即可。
推薦使用sublime text拍鲤,簡(jiǎn)潔又大方贴谎。
如何使用python呢?我們拋開(kāi)任何“調(diào)試”的思想季稳,嘗試用命令實(shí)現(xiàn):
- 先用文本編輯器在路徑下編寫(xiě)一段代碼:
a = 1
b = 2
c = a + b
print('Hello World!\n')
print(c)
保存為test.py
- 然后打開(kāi)命令行引導(dǎo)至該路徑(在mint下可以右鍵-Open in Termianl擅这,要是不清楚怎么用命令行至路徑,google或百度吧绞幌,這里不贅述了)蕾哟,輸入:
$ python test.py
就運(yùn)行了python腳本,也就是運(yùn)行了這段代碼莲蜘。
你也可以在命令行下輸入:$ python
谭确,也可以進(jìn)入python的交互模式,但它只是交互式的票渠,不適合大段代碼的寫(xiě)入逐哈。
jupyter notebook編輯模式
另外再推薦一種方法:使用jupyter notebook,這是一種文本編輯器+運(yùn)行的環(huán)境
剛開(kāi)始你會(huì)無(wú)所適從问顷,但用習(xí)慣以后會(huì)覺(jué)得非常方便昂秃。如果不是大愛(ài)命令行操作,那么我推薦這一種杜窄。
1.首先是安裝jupyter肠骆,jupyter在python2環(huán)境下需要安裝ipython 5.0
$ pip install ipython==5.0
$ pip install jupyter
2.然后打開(kāi)termianl至某一路徑下,輸入$ jupyter notebook
塞耕,它就啟動(dòng)了蚀腿。你可以用它創(chuàng)建一個(gè)python腳本,然后一行一行地運(yùn)行你想要的腳本(里面還可以插入markdown文本)
jupyter notebook支持顯示matplotlib的圖扫外,因此它完全適合我們這個(gè)教程莉钙。
1.2 mac環(huán)境下
mac環(huán)境下相對(duì)麻煩一些,因?yàn)閙ac不能使用apt-get
作為包管理筛谚。而且mac的每一個(gè)版本又有所不同磁玉,可能會(huì)出現(xiàn)不同的錯(cuò)誤,需要讀者自己搞清楚驾讲。
在我的版本下(EI-Capitan)蚊伞,機(jī)器自帶了python2.7.10席赂,對(duì)于我們的教程應(yīng)該是夠了。
然后我們要安裝pip厚柳,如果你的系統(tǒng)沒(méi)有自帶pip氧枣,那么就需要安裝一個(gè),這里使用easy_install
:
$ sudo easy_install pip
然后就安裝上一借所說(shuō)的一系列python工具包别垮。
另外mac也支持sublime text便监,這是一個(gè)全平臺(tái)通用文本編輯器,而且還近乎于免費(fèi)碳想,簡(jiǎn)直良心烧董。
1.3 云計(jì)算環(huán)境下
這是我自己使用的模式,因?yàn)檫@樣移動(dòng)性最強(qiáng)(不需要隨身攜帶自己的電腦胧奔,只要有一臺(tái)能上網(wǎng)的逊移、帶瀏覽器的設(shè)備即可),最像hacker又滿(mǎn)足需求龙填。
具體配置方法可以參考我的另一篇文章胳泉。