前言——100-Days-Of-ML-Code
一直有學(xué)習(xí)機器學(xué)習(xí)的計劃礼搁,最近混進了某大佬創(chuàng)建的學(xué)習(xí)群(歡迎關(guān)注群主的公眾號:「機器學(xué)習(xí)Club」),跟一群小伙伴一起跟著 GitHub 上一個小哥的 "100-Days-Of-ML-Code" 學(xué)習(xí)包券。
雖然工作繁忙首妖,學(xué)習(xí)壓力也大娜庇,但是既然進來了就沒有慫的道理塔次。為了鞏固自己學(xué)到的東西,也為了給和我一樣零基礎(chǔ)的同學(xué)們提供一點幫助名秀,我決定在這里做一個教程励负。
我的目標是讓每一個看到這篇教程的人弄懂機器學(xué)習(xí)的基本原理與常用算法。所以匕得,我會用盡可能用通俗易懂的語言去解釋數(shù)學(xué)知識继榆,為每段代碼作出注釋,并在必要的時候提供優(yōu)秀的參考文獻汁掠。
期待這個教程完成時的我和你們略吨。
致謝貢獻 repo 的小哥~目前 Star 已經(jīng) 1w+ 了,內(nèi)容絕對遠超國內(nèi)一些付費課程考阱。歡迎訪問:
GitHub - Avik-Jain/100-Days-Of-ML-Code
英文閱讀有困難的同學(xué)可以參考熱心群眾貢獻的中文版:
GitHub - 100-Days-Of-ML-Code 中文版
入坑第一步:環(huán)境搭建
眾所周知翠忠,機器學(xué)習(xí)數(shù)據(jù)分析的首選語言是 Python,我們應(yīng)該如何優(yōu)雅地使用 Python 進行機器學(xué)習(xí)編程呢乞榨?這里首推使用 Anaconda + Jupyter Notebook 搭建開發(fā)環(huán)境秽之。
1 Anaconda
Anaconda 是什么?
開發(fā)過程中吃既,遇到不同的項目使用不同版本的庫是不是很頭疼考榨?
Conda 是一個使用 Python 編寫的開源的包管理系統(tǒng)和環(huán)境管理系統(tǒng),具有跨平臺和管理多語言項目的能力态秧,它允許用戶輕松安裝不同版本的軟件以及各種編程語言所需要的庫董虱,用戶可以在多種軟件版本中切換扼鞋。
Anaconda 可以看作是增值版的 Python申鱼,并使用 Conda 進行包管理。它附帶了可進行大規(guī)模數(shù)據(jù)處理云头、預(yù)測分析和科學(xué)計算等的包捐友,乃是進行數(shù)據(jù)分析的一大利器。
如何安裝 Anaconda
官網(wǎng)下載地址:Download Anaconda
按照自己的系統(tǒng)類型選擇相應(yīng)的安裝包然后安裝即可溃槐。Win10 用戶安裝時請右鍵選擇以管理員身份運行匣砖。安裝過程比較簡單,一路點下去即可。
以 Windows 為例猴鲫,安裝完以后对人,運行 Anaconda 的終端——Anaconda Prompt。(Win10 右鍵管理員身份運行)
在終端中輸入 conda list拂共,出現(xiàn)以下界面牺弄,則說明安裝成功。
之后更新所有的包宜狐,在終端中輸入:
conda upgrade --all
Anaconda 基礎(chǔ)操作
安裝包
在終端中使用如下命令安裝包:
conda install packge_name
默認安裝指定包的所有版本势告,也可以通過添加版本號來指定需要的版本。(如 conda install numpy=1.10)
卸載包
conda remove packge_name
更新包
conda update packge_name
可以使用 conda update --all 來更新環(huán)境中所有的包抚恒。
列出已經(jīng)安裝的包
conda list
安裝好 Anaconda 后咱台,就可以安裝神器 Jupyter Notebook 啦!
2 Jupyter Notebook
Jupyter Notebook 是什么俭驮?
Jupyter Project 是 IPython 的一個衍生項目回溺,以 Julia,Python 和 R 作為核心編程語言混萝,支持幾十種語言的執(zhí)行環(huán)境(內(nèi)核)馅而。
Jupyter Notebook 是 Jupyter 的 Web 交互式計算環(huán)境,Jupyter Notebook 文檔(.ipynb)實際上是一個 JSON 文檔譬圣,可以包含代碼瓮恭、文本(Markdown)、數(shù)學(xué)公式厘熟、圖形和多媒體屯蹦。
使用 Jupyter Notebook,可以讓你的文檔和代碼相輔相成绳姨,它的優(yōu)秀的可視化能力登澜,使得數(shù)據(jù)分析工程師能夠?qū)W⒂诜治鲞^程,而不必在可視化方面下太多心思飘庄。
安裝 Jupyter Notebook
在 Anaconda Prompt 終端中輸入:
conda install jupyter notebook
即可脑蠕。Anaconda 會自動下載相關(guān)包與依賴。
使用 Jupyter Notebook
可以直接在開始菜單中啟動 Jupyter Notebook跪削,這樣會在默認的工作目錄下新建 .ipynb 文件谴仙。如果想要在某一指定文件夾啟動,則需要先在 Anaconda 終端中進入該文件夾碾盐,然后執(zhí)行
jupyter notebook
命令晃跺。接下來 Jupyter Notebook 服務(wù)器會被啟動,默認的端口是 8888毫玖。瀏覽器會自動打開 http://localhost:8888/tree 頁面掀虎。
我們可以按照需要建立子文件夾凌盯,然后點擊右側(cè)的 New,選擇相應(yīng)的環(huán)境(這里我們選擇 Python [default])
新的 Notebook 就被創(chuàng)建好啦烹玉!讓我們在代碼塊中寫入第一行代碼:
按 Ctrl + Enter 快捷鍵驰怎,即可執(zhí)行該代碼塊。左側(cè)的 In [1] 指該代碼塊的執(zhí)行順序二打。我們可以把代碼片段放在不同的代碼塊中砸西,需要哪塊運行哪塊,非常有利于代碼的調(diào)試址儒。
可以使用快捷鍵來提高編碼效率:CSDN - Jupyter Notebook 的快捷鍵
同時芹枷, 可以在 Anaconda 終端中安裝代碼自動補全包
conda install pyreadline
嗯,到這里莲趣,進行數(shù)據(jù)分析所需的 Python 環(huán)境就搭建好啦鸳慈!接下來,讓我們一同開始機器學(xué)習(xí)之旅喧伞。
歡迎關(guān)注Evan 的博客