機器學(xué)習(xí)基礎(chǔ)2-安裝環(huán)境

2.1喳挑、常用環(huán)境

  • 科學(xué)計算支持庫Numpy

    專門設(shè)計用于科學(xué)計算的專業(yè)支持庫

  • 機器學(xué)習(xí)庫 Scikit-learn

  • 數(shù)據(jù)處理庫 Pandas

    內(nèi)置許多排序吼驶,統(tǒng)計之類的實用功能

2.2桩撮、Python

Python是一種動態(tài)的高級編程語言腻豌,Python代碼是通過解釋器解釋執(zhí)行。Python數(shù)據(jù)類型不用事先聲明,語法更為靈活多變芒帕,代碼看起來也更簡潔,高效快速是Python引以為傲的特點丰介。

2.2.1背蟆、基本用法

Python庫安裝工具Pip和Conda。如果成功安裝Python后基矮,就能在命令行中直接使用Pip命令了淆储,而Conda則需要額外進行安裝才能使用,Conda功能更為強大

pip install 庫名
# 使用國內(nèi)源加速下載
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 庫名
# 或者
conda 庫名

使用庫方面家浇,Python也和其他編程語言一樣本砰,需要先導(dǎo)入再使用

import 庫名

# 或者 
import 庫名 as 別名

# 使用庫中的類
from 庫名 import 類名

2.3、Numpy簡介

Numpy是Python語言的科學(xué)計算支持庫钢悲,提供了線性代數(shù)点额,傅里葉變換等非常有用的數(shù)學(xué)工具舔株。

pip install -U numpy

Numpy擁有強大的科學(xué)計算功能,Array數(shù)據(jù)類型是Numpy的核心數(shù)據(jù)結(jié)構(gòu)还棱,與Python的List類型相似载慈,但功能強大的多。Numpy相關(guān)功能都是圍繞著Array類型建設(shè)的珍手。

# 使用Numpy包只需要導(dǎo)入即可办铡,業(yè)界習(xí)慣用np作為它的別名
import numpy as np
方法名稱 類別 功能說明
array 數(shù)據(jù)創(chuàng)建 創(chuàng)建Array類型數(shù)據(jù)
zeros 數(shù)據(jù)創(chuàng)建 創(chuàng)建值為0的Array類型數(shù)據(jù)
ones 數(shù)據(jù)創(chuàng)建 創(chuàng)建值為1的Array類型數(shù)據(jù)
eye 數(shù)據(jù)創(chuàng)建 創(chuàng)建單位矩陣
arange 數(shù)據(jù)創(chuàng)建 類似內(nèi)置函數(shù)range,生成等差數(shù)值
linspace 數(shù)據(jù)創(chuàng)建 生成可指定是否包含終值的等差數(shù)值
random.rand 數(shù)據(jù)創(chuàng)建 隨機生成數(shù)值
T 數(shù)據(jù)創(chuàng)建 轉(zhuǎn)置操作
reshape 數(shù)據(jù)操作 不改變原數(shù)據(jù)的維度變換
resize 數(shù)據(jù)操作 修改原數(shù)據(jù)的維度變換
mean 統(tǒng)計操作 取均值
sum 統(tǒng)計操作 求和
max 統(tǒng)計操作 取最大值
min 統(tǒng)計操作 取最小值
var 統(tǒng)計操作 求方差
std 統(tǒng)計操作 求標準差
corrcoef 統(tǒng)計操作 計算相關(guān)系數(shù)
append 數(shù)據(jù)操作 新增
insert 數(shù)據(jù)操作 插入
delete 數(shù)據(jù)操作 刪除
concatenate 數(shù)據(jù)操作 按行(列)連接數(shù)據(jù)表
add 數(shù)學(xué)運算 標(向)量加法
subtract 數(shù)學(xué)運算 標(向)量減法
multiply 數(shù)學(xué)運算 標(向)量乘法
divide 數(shù)學(xué)運算 標(向)量除法
exp 數(shù)學(xué)運算 以e為底的指數(shù)運算
log 數(shù)學(xué)運算 以e為底的對數(shù)運算
dot 數(shù)學(xué)運算 點乘

2.3琳要、Scikit-Learn

Scikit-learn庫包含了常見的機器學(xué)習(xí)算法寡具,而且還在不斷更新。

scikit-learn庫對機器學(xué)習(xí)算法進行封裝稚补,使用過程非常簡單童叠,只要根據(jù)格式填入數(shù)據(jù)即可,不涉及額外的數(shù)學(xué)運算操作课幕。

pip install -U scikit-learn

# 使用scikit-learn
import sklearn

調(diào)用機器學(xué)習(xí)算法也非常簡單厦坛,Scikit-learn庫已經(jīng)將算法按模型分類,查找起來非常方便乍惊。如線性回歸算法可以從線性模型中找到

from sklearn import linear-model

model = linear_model.LinearRegression()

Logistic回歸算法也是依據(jù)線性模型

from sklearn.linear_model imort LogisticRegression
model = linear_model.logisticRegression()

類似的還有基于近鄰模型的KNN算法

生成模型后杜秸,一般使用fit方法給模型"喂"數(shù)據(jù)進行訓(xùn)練。完成訓(xùn)練的模型可以使用predict方法進行預(yù)測污桦。

2.4亩歹、Pandas簡介

Pandas是Python語言中知名的數(shù)據(jù)處理庫。但是從生產(chǎn)環(huán)境上得到的數(shù)據(jù)需要首先進行數(shù)據(jù)清洗工作凡橱,最常見的如填充丟失字段值。數(shù)據(jù)清洗工作一般由Pandas來完成亭姥,特征工程也可通過Pandas完成稼钩。

2.4.1、安裝

pip install -U pandas

2.4.2达罗、Pandas基本用法

Pandas具有兩個核心的數(shù)據(jù)類型坝撑,即Series和DataFrame

  • Series

    一維數(shù)據(jù),可以認為是一個統(tǒng)計功能增強版的List功能

  • DataFrame

    多維數(shù)據(jù)粮揉,有多個Series組成

業(yè)界習(xí)慣在導(dǎo)入時巡李,使用'pd'作為他的別名

import pandas as pd
方法名稱 類別 功能說明
read_csv 讀取數(shù)據(jù) 從CSV格式文件中讀取數(shù)據(jù)
read_excel 讀取數(shù)據(jù) 從電子表格中讀取數(shù)據(jù)
read_json 讀取數(shù)據(jù) 從json格式中讀取數(shù)據(jù)
read_clipboard 讀取數(shù)據(jù) 從剪切板讀取數(shù)據(jù)
to_csv 寫入數(shù)據(jù) 將數(shù)據(jù)寫入csv格式文件
to_excel 寫入數(shù)據(jù) 將數(shù)據(jù)寫入電子表格
to_json 寫入數(shù)據(jù) 將數(shù)據(jù)寫入json表格
to_clipboard 寫入數(shù)據(jù) 將數(shù)據(jù)寫入粘貼板
Series 創(chuàng)建數(shù)據(jù) 創(chuàng)建Series類型數(shù)據(jù)
DataFrame 創(chuàng)建數(shù)據(jù) 創(chuàng)建DataFrame類型數(shù)據(jù)
head 信息查看 從頭開始查看N位數(shù)據(jù)
tail 信息查看 從末尾開始查看N位數(shù)據(jù)
shape 信息查看 行列數(shù)信息
dropna 數(shù)據(jù)操作 刪除空值
fillna 數(shù)據(jù)操作 填充空值
sort_values 數(shù)據(jù)操作 正(逆)序排序
append 數(shù)據(jù)操作 橫向(按行)連接兩個數(shù)據(jù)表
concat 數(shù)據(jù)操作 縱向(按列)連接兩個數(shù)據(jù)表
value_counts 統(tǒng)計操作 值計數(shù)
describe 統(tǒng)計操作 總體概況信息
info 統(tǒng)計操作 數(shù)據(jù)類型統(tǒng)計
mean 統(tǒng)計操作 取均值
corr 統(tǒng)計操作 計算相關(guān)系數(shù)
count 統(tǒng)計操作 非空值計數(shù)
max 統(tǒng)計操作 取最大值
min 統(tǒng)計操作 取最小值
median 統(tǒng)計操作 計算中位數(shù)
std 統(tǒng)計操作 計算標準差
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市扶认,隨后出現(xiàn)的幾起案子侨拦,更是在濱河造成了極大的恐慌,老刑警劉巖辐宾,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件狱从,死亡現(xiàn)場離奇詭異膨蛮,居然都是意外死亡,警方通過查閱死者的電腦和手機季研,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進店門敞葛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人与涡,你說我怎么就攤上這事惹谐。” “怎么了驼卖?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵豺鼻,是天一觀的道長。 經(jīng)常有香客問我款慨,道長儒飒,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任檩奠,我火速辦了婚禮桩了,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘埠戳。我一直安慰自己井誉,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布整胃。 她就那樣靜靜地躺著颗圣,像睡著了一般。 火紅的嫁衣襯著肌膚如雪屁使。 梳的紋絲不亂的頭發(fā)上在岂,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天,我揣著相機與錄音蛮寂,去河邊找鬼蔽午。 笑死,一個胖子當(dāng)著我的面吹牛酬蹋,可吹牛的內(nèi)容都是我干的及老。 我是一名探鬼主播,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼范抓,長吁一口氣:“原來是場噩夢啊……” “哼骄恶!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起匕垫,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤僧鲁,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體悔捶,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡铃慷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了蜕该。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片犁柜。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖堂淡,靈堂內(nèi)的尸體忽然破棺而出馋缅,到底是詐尸還是另有隱情,我是刑警寧澤绢淀,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布萤悴,位于F島的核電站,受9級特大地震影響皆的,放射性物質(zhì)發(fā)生泄漏覆履。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一费薄、第九天 我趴在偏房一處隱蔽的房頂上張望硝全。 院中可真熱鬧,春花似錦楞抡、人聲如沸伟众。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽凳厢。三九已至,卻和暖如春竞慢,著一層夾襖步出監(jiān)牢的瞬間先紫,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工梗顺, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留泡孩,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓寺谤,卻偏偏與公主長得像,于是被迫代替她去往敵國和親吮播。 傳聞我的和親對象是個殘疾皇子变屁,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內(nèi)容