100天機(jī)器學(xué)習(xí)實(shí)踐之第2天

這是github上的一個(gè)項(xiàng)目毡琉,地址在這兒蕾久,作者@# Avik-Jain婉宰。


Day 2歌豺, 簡(jiǎn)單線性回歸

使用一個(gè)特征值預(yù)測(cè)結(jié)果

這是一種基于獨(dú)立的變量X預(yù)測(cè)相關(guān)變量Y的方法。這種方法假設(shè)兩個(gè)變量線性相關(guān)心包。因此类咧,我們的目標(biāo)是找到一種函數(shù),能夠根據(jù)X盡可能精確地預(yù)測(cè)Y值蟹腾。

如何找到最佳擬合直線

在這個(gè)回歸模型中痕惋,我們?cè)噲D通過找到“最佳擬合直線”來最小化誤差——找到的回顧直線誤差是最小的。我們盡量使樣本值Yi與預(yù)測(cè)值Yp之間的長(zhǎng)度最小娃殖。

這個(gè)任務(wù)中值戳,我們將會(huì)根據(jù)學(xué)生學(xué)習(xí)的時(shí)長(zhǎng)預(yù)測(cè)其分?jǐn)?shù)。

Step 1:預(yù)處理數(shù)據(jù)

我們會(huì)按照上一節(jié)的步驟來處理數(shù)據(jù)炉爆。

  • 導(dǎo)入庫(kù)
  • 導(dǎo)入數(shù)據(jù)集
  • 檢查缺失數(shù)據(jù)
  • 分割數(shù)據(jù)
  • 特征值規(guī)范化以準(zhǔn)備使用簡(jiǎn)單線性回歸模型
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

dataset = pd.read_csv('../datasets/studentscores.csv')
X = dataset.iloc[:,:1].values
Y = dataset.iloc[:,1].values

from sklearn.cross_validation import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X,Y,test_size=1/4,random_state=0)

Step 2:使用訓(xùn)練數(shù)據(jù)訓(xùn)練簡(jiǎn)單線性回歸模型

我們將使用sklearn.linear_modelLiearRegression類訓(xùn)練數(shù)據(jù)堕虹。然后產(chǎn)生LinearRegression類的regressor對(duì)象。現(xiàn)在我們將使用fit()方法將數(shù)據(jù)載入到回歸對(duì)象中叶洞。

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)

Step 3:預(yù)測(cè)結(jié)果

現(xiàn)在我們將用測(cè)試數(shù)據(jù)集預(yù)測(cè)結(jié)果鲫凶,輸出將保存到向量Y_pred中。為了預(yù)測(cè)結(jié)果衩辟,我們使用LinearRegression類的預(yù)測(cè)方法螟炫。

Y_pred = regressor.predict(X_test)

Step 4:可視化

最后的步驟是可視化我們的結(jié)果。我們會(huì)用matplotlib.pyplot庫(kù)打印散點(diǎn)圖艺晴,可視化訓(xùn)練集與測(cè)試集結(jié)果昼钻,對(duì)比我們預(yù)測(cè)的模型與實(shí)際值接近程度。

可視化訓(xùn)練集

plt.scatter(X_train, Y_train, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color='blue')
圖片.png

可視化測(cè)試集

plt.scatter(X_test, Y_test, color='red')
plt.plot(X_test, regressor.predict(X_test),color='blue')
圖片.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末封寞,一起剝皮案震驚了整個(gè)濱河市然评,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌狈究,老刑警劉巖碗淌,帶你破解...
    沈念sama閱讀 216,997評(píng)論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異抖锥,居然都是意外死亡亿眠,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門磅废,熙熙樓的掌柜王于貴愁眉苦臉地迎上來纳像,“玉大人,你說我怎么就攤上這事拯勉【怪海” “怎么了憔购?”我有些...
    開封第一講書人閱讀 163,359評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)岔帽。 經(jīng)常有香客問我玫鸟,道長(zhǎng),這世上最難降的妖魔是什么山卦? 我笑而不...
    開封第一講書人閱讀 58,309評(píng)論 1 292
  • 正文 為了忘掉前任鞋邑,我火速辦了婚禮,結(jié)果婚禮上账蓉,老公的妹妹穿的比我還像新娘枚碗。我一直安慰自己,他們只是感情好铸本,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,346評(píng)論 6 390
  • 文/花漫 我一把揭開白布肮雨。 她就那樣靜靜地躺著,像睡著了一般箱玷。 火紅的嫁衣襯著肌膚如雪怨规。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,258評(píng)論 1 300
  • 那天锡足,我揣著相機(jī)與錄音波丰,去河邊找鬼。 笑死舶得,一個(gè)胖子當(dāng)著我的面吹牛掰烟,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播沐批,決...
    沈念sama閱讀 40,122評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼纫骑,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了九孩?” 一聲冷哼從身側(cè)響起先馆,我...
    開封第一講書人閱讀 38,970評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎躺彬,沒想到半個(gè)月后煤墙,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,403評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡宪拥,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,596評(píng)論 3 334
  • 正文 我和宋清朗相戀三年仿野,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片江解。...
    茶點(diǎn)故事閱讀 39,769評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡设预,死狀恐怖徙歼,靈堂內(nèi)的尸體忽然破棺而出犁河,到底是詐尸還是另有隱情鳖枕,我是刑警寧澤,帶...
    沈念sama閱讀 35,464評(píng)論 5 344
  • 正文 年R本政府宣布桨螺,位于F島的核電站宾符,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏灭翔。R本人自食惡果不足惜魏烫,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,075評(píng)論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肝箱。 院中可真熱鬧哄褒,春花似錦、人聲如沸煌张。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽骏融。三九已至链嘀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間档玻,已是汗流浹背怀泊。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留误趴,地道東北人霹琼。 一個(gè)月前我還...
    沈念sama閱讀 47,831評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像冤留,于是被迫代替她去往敵國(guó)和親碧囊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,678評(píng)論 2 354