回歸分析

知識點普及

  • 回歸分析:研究自變量與因變量之間的關(guān)系形式的分析方法蹦魔,主要是通過建立自變量y和影響他的自變量Xi(i=1,2,3...)之間的回歸模型來預(yù)測自變量y的發(fā)展趨勢.
  • 回歸模型分析步驟:
    • 根據(jù)預(yù)測目標(biāo)激率,確定因變量和自變量
    • 繪制散點圖,確定回歸模型或類型
    • 估計模型參數(shù)勿决,建立回歸模型
    • 對回歸模型進(jìn)行校驗
    • 利用回歸模型進(jìn)行預(yù)測

簡單線性回歸:y=a+bx+e

  • y 因變量
  • x 自變量
  • a 常數(shù)項 截距
  • b 回歸系數(shù) 斜率
  • e 隨機(jī)誤差

sklearn 建立模型的流程

  • 建立模型: lrModel = sklearn.linear_model.LinearRegression()
  • 訓(xùn)練模型: lrModel.fit(x,y)
  • 模型評估: lrModel.score(x,y)
  • 模型預(yù)測: lrModel.predict(x)

樣例代碼

#!/usr/bin/env python
# coding=utf-8
import  numpy as np
from pandas import read_csv
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

data = read_csv('../data/input/data.csv')

#畫出散點圖,求x,y的相關(guān)系數(shù)
plt.scatter(data.廣告投入,data.銷售額)

data.corr()

# 估計模型參數(shù),建立回歸模型
lrModel = LinearRegression()

X = data[['廣告投入']]
Y = data[['銷售額']]


#模型訓(xùn)練
lrModel.fit(X,Y)

#模型評估
lrModel.score(X,Y)


# 利用回歸模型進(jìn)行預(yù)測
res = lrModel.predict([[50],[40],[20]])
print (res)

# 查看截距

alpha =  lrModel.intercept_[0]

# 查看參數(shù)
beta = lrModel.coef_[0][0]

alpha + beta*np.array([50,40,20]) 

結(jié)果輸出

[[ 150.53303965]
 [ 113.15418502]
 [  38.39647577]]

多重線性回歸 :研究一個因變量和多個自變量間的線性關(guān)系的方法

多重線性回歸表達(dá)式

樣例代碼

#!/usr/bin/env python
# coding=utf-8



import matplotlib 
import pandas as pd 
from pandas.tools.plotting import scatter_matrix

data = pd.read_csv('../data/input/data_2.csv')

# matplotlib設(shè)置圖表中文正常顯示
font = {
    'family':'SimHei'
}

matplotlib.rc('font',**font)

#矩陣?yán)L制散點圖
scatter_matrix(
    data[['店鋪的面積','距離最近的車站','月營業(yè)額']],
    figsize = (10,10),diagonal='kde'
    )

#計算相關(guān)系數(shù)
data[['店鋪的面積','距離最近的車站','月營業(yè)額']].corr()

#自變量
X = data[['店鋪的面積','距離最近的車站']]
#因變量
Y = data[['月營業(yè)額']]

from sklearn.linear_model import LinearRegression
lrModel = LinearRegression()
lrModel.fit(X,Y)
lrModel.score(X,Y)
res1 = lrModel.predict([[10,110]])
res2 = lrModel.predict([[10,110],[20,110]])

print (res1)
print (res2)
#查看參數(shù)
lrModel.coef_
#查看截距
lrModel.intercept_

附注


我是阿羽乒躺,一枚正在學(xué)習(xí)的搬磚小工,希望大家多多指教低缩!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嘉冒,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌讳推,老刑警劉巖顶籽,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異娜遵,居然都是意外死亡蜕衡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進(jìn)店門设拟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來慨仿,“玉大人,你說我怎么就攤上這事纳胧×海” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵跑慕,是天一觀的道長万皿。 經(jīng)常有香客問我,道長核行,這世上最難降的妖魔是什么牢硅? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮芝雪,結(jié)果婚禮上减余,老公的妹妹穿的比我還像新娘。我一直安慰自己惩系,他們只是感情好位岔,可當(dāng)我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著堡牡,像睡著了一般抒抬。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上晤柄,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天擦剑,我揣著相機(jī)與錄音,去河邊找鬼芥颈。 笑死惠勒,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的浇借。 我是一名探鬼主播捉撮,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼怕品,長吁一口氣:“原來是場噩夢啊……” “哼妇垢!你這毒婦竟也來了闯估?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤涨薪,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后刚夺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡创橄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年妥畏,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片醉蚁。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡鬼店,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出确沸,到底是詐尸還是另有隱情,我是刑警寧澤罗捎,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布桨菜,位于F島的核電站,受9級特大地震影響倒得,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜霞掺,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一菩彬、第九天 我趴在偏房一處隱蔽的房頂上張望缠劝。 院中可真熱鬧骗灶,春花似錦、人聲如沸脱羡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽绕娘。三九已至,卻和暖如春业舍,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背态罪。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工下面, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人沥割。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓机杜,卻偏偏與公主長得像,于是被迫代替她去往敵國和親椒拗。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 回歸分析 - 刺猬的溫馴 - 博客園 http://www.cnblogs.com/chenying99/p/4...
    葡萄喃喃囈語閱讀 1,645評論 1 7
  • 回歸分析是一種預(yù)測性的建模技術(shù),它研究的是因變量(目標(biāo))和自變量(預(yù)測器)之間的關(guān)系块饺。這種技術(shù)通常用于預(yù)測分析耻陕,時...
    wyrover閱讀 12,286評論 0 13
  • 監(jiān)督學(xué)習(xí)中,如果預(yù)測的變量是離散的膘怕,我們稱其為分類(如決策樹,支持向量機(jī)等)岛心,如果預(yù)測的變量是連續(xù)的,我們稱其為回...
    小灰灰besty閱讀 1,409評論 0 5
  • 熊超超閱讀 310評論 1 5
  • NO.31 字?jǐn)?shù)1285 用時約3.5分鐘 好久沒有講故事了徘禁,今天給小伙伴們講個小故事髓堪,故事發(fā)生在2017年5...
    凝霜記憶閱讀 1,202評論 0 4