y=a+b1x1+b2x2+…+bnxn+e
公式中:
y—因變量腔呜,x—自變量崇呵,a—常數(shù)項,b1—回歸系數(shù),回歸直線的斜率缎除,e—隨機誤差严就,即隨機因素對變量所產(chǎn)生的影響
import pandas,numpy
data=pandas.read_csv('/Users/cenguangda/Downloads/4.1/data.csv')
x=data[['廣告費用','渠道數(shù)']]
y=data[['購買用戶數(shù)']]
#繪圖廣告費用與購買用戶數(shù)圖
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.title('廣告費用與購買用戶數(shù)關(guān)系')
plt.xlabel('廣告費用')
plt.ylabel('購買用戶數(shù)')
plt.grid(True)
plt.plot(x['廣告費用'],y,'k.')
plt.show()
廣告費用與購買用戶數(shù)關(guān)系
#繪制渠道數(shù)和購買用戶數(shù)圖
plt.rcParams['font.sans-serif']=['SimHei']
plt.figure()
plt.title('渠道數(shù)和購買用戶數(shù)')
plt.xlabel('渠道數(shù)')
plt.ylabel('購買用戶數(shù)')
plt.grid(True)
plt.plot(x['渠道數(shù)'],y,'k.')
plt.show()
渠道數(shù)和購買用戶數(shù)關(guān)系
#建立模型
from sklearn.linear_model import LinearRegression
lModel=LinearRegression()
#訓(xùn)練模型
lModel.fit(x,y)
#評估模型
lModel.score(x,y)
#輸出結(jié)果
lModel.score(x,y)
Out[30]: 0.93928850730154045