R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系骏全,多項(xiàng)式回歸的做法和解釋

線性關(guān)系其實(shí)是最常見也是最有效苍柏,同時(shí)還是最好解釋的,不過變量間復(fù)雜的關(guān)系我們用多項(xiàng)式回歸做出來可能會(huì)更加的準(zhǔn)確姜贡。剛好有位粉絲的數(shù)據(jù)需要用到多項(xiàng)式回歸试吁,今天就給大家寫寫。

要理解非線性關(guān)系楼咳,首先我們看看線性關(guān)系熄捍,假設(shè)情況如下:商品的價(jià)格為p,銷售量為q母怜,總價(jià)為y余耽,那么qy之間就是線性關(guān)系:

p <- 0.5
q <- seq(0,100,1)
y <- p*q
plot(q,y,type='l',col='red',main='線性關(guān)系')
R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系,多項(xiàng)式回歸的做法和解釋

但是考慮現(xiàn)實(shí)中的情況:一個(gè)商品本來價(jià)格p是0.5苹熏,買的人多了價(jià)格會(huì)上漲碟贾,此時(shí)線性關(guān)系不成了哦:

y <- 450 + p*(q-10)^3
plot(q,y,type='l',col='navy',main='Nonlinear relationship',lwd=3)
R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系,多項(xiàng)式回歸的做法和解釋

如果你得數(shù)據(jù)確實(shí)不是線性關(guān)系轨域,就得考慮數(shù)據(jù)轉(zhuǎn)化或者擬合多項(xiàng)式回歸袱耽。

數(shù)據(jù)模擬

為了更好地給大家演示,我們需要模擬一個(gè)數(shù)據(jù)集出來:

q <- seq(from=0, to=20, by=0.1)
y <- 500 + 0.4 * (q-10)^3
noise <- rnorm(length(q), mean=10, sd=80)
noisy.y <- y + noise

上面的代碼首先模擬200個(gè)銷售量干发,和相應(yīng)的總價(jià)y朱巨,同時(shí)還給y加了一點(diǎn)點(diǎn)噪聲。

我們把模擬數(shù)據(jù)畫出來瞅瞅:

plot(q,noisy.y,col='deepskyblue4',xlab='q',main='Observed data')
lines(q,y,col='firebrick1',lwd=3)
R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系铐然,多項(xiàng)式回歸的做法和解釋

注意我們用lines這個(gè)方法給數(shù)據(jù)串了一條趨勢(shì)線蔬崩,可以很明顯的看出來我們的數(shù)據(jù)不是線性關(guān)系。

多項(xiàng)式回歸

那么對(duì)于我們的數(shù)據(jù)我可以做如下的多項(xiàng)式回歸:

model <- lm(noisy.y ~ poly(q,3))
model <- lm(noisy.y ~ x + I(X^2) + I(X^3))

上面兩種方法都是一個(gè)道理搀暑,但是第一種可以很好的避免多重共線性問題沥阳,你想嘛,x的平方和x的三次方肯定高度相關(guān)啊自点。所以大家用第一種方法哦桐罕,輸出結(jié)果如下:

R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系,多項(xiàng)式回歸的做法和解釋

上面的結(jié)果中沒有系數(shù)的置信區(qū)間桂敛,我們可以:

confint(model, level=0.95)
R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系功炮,多項(xiàng)式回歸的做法和解釋

我么還可以畫出來模型的殘差圖:

plot(fitted(model),residuals(model))
R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系,多項(xiàng)式回歸的做法和解釋

總的來說术唬,我們的模型的R方為0.77薪伏,q的一次項(xiàng)和3次項(xiàng)都是有統(tǒng)計(jì)學(xué)意義的,模型還不錯(cuò)粗仓。

是不是可以用這個(gè)模型做預(yù)測(cè)呢嫁怀?

這又涉及到機(jī)器學(xué)習(xí)了,往下看:

我們可以用訓(xùn)練的這個(gè)模型來預(yù)測(cè)我們的原始數(shù)據(jù):

predicted.intervals <- predict(model,data.frame(x=q),interval='confidence',
                               level=0.99)

你去查看predicted.intervals的值借浊,你可以看到我們200個(gè)數(shù)據(jù)的預(yù)測(cè)值和置信區(qū)間塘淑。

R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系,多項(xiàng)式回歸的做法和解釋

最好還是給大家可視化一下蚂斤,我們打算把原始的趨勢(shì)線和我們的置信區(qū)間的上下限都畫在同一個(gè)圖上:

lines(q,predicted.intervals[,1],col='green',lwd=3)
lines(q,predicted.intervals[,2],col='black',lwd=1)
lines(q,predicted.intervals[,3],col='black',lwd=1)
R數(shù)據(jù)分析:如何做數(shù)據(jù)的非線性關(guān)系存捺,多項(xiàng)式回歸的做法和解釋

可以看到上圖中,我們的磚紅色的線基本都在置信區(qū)間的上下限范圍內(nèi)曙蒸,證明了模型不錯(cuò)捌治。

小結(jié)

今天給大家寫了多項(xiàng)式回歸,這個(gè)東西用的不多逸爵,很容易造成過擬合問題具滴,大家使用時(shí)一定要注意。

感謝大家耐心看完师倔,自己的文章都寫的很細(xì)构韵,代碼都在原文中,希望大家都可以自己做一做趋艘,請(qǐng)關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取所有數(shù)據(jù)和本人收集的學(xué)習(xí)資料疲恢。如果對(duì)您有用請(qǐng)先收藏,再點(diǎn)贊轉(zhuǎn)發(fā)瓷胧。

也歡迎大家的意見和建議显拳。

如果你是一個(gè)大學(xué)本科生或研究生,如果你正在因?yàn)槟愕慕y(tǒng)計(jì)作業(yè)搓萧、數(shù)據(jù)分析杂数、論文宛畦、報(bào)告、考試等發(fā)愁揍移,如果你在使用SPSS,R次和,Python,Mplus, Excel中遇到任何問題那伐,都可以聯(lián)系我踏施。因?yàn)槲铱梢越o您提供最好的,最詳細(xì)和耐心的數(shù)據(jù)分析服務(wù)罕邀。

如果你對(duì)Z檢驗(yàn)畅形,t檢驗(yàn),方差分析诉探,多元方差分析日熬,回歸,卡方檢驗(yàn)肾胯,相關(guān)碍遍,多水平模型,結(jié)構(gòu)方程模型阳液,中介調(diào)節(jié)怕敬,量表信效度等等統(tǒng)計(jì)技巧有任何問題,請(qǐng)私信我帘皿,獲取最詳細(xì)和耐心的指導(dǎo)东跪。

If you are a student and you are worried about you statistical #Assignments, #Data #Analysis, #Thesis, #reports, #composing, #Quizzes, Exams.. And if you are facing problem in #SPSS, #R-Programming, #Excel, Mplus, then contact me. Because I could provide you the best services for your Data Analysis.

Are you confused with statistical Techniques like z-test, t-test, ANOVA, MANOVA, Regression, Logistic Regression, Chi-Square, Correlation, Association, SEM, multilevel model, mediation and moderation etc. for your Data Analysis...??

Then Contact Me. I will solve your Problem...

加油吧,打工人鹰溜!

往期內(nèi)容:

R數(shù)據(jù)分析:邏輯斯蒂回歸與泊松回歸

機(jī)器學(xué)習(xí):邏輯回歸分類器(一)

R數(shù)據(jù)分析:多分類邏輯回歸

R數(shù)據(jù)分析:多元邏輯斯蒂回歸的做法

R數(shù)據(jù)分析:線性回歸的做法和優(yōu)化實(shí)例

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末虽填,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子曹动,更是在濱河造成了極大的恐慌斋日,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,858評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件墓陈,死亡現(xiàn)場(chǎng)離奇詭異恶守,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)贡必,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門兔港,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人仔拟,你說我怎么就攤上這事衫樊。” “怎么了?”我有些...
    開封第一講書人閱讀 165,282評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵科侈,是天一觀的道長(zhǎng)载佳。 經(jīng)常有香客問我,道長(zhǎng)臀栈,這世上最難降的妖魔是什么刚盈? 我笑而不...
    開封第一講書人閱讀 58,842評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮挂脑,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘欲侮。我一直安慰自己崭闲,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評(píng)論 6 392
  • 文/花漫 我一把揭開白布威蕉。 她就那樣靜靜地躺著刁俭,像睡著了一般。 火紅的嫁衣襯著肌膚如雪韧涨。 梳的紋絲不亂的頭發(fā)上牍戚,一...
    開封第一講書人閱讀 51,679評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音虑粥,去河邊找鬼如孝。 笑死,一個(gè)胖子當(dāng)著我的面吹牛娩贷,可吹牛的內(nèi)容都是我干的第晰。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼彬祖,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼茁瘦!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起储笑,我...
    開封第一講書人閱讀 39,311評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤甜熔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后突倍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體腔稀,經(jīng)...
    沈念sama閱讀 45,767評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評(píng)論 3 336
  • 正文 我和宋清朗相戀三年羽历,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了烧颖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,090評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡窄陡,死狀恐怖炕淮,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情跳夭,我是刑警寧澤涂圆,帶...
    沈念sama閱讀 35,785評(píng)論 5 346
  • 正文 年R本政府宣布们镜,位于F島的核電站,受9級(jí)特大地震影響润歉,放射性物質(zhì)發(fā)生泄漏模狭。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評(píng)論 3 331
  • 文/蒙蒙 一踩衩、第九天 我趴在偏房一處隱蔽的房頂上張望嚼鹉。 院中可真熱鬧,春花似錦驱富、人聲如沸锚赤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽线脚。三九已至,卻和暖如春叫榕,著一層夾襖步出監(jiān)牢的瞬間浑侥,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評(píng)論 1 271
  • 我被黑心中介騙來泰國(guó)打工晰绎, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留寓落,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,298評(píng)論 3 372
  • 正文 我出身青樓荞下,卻偏偏與公主長(zhǎng)得像零如,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子锄弱,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容