10. 2019-02-18 計(jì)算

1. mean(x, trim=percent, na.rm=), median(x, na.rm=), mode

mode 一組數(shù)據(jù)出現(xiàn)最多的值裁眯,可以是字符

2. 回歸:建立模型

(1)線性回歸

y = ax + b #x預(yù)測(cè)變量,y響應(yīng)變量

邏輯:收集數(shù)據(jù),lim()創(chuàng)建關(guān)系模型贸人,找到系數(shù),獲取殘差/平均誤差(找summary)淀歇,predict()運(yùn)用线婚,繪圖plot(y,x,abline(lm(x~y)), col, main...)?

tip: ~因變量與自變量

predict(function, data.frame(number))

#Error in int_abline

格式書寫錯(cuò)誤

解決:原本plot(y,x,abline(lm(x~y)),type="b") 變成 按照上述格式。

(2)多重回歸

y = a + b1x1 + b2x2 +...bnxn

lm(y ~ x1+x2+x3...,data)

coef(function)[position] #得系數(shù)蜒灰,系數(shù)位置可通過(guò)print(function)查閱

3)邏輯回歸

y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...)

概念

函數(shù):glm()

(4)泊松回歸

假設(shè)響應(yīng)變量泊松分布弦蹂;對(duì)數(shù)-線性模型

log(y) = a + b1x1 + b2x2 + bnxn.....

函數(shù):glm(formula=, data, family=poisson) #formula為變量間關(guān)系y~x1+x2

(5)非線性最小二乘回歸

尋找擬合的參數(shù)系數(shù)

模型:a = b1*x^2+b2

函數(shù)nls(formula, data, start) #formula假設(shè)的關(guān)系,start 數(shù)字列表或者數(shù)字向量

nls后直接print和參考方式不太一樣


3. 標(biāo)準(zhǔn)分布與二項(xiàng)分布:概率問(wèn)題

(1)標(biāo)準(zhǔn)分布

dnorm(x, mean, sd) #x seq(num1,num2,by = num3)num1 to num2 increase by num3 y軸為概率

pnorm(x, mean, sd) #累積分布函數(shù)强窖,y軸累積概率

qnorm(p, mean, sd) #累積分布函數(shù)凸椿,x軸累計(jì)概率

rnorm(n, mean, sd) #輸入樣本數(shù),隨機(jī)產(chǎn)生分布翅溺,hist直方圖顯示

(2)二項(xiàng)分布

理解:硬幣為例

dbinom(x,size,prob) #每個(gè)次數(shù)的概率

pbinom(x,size,prob) #單個(gè)值的概率

qbinorm(p, size, prob) #概率的單個(gè)累計(jì)值

rbinorm(n, size, prob) #n給定樣本數(shù)量給定概率的隨機(jī)值


4. 分析

(1)協(xié)方差分析ANCOVA

有兩個(gè)因素左右因變量脑漫,不感興趣或者不重要的因素稱為協(xié)變量髓抑,為分類型變量,另外一種為連續(xù)型變量

關(guān)鍵在于方差分析窿撬,線性回歸僅作為不可剔除的關(guān)系

邏輯:研究協(xié)變量的值對(duì)回歸的影響

函數(shù):

aov(y~x*z,data) #x為預(yù)測(cè)變量启昧,y為響應(yīng)變量叙凡,研究xz相互作用劈伴;響應(yīng)變量在前

anova(function) #function should be lm() OR glm()比較兩個(gè)模型看變量間的相互作用是否重要

如圖:


ANOVA分析

(2)時(shí)間序列分析

函數(shù):timeseries.object.name <- ts(data, start, end, frequency) #frequency=12月份,6每小時(shí)10分鐘握爷,4季度跛璧,24*6一天的每10分鐘

修改:多時(shí)間序列

邏輯:兩組合成matrix,注意nrow而非ncol新啼,ts()轉(zhuǎn)化為時(shí)間序列而非“先各自ts然后再組合”

#start的日期格式

help里說(shuō)的很清楚:single number或者a vector of two integers

(3)生存分析

安裝“survival”包

加載

函數(shù):

Surv(time, event) #event "frame$status=="

survival(formula) #analysis of Surv and what

REF:https://baike.baidu.com/item/%E5%8D%8F%E6%96%B9%E5%B7%AE%E5%88%86%E6%9E%90/5366621?fr=aladdin

(4)卡方檢驗(yàn)

VS ANOVA分析:確定兩分類變量是否存在顯著相關(guān)性


函數(shù):chiseq() #里面為含變量的表格形式數(shù)據(jù) 用table()函數(shù)

卡方檢驗(yàn)


4. 決策樹和隨機(jī)森林

(1)決策樹

預(yù)測(cè)模型

例子:預(yù)測(cè)腫瘤癌變追城,預(yù)測(cè)電子郵件是否垃圾郵件,預(yù)測(cè)風(fēng)險(xiǎn)因素燥撞。

下載安裝包"party"

加載

head() #查看變量名稱

函數(shù):ctree(formula,data) #data數(shù)據(jù)集


(2)隨機(jī)森林算法

創(chuàng)建大量決策樹座柱,輸出每個(gè)觀察的最多結(jié)果。多數(shù)投票

包:randomForest

加載party包

函數(shù):randomForest(formula, data) #創(chuàng)建和編輯物舒,語(yǔ)法和決策樹一樣

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末色洞,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子冠胯,更是在濱河造成了極大的恐慌火诸,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,110評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件荠察,死亡現(xiàn)場(chǎng)離奇詭異置蜀,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)悉盆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,443評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門盯荤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人焕盟,你說(shuō)我怎么就攤上這事秋秤。” “怎么了京髓?”我有些...
    開封第一講書人閱讀 165,474評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵航缀,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我堰怨,道長(zhǎng)芥玉,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,881評(píng)論 1 295
  • 正文 為了忘掉前任备图,我火速辦了婚禮灿巧,結(jié)果婚禮上赶袄,老公的妹妹穿的比我還像新娘。我一直安慰自己抠藕,他們只是感情好饿肺,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,902評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著盾似,像睡著了一般敬辣。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上零院,一...
    開封第一講書人閱讀 51,698評(píng)論 1 305
  • 那天溉跃,我揣著相機(jī)與錄音,去河邊找鬼告抄。 笑死撰茎,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的打洼。 我是一名探鬼主播龄糊,決...
    沈念sama閱讀 40,418評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼募疮!你這毒婦竟也來(lái)了炫惩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,332評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤酝锅,失蹤者是張志新(化名)和其女友劉穎诡必,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體搔扁,經(jīng)...
    沈念sama閱讀 45,796評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡爸舒,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,968評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了稿蹲。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扭勉。...
    茶點(diǎn)故事閱讀 40,110評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖苛聘,靈堂內(nèi)的尸體忽然破棺而出涂炎,到底是詐尸還是另有隱情,我是刑警寧澤设哗,帶...
    沈念sama閱讀 35,792評(píng)論 5 346
  • 正文 年R本政府宣布唱捣,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜哭廉,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,455評(píng)論 3 331
  • 文/蒙蒙 一萍丐、第九天 我趴在偏房一處隱蔽的房頂上張望拣宰。 院中可真熱鬧党涕,春花似錦、人聲如沸巡社。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,003評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)晌该。三九已至肥荔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間气笙,已是汗流浹背次企。 一陣腳步聲響...
    開封第一講書人閱讀 33,130評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留潜圃,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,348評(píng)論 3 373
  • 正文 我出身青樓舟茶,卻偏偏與公主長(zhǎng)得像谭期,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子吧凉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,047評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 來(lái)源: http://www.douban.com/group/topic/14820131/ 調(diào)整變量格式: f...
    MC1229閱讀 6,921評(píng)論 0 5
  • 按照用途分類出以下統(tǒng)計(jì)函數(shù): AVEDEV 用途:返回一組數(shù)據(jù)與其平均值的絕對(duì)偏差的平均值隧出,該函數(shù)可以評(píng)測(cè)數(shù)據(jù)(例...
    四方院祭司閱讀 2,896評(píng)論 0 3
  • (轉(zhuǎn)自http://www.douban.com/group/topic/14820131/,轉(zhuǎn)自人大論壇) 調(diào)整...
    f382b3d9bdb3閱讀 10,493評(píng)論 0 8
  • 1. 平均值阀捅、中位數(shù)和模式 Mean平均值I. 語(yǔ)法用于計(jì)算R中的平均值的基本語(yǔ)法是 -mean(x, trim ...
    _凌浩雨閱讀 1,534評(píng)論 0 2
  • 讀書筆記(R語(yǔ)言) 作者:曾健明公眾號(hào): 生信技能樹整理原因:在公眾號(hào)這篇文章中看到如下一段話胀瞪,自己最近又在練習(xí)用...
    6102閱讀 1,688評(píng)論 0 5