fitdistrplus 檢驗數(shù)據(jù)的分布

一般各種分析其實都是有一定的數(shù)學模型和假設的,有些也相應對輸入數(shù)據(jù)的分布有一定要求。如果不確定自己數(shù)據(jù)是否符合要求疚漆,最好先檢測一下甚脉。比如有時候你糾結使用 FPKM 還是 log2(FPKM + 1) 猴凹,此時查半天資料或許不如自己看看2個數(shù)據(jù)分布的區(qū)別土至。
R包 fitdistrplus 函數(shù) fitdist 檢驗非刪失數(shù)據(jù)的一元分布毡庆,相應的 fitdistcens 則用于檢驗刪失數(shù)據(jù)蝇刀。函數(shù)默認參數(shù):

fitdist(data, distr, method = c("mle", "mme", "qme", "mge"), start=NULL, fix.arg=NULL, discrete, keepdata = TRUE, keepdata.nb=100, ...)

部分參數(shù)解釋

  • data: 檢驗的數(shù)據(jù),是個向量切诀。
  • distr: 檢驗的分布名。
  • method: 檢驗擬合的方法认臊,"mle"代表"maximum likelihood estimation"(最大似然估計),"mme"代表"moment matching estimation"(矩估計),"qme"代表"quantile matching estimation","mge"代表"maximum goodness-of-estimation"。
  • discrete: 是否為離散型分布栈源。如果不設置會根據(jù) distr 參數(shù)來自動設定,在 distr 為 "binom", "nbinom", "geom", "hyper", "pois" 這些值時為 TRUE 否則 FALSE 伶棒。

下面給出可以使用的 distr 參數(shù)分布名字眯搭。所以如果你想檢驗泊松分布,那么使用 "pois" 而不是 "Poisson" 盗痒。

Distribution Name
beta beta
binomial binom
Cauchy cauchy
chi-squared chisq
exponential exp
F f
gamma gamma
geometric geom
hypergeometric hyper
log-normal lnorm
logistic logis
negative binomial nbinom
normal norm
Poisson pois
signed rank signrank
Student's t t
uniform unif
Weibull weibull
Wilcoxon wilcox

"Talk is cheap" 讓我們看看代碼實例梦重。數(shù)據(jù)采用R自帶的 lung 數(shù)據(jù)集除师。

> head(lung, n = 3)
  inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
1    3  306      2  74   1       1       90       100     1175      NA
2    3  455      2  68   1       0       90        90     1225      15
3    3 1010      1  56   1       0       90        90       NA      15

檢驗一下病人年齡分布。比較正態(tài)分布 norm 和對數(shù)正態(tài)分布 lnorm 哪個模型更適合。

正態(tài)分布

> fitNorm <- fitdist(lung$age, "norm", method = "mme")
> summary(fitNorm)
Fitting of the distribution ' norm ' by matching moments 
Parameters : 
      estimate
mean 62.447368
sd    9.053537
Loglikelihood:  -825.8374   AIC:  1655.675   BIC:  1662.534 
> plot(fitNorm)
正態(tài)分布

對數(shù)正態(tài)分布

> fitLnorm <- fitdist(lung$age, "lnorm", method = "mme")
> summary(fitLnorm)
Fitting of the distribution ' lnorm ' by matching moments 
Parameters : 
         estimate
meanlog 4.1239236
sdlog   0.1442254
Loglikelihood:  -835.8495   AIC:  1675.699   BIC:  1682.558 
> plot(fitLnorm)
對數(shù)正態(tài)分布

返回的 AIC, BIC 之類的參數(shù)我沒搞懂入宦,也不想太深究汹忠。從兩個分布的圖片來看铅乡,正態(tài)分布要好于對數(shù)正態(tài)分布挚赊。

[參考]
An Introduction to R
https://cran.r-project.org/web/packages/fitdistrplus/vignettes/FAQ.html

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末雕崩,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子融撞,更是在濱河造成了極大的恐慌盼铁,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件尝偎,死亡現(xiàn)場離奇詭異饶火,居然都是意外死亡鹏控,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門肤寝,熙熙樓的掌柜王于貴愁眉苦臉地迎上來当辐,“玉大人,你說我怎么就攤上這事鲤看≡稻荆” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵义桂,是天一觀的道長找筝。 經(jīng)常有香客問我,道長慷吊,這世上最難降的妖魔是什么袖裕? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮溉瓶,結果婚禮上急鳄,老公的妹妹穿的比我還像新娘。我一直安慰自己堰酿,他們只是感情好疾宏,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著胞锰,像睡著了一般灾锯。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上嗅榕,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天顺饮,我揣著相機與錄音,去河邊找鬼凌那。 笑死兼雄,一個胖子當著我的面吹牛,可吹牛的內容都是我干的帽蝶。 我是一名探鬼主播赦肋,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼励稳!你這毒婦竟也來了佃乘?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤驹尼,失蹤者是張志新(化名)和其女友劉穎趣避,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體新翎,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡程帕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年住练,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片愁拭。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡讲逛,死狀恐怖,靈堂內的尸體忽然破棺而出岭埠,到底是詐尸還是另有隱情盏混,我是刑警寧澤,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布枫攀,位于F島的核電站括饶,受9級特大地震影響,放射性物質發(fā)生泄漏来涨。R本人自食惡果不足惜图焰,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望蹦掐。 院中可真熱鬧技羔,春花似錦、人聲如沸卧抗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽社裆。三九已至拙绊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間泳秀,已是汗流浹背标沪。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嗜傅,地道東北人金句。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像吕嘀,于是被迫代替她去往敵國和親违寞。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內容