fitdistrplus 檢驗數(shù)據(jù)的分布

一般各種分析其實都是有一定的數(shù)學模型和假設的，有些也相應對輸入數(shù)據(jù)的分布有一定要求。如果不確定自己數(shù)據(jù)是否符合要求疚漆，最好先檢測一下甚脉。比如有時候你糾結使用 FPKM 還是 log2(FPKM + 1) 猴凹，此時查半天資料或許不如自己看看2個數(shù)據(jù)分布的區(qū)別土至。
R包 fitdistrplus 函數(shù) fitdist 檢驗非刪失數(shù)據(jù)的一元分布毡庆，相應的 fitdistcens 則用于檢驗刪失數(shù)據(jù)蝇刀。函數(shù)默認參數(shù)：

fitdist(data, distr, method = c("mle", "mme", "qme", "mge"), start=NULL, fix.arg=NULL, discrete, keepdata = TRUE, keepdata.nb=100, ...)

部分參數(shù)解釋

data: 檢驗的數(shù)據(jù)，是個向量切诀。
distr: 檢驗的分布名。
method: 檢驗擬合的方法认臊，"mle"代表"maximum likelihood estimation"(最大似然估計),"mme"代表"moment matching estimation"(矩估計),"qme"代表"quantile matching estimation","mge"代表"maximum goodness-of-estimation"。
discrete: 是否為離散型分布栈源。如果不設置會根據(jù) distr 參數(shù)來自動設定，在 distr 為 "binom", "nbinom", "geom", "hyper", "pois" 這些值時為 TRUE 否則 FALSE 伶棒。

下面給出可以使用的 distr 參數(shù)分布名字眯搭。所以如果你想檢驗泊松分布，那么使用 "pois" 而不是 "Poisson" 盗痒。

Distribution	Name
beta	beta
binomial	binom
Cauchy	cauchy
chi-squared	chisq
exponential	exp
F	f
gamma	gamma
geometric	geom
hypergeometric	hyper
log-normal	lnorm
logistic	logis
negative binomial	nbinom
normal	norm
Poisson	pois
signed rank	signrank
Student's t	t
uniform	unif
Weibull	weibull
Wilcoxon	wilcox

"Talk is cheap" 讓我們看看代碼實例梦重。數(shù)據(jù)采用R自帶的 lung 數(shù)據(jù)集除师。

> head(lung, n = 3)
  inst time status age sex ph.ecog ph.karno pat.karno meal.cal wt.loss
1    3  306      2  74   1       1       90       100     1175      NA
2    3  455      2  68   1       0       90        90     1225      15
3    3 1010      1  56   1       0       90        90       NA      15

檢驗一下病人年齡分布。比較正態(tài)分布 norm 和對數(shù)正態(tài)分布 lnorm 哪個模型更適合。

正態(tài)分布

> fitNorm <- fitdist(lung$age, "norm", method = "mme")
> summary(fitNorm)
Fitting of the distribution ' norm ' by matching moments 
Parameters : 
      estimate
mean 62.447368
sd    9.053537
Loglikelihood:  -825.8374   AIC:  1655.675   BIC:  1662.534 
> plot(fitNorm)

正態(tài)分布

對數(shù)正態(tài)分布

> fitLnorm <- fitdist(lung$age, "lnorm", method = "mme")
> summary(fitLnorm)
Fitting of the distribution ' lnorm ' by matching moments 
Parameters : 
         estimate
meanlog 4.1239236
sdlog   0.1442254
Loglikelihood:  -835.8495   AIC:  1675.699   BIC:  1682.558 
> plot(fitLnorm)

對數(shù)正態(tài)分布

返回的 AIC, BIC 之類的參數(shù)我沒搞懂入宦，也不想太深究汹忠。從兩個分布的圖片來看铅乡，正態(tài)分布要好于對數(shù)正態(tài)分布挚赊。

[參考]
An Introduction to R
https://cran.r-project.org/web/packages/fitdistrplus/vignettes/FAQ.html

最后編輯于：2020.07.17 16:41:21

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末雕崩，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子融撞，更是在濱河造成了極大的恐慌盼铁，老刑警劉巖，帶你破解...
沈念sama閱讀 222,183評論 6贊 516
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件尝偎，死亡現(xiàn)場離奇詭異饶火，居然都是意外死亡鹏控，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,850評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門肤寝，熙熙樓的掌柜王于貴愁眉苦臉地迎上來当辐，“玉大人，你說我怎么就攤上這事鲤看≡稻荆” “怎么了？”我有些...
開封第一講書人閱讀 168,766評論 0贊 361
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵义桂，是天一觀的道長找筝。經(jīng)常有香客問我，道長慷吊，這世上最難降的妖魔是什么袖裕？我笑而不...
開封第一講書人閱讀 59,854評論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮溉瓶，結果婚禮上急鳄，老公的妹妹穿的比我還像新娘。我一直安慰自己堰酿，他們只是感情好疾宏，可當我...
茶點故事閱讀 68,871評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著胞锰，像睡著了一般灾锯。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上嗅榕，一...
開封第一講書人閱讀 52,457評論 1贊 311
城市分裂傳說
那天顺饮，我揣著相機與錄音，去河邊找鬼凌那。笑死兼雄，一個胖子當著我的面吹牛，可吹牛的內容都是我干的帽蝶。我是一名探鬼主播赦肋，決...
沈念sama閱讀 40,999評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼励稳！你這毒婦竟也來了佃乘？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 39,914評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤驹尼，失蹤者是張志新（化名）和其女友劉穎趣避，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體新翎，經(jīng)...
沈念sama閱讀 46,465評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡程帕，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 38,543評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年住练，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片愁拭。...
茶點故事閱讀 40,675評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡讲逛，死狀恐怖，靈堂內的尸體忽然破棺而出岭埠，到底是詐尸還是另有隱情盏混，我是刑警寧澤，帶...
沈念sama閱讀 36,354評論 5贊 351
?日本核電站爆炸內幕
正文年R本政府宣布枫攀，位于F島的核電站括饶，受9級特大地震影響，放射性物質發(fā)生泄漏来涨。R本人自食惡果不足惜图焰，卻給世界環(huán)境...
茶點故事閱讀 42,029評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望蹦掐。院中可真熱鬧技羔，春花似錦、人聲如沸卧抗。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,514評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽社裆。三九已至拙绊，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間泳秀，已是汗流浹背标沪。一陣腳步聲響...
開封第一講書人閱讀 33,616評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嗜傅，地道東北人金句。一個月前我還...
沈念sama閱讀 49,091評論 3贊 378
代替公主和親
正文我出身青樓，卻偏偏與公主長得像吕嘀，于是被迫代替她去往敵國和親违寞。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 45,685評論 2贊 360

fitdistrplus 檢驗數(shù)據(jù)的分布

正態(tài)分布

對數(shù)正態(tài)分布

推薦閱讀更多精彩內容