學(xué)習(xí)R-描述性統(tǒng)計(jì)

1 sapply

> mydata <- read.csv("exp.csv",header = T,sep = ",") #表達(dá)量矩陣疯暑,首行為表頭
> class(mydata)    
[1] "data.frame"
> sapply(mydata,mean,na.rm=TRUE)   #獲得數(shù)據(jù)框每列的平均值
gene_id        R1        R2        R3        G1        G2        G3 
   NA   7.29500   6.24375  19.65438 124.26750  55.18437 232.05312 
`Warning message:`
` In mean.default(X[[i]], ...) : 參數(shù)不是數(shù)值也不是邏輯值:回覆NA`

sapply還可以使用mean, sd, var, min, max, median, range, quantile,但是數(shù)據(jù)類型不同.

2 summary

> summary(mydata)
#獲得mean,median,25th and 75th quartiles,min,max

3 fivenum()

> fivenum(x, na.rm = TRUE)

x 為數(shù)值型向量,可以包含NA以及Inf垒手,-Inf
na.rm = TRUE 默認(rèn)將NA和NaN去除,但是Inf還保留喳坠。
fivenum()函數(shù)返回5個(gè)值:Tukey min,lower-hinge, median,upper-hinge,max丈钙。要注意這里的兩個(gè)hinge與分位數(shù)不同。
比如1:10

> fivenum(1:10)
[1]  1.0  3.0  5.5  8.0 10.0

fivenum取中間兩個(gè)數(shù)5胸懈,6取平均值得到中位數(shù)5.5担扑,然后從1,2趣钱,3涌献,4,5.5中取中位數(shù)得到3即為lower-hinge首有。

4 使用Hmisc包

> library(Hmisc)
 > describe(mydata) 
# n, nmiss, unique, mean, 5,10,25,50,75,90,95th percentiles 
# 5 lowest and 5 highest scores

5 使用pastecs包

> library(pastecs)
> stat.desc(mydata) 
# nbr.val, nbr.null, nbr.na, min max, range, sum, 
# median, mean, SE.mean, CI.mean, var, std.dev, coef.var

6使用psych包

>library(psych)
>describe(mydata)
# item name ,item number, nvalid, mean, sd, 
# median, mad, min, max, skew, kurtosis, se

按分組變量匯總信息

> library(psych)
> describe.by(x, group=NULL,mat=FALSE,type=3,...)

7 使用doBy包

> library(doBy)
> summaryBy(mpg + wt ~ cyl + vs, data = mtcars, 
 >  FUN = function(x) { c(m = mean(x), s = sd(x)) } )
# produces mpg.m wt.m mpg.s wt.s for each 
# combination of the levels of cyl and vs
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末燕垃,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子井联,更是在濱河造成了極大的恐慌卜壕,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,185評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件烙常,死亡現(xiàn)場(chǎng)離奇詭異轴捎,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)蚕脏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門侦副,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人驼鞭,你說我怎么就攤上這事秦驯。” “怎么了挣棕?”我有些...
    開封第一講書人閱讀 163,524評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵汇竭,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我穴张,道長(zhǎng),這世上最難降的妖魔是什么两曼? 我笑而不...
    開封第一講書人閱讀 58,339評(píng)論 1 293
  • 正文 為了忘掉前任皂甘,我火速辦了婚禮,結(jié)果婚禮上悼凑,老公的妹妹穿的比我還像新娘偿枕。我一直安慰自己璧瞬,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,387評(píng)論 6 391
  • 文/花漫 我一把揭開白布渐夸。 她就那樣靜靜地躺著嗤锉,像睡著了一般。 火紅的嫁衣襯著肌膚如雪墓塌。 梳的紋絲不亂的頭發(fā)上瘟忱,一...
    開封第一講書人閱讀 51,287評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音苫幢,去河邊找鬼访诱。 笑死,一個(gè)胖子當(dāng)著我的面吹牛韩肝,可吹牛的內(nèi)容都是我干的触菜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,130評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼哀峻,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼涡相!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起剩蟀,我...
    開封第一講書人閱讀 38,985評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤催蝗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后喻旷,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體生逸,經(jīng)...
    沈念sama閱讀 45,420評(píng)論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,617評(píng)論 3 334
  • 正文 我和宋清朗相戀三年且预,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了槽袄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,779評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡锋谐,死狀恐怖遍尺,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情涮拗,我是刑警寧澤乾戏,帶...
    沈念sama閱讀 35,477評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站三热,受9級(jí)特大地震影響鼓择,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜就漾,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,088評(píng)論 3 328
  • 文/蒙蒙 一呐能、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦摆出、人聲如沸朗徊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽爷恳。三九已至,卻和暖如春象踊,著一層夾襖步出監(jiān)牢的瞬間温亲,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評(píng)論 1 269
  • 我被黑心中介騙來泰國打工通危, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留铸豁,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,876評(píng)論 2 370
  • 正文 我出身青樓菊碟,卻偏偏與公主長(zhǎng)得像节芥,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子逆害,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,700評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • pyspark.sql模塊 模塊上下文 Spark SQL和DataFrames的重要類: pyspark.sql...
    mpro閱讀 9,451評(píng)論 0 13
  • 往期文章中头镊,我們已經(jīng)學(xué)會(huì)了使用圖形探索數(shù)據(jù),例如可以用條形圖了解類別變量的分布魄幕,用堆砌條形圖或分組條形圖比較不同類...
    鯊瓜閱讀 2,665評(píng)論 0 3
  • sapply( )函數(shù) r語言中summary()函數(shù)提供了最小值相艇、最大值、四分位數(shù)和數(shù)值型變量的均值纯陨,以及因子向...
    肖玉賢閱讀 4,476評(píng)論 0 0
  • 1.Java面試題:Servlet是線程安全的嗎坛芽? https://www.cnblogs.com/chanshu...
    只當(dāng)興趣閱讀 137評(píng)論 0 0
  • 我記得你的 你是我昨夜夢(mèng)里的月光 你流連在 古鎮(zhèn)的巷子里 在 河沿低矮石階的青苔上 你見過他揚(yáng)起小水花對(duì)她笑 是啊...
    雨籬閱讀 246評(píng)論 5 5