整體的描述性統(tǒng)計(jì)量
1. summary()函數(shù)可以獲取描述性統(tǒng)計(jì)量
可以提供最小值秋泳、最大值迫皱、四分位數(shù)和數(shù)值型變量的均值,以及因子向量和邏輯型向量的頻數(shù)統(tǒng)計(jì)
2. misc包中的describe()函數(shù)
可返回變量和觀測(cè)的數(shù)量卓起、缺失值和唯一值的數(shù)目戏阅、平均值啤它、分位數(shù),以及五個(gè)最大的值和五個(gè)最小的值
3. psych包中的describe()函數(shù)
psych包也擁有一個(gè)名為describe()的函數(shù)蚕键,它可以計(jì)算非缺失值的數(shù)量锣光、平均數(shù)铝耻、標(biāo)準(zhǔn)差、中位數(shù)瓢捉、截尾均值、絕對(duì)中位差搂漠、最小值某弦、最大值、值域怔毛、偏度腾降、峰度和平均值的標(biāo)準(zhǔn)誤
4. pastecs包中的stat.desc()的函數(shù)
可以計(jì)算種類繁多的描述性統(tǒng)計(jì)量。使用格式為:stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)
其中的x是一個(gè)數(shù)據(jù)框或時(shí)間序列抗果。
若basic=TRUE(默認(rèn)值)窖张,則計(jì)算其中所有值、空值赘淮、缺失值的數(shù)量睦霎,以及最小值、最大值霉祸、值域梯投,還有總和沟涨。
若desc=TRUE(同樣也是默認(rèn)值),則計(jì)算中位數(shù)喜庞、平均數(shù)延都、平均數(shù)的標(biāo)準(zhǔn)誤睛竣、平均數(shù)置信度為95%的置信區(qū)間射沟、方差、標(biāo)準(zhǔn)差以及變異系數(shù)幽污。
最后簿姨,若norm=TRUE(不是默認(rèn)的)簸搞,則返回正態(tài)分布統(tǒng)計(jì)量趁俊,包括偏度和峰度(以及它們的統(tǒng)計(jì)顯著程度)和Shapiro–Wilk正態(tài)檢驗(yàn)結(jié)果
5. str()函數(shù)
以簡(jiǎn)潔的方式顯示對(duì)象的數(shù)據(jù)結(jié)構(gòu)及內(nèi)容刑然,可以查看數(shù)據(jù)框中每個(gè)變量的屬性
6. attributes()函數(shù)
可以提取對(duì)象除長(zhǎng)度和模式以外的各種屬性
各組的描述性統(tǒng)計(jì)信息
7. aggregate()函數(shù)
僅允許在每次調(diào)用中使用平均數(shù)、標(biāo)準(zhǔn)差這樣的單返回值函數(shù)怔软,它無法一次返回若干個(gè)統(tǒng)計(jì)量
8. by()函數(shù)
格式為:by(data,INDICES,FUN)挡逼,其中data是一個(gè)數(shù)據(jù)框或矩陣腻豌,INDICES是一個(gè)因子或因子組成的列表吝梅,定義了分組,F(xiàn)UN是任意函數(shù)做瞪。
9. doBy包中的summaryBy()函數(shù)
10. psych包中的describe.by()函數(shù)
比較兩個(gè)數(shù)據(jù)集不同的Column Name
# 方法1
names(cprv_tongyong [, !pmatch(names(cprv_tongyong),names(cprv_tongyong_all),0)])
# 方法2
names(cprv_tongyong [, !match(names(cprv_tongyong),names(cprv_tongyong_all),0)])
# 方法3
names(car_data_58_all[,!names(car_data_58_all) %in% names(car_data_58)])
# 方法4
car_data_58_diff <-car_data_58_all[which( car_data_58$id %in% car_data_58_all$id),]
如果結(jié)果是:character(0) , 是數(shù)據(jù)集關(guān)系寫反了穿扳。
比較兩個(gè)字符串不同的內(nèi)容
cc[!cc %in% xc] # 字符串