今天介紹幾個(gè)常見的數(shù)據(jù)處理的方法
1.向一橫行的數(shù)據(jù)里面加入一列變量 R語言
用transform函數(shù)
向data這個(gè)是數(shù)據(jù)框中中加入id這一列金砍,其中id是值是name
data <- transform(data,id=name)
2.把一列數(shù)據(jù)轉(zhuǎn)變?yōu)橐粰M行的數(shù)據(jù)
t()這個(gè)函數(shù),不需專門加載包
data <- t(data)
這個(gè)跟excel里面的轉(zhuǎn)置的功能差不多
3.篩選子集唐断,跨數(shù)據(jù)庫篩出某個(gè)特定條件下的數(shù)據(jù)
用?%in%?
比如?a?%in%?b
在a里面篩選出包含在b里面的數(shù)據(jù)
一般是和subset()一起聯(lián)合使用
在a這個(gè)數(shù)據(jù)框中篩選出id在b數(shù)據(jù)框的數(shù)據(jù)麸祷,subset這個(gè)函數(shù)其實(shí)是取a這個(gè)數(shù)據(jù)框的子集
a <- subset(a,a$id?%in%?b$id)
本身subset()這個(gè)功能跟excel的篩選功能差不多澎怒,就是選取一個(gè)數(shù)據(jù)庫的子集,但是聯(lián)合了%in%??之后,就可以實(shí)現(xiàn)跨數(shù)據(jù)庫的篩選和匹配了喷面,功能有點(diǎn)類似于Excel的vlookup的功能星瘾,當(dāng)然,在可視化這個(gè)方面惧辈,excel要比r語言更勝一籌琳状。