Day6——Doc.Shu

R語言學習Day6——學習R包

Day6. 學習R包.png

1.安裝和加載R包

1.1 鏡像設置

# options函數(shù)就是設置R運行過程中的一些選項設置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對應清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對應中科大源

1.2 安裝R包

#根據(jù)目標R包的位置（CRAN網(wǎng)站或Biocductor）選擇對應的程序（通過谷歌搜索確定）
install.packages(“包”) #R包存在于CRAN網(wǎng)站
BiocManager::install(“包”)#R包存在于Biocductor

1.3 加載R包

前期僅是下載并安裝了R包饰抒，每次使用時，需要加載R包

#下面的兩個程序均可！
library(包)
require(包)

1.4 安裝三部曲

以R包dplyr為例

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #鏡像設置
install.packages("dplyr")#從CRAN網(wǎng)站下載dplyr包
library(dplyr)#安裝dplyr包

下述演示均基于內置數(shù)據(jù)集iris的簡化版

test <- iris[c(1:2,51:52,101:102),] #定義test數(shù)據(jù)集

2.dplyr五個基礎函數(shù)

2.1 新增列:mutate()

mutate(test, new = Sepal.Length * Sepal.Width)

image.png

2.2 按列篩選:select()

可分為兩種情況：按照列號篩選、按照列名篩選

#情況1：按照列號篩選
select(test,1) #篩選test數(shù)據(jù)集中的第1列
select(test,c(1,5)) #篩選test數(shù)據(jù)集中的第1列和第5列
#情況2：按照列號篩選
select(test,Sepal.Length)#篩選test數(shù)據(jù)集中列名為“Sepal.Length”的列
select(test,Petal.Length, Petal.Width)#篩選test數(shù)據(jù)集中列名為“Petal.Length”列和“Petal.Width”列

2.3 按行篩選:filter()

filter(test, Species == "setosa") #篩選test數(shù)據(jù)集中，Species為setosa的行
filter(test, Species == "setosa"&Sepal.Length > 5 )#篩選test數(shù)據(jù)集中屿聋，Species為setosa且Sepal.Length > 5的行
filter(test, Species %in% c("setosa","versicolor"))#篩選test數(shù)據(jù)集中，Species為setosa或versicolor的行

2.4 按列對整個表格進行排序:arrange()

arrange(test, Sepal.Length) #對test數(shù)據(jù)集的Sepal.Length排序（默認從小到大）
arrange(test, desc(Sepal.Length))#對test數(shù)據(jù)集的Sepal.Length排序從大到小排序

2.5 匯總：summarise()

summarise(test, mean(Sepal.Length)）#計算某一列(這里是Sepal.Length)的平均數(shù)
summarise(test, sd(Sepal.Length)）#計算某一列(這里是Sepal.Length)的標準差
summarise(test, mean(Sepal.Length), sd(Sepal.Length))#計算某一列(這里是Sepal.Length)的平均數(shù)和標準差
group_by(test, Species)#按照Species對數(shù)據(jù)分組
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))#按照Species對數(shù)據(jù)分組，然后求平均數(shù)和標準差

3.dplyr兩個實用技能

3.1 管道操作 %>% (cmd/ctr + shift + M)

test %>% 
  group_by(Species) %>% 
  summarise(mean(Sepal.Length), sd(Sepal.Length))

3.2 統(tǒng)計（count）某列的unique值

count(test,Species)#統(tǒng)計test數(shù)據(jù)集中嘱朽，species中的unique值

4.dplyr處理關系數(shù)據(jù)

示例數(shù)據(jù)如下

options(stringsAsFactors = F)

test1 <- data.frame(x = c('b','e','f','x'), 
                    z = c("A","B","C",'D'),
                    stringsAsFactors = F)
test1
##   x z
## 1 b A
## 2 e B
## 3 f C
## 4 x D
test2 <- data.frame(x = c('a','b','c','d','e','f'), 
                    y = c(1,2,3,4,5,6),
                    stringsAsFactors = F)
test2 
##   x y
## 1 a 1
## 2 b 2
## 3 c 3
## 4 d 4
## 5 e 5
## 6 f 6

4.1 內連inner_join,取交集

inner_join(test1, test2, by = "x")

4.2 左連left_join

left_join(test1, test2, by = 'x')

4.3 全連full_join

full_join( test1, test2, by = 'x')

4.4 半連接：返回能夠與y表匹配的x表所有記錄semi_join

semi_join(x = test1, y = test2, by = 'x')

4.5 反連接：返回無法與y表匹配的x表的所記錄anti_join

anti_join(x = test2, y = test1, by = 'x')

4.6 簡單合并

Diginity in plain.

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市怔接，隨后出現(xiàn)的幾起案子搪泳，更是在濱河造成了極大的恐慌，老刑警劉巖蜕提，帶你破解...
沈念sama閱讀 206,013評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件森书，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機凛膏，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,205評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門杨名，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人猖毫，你說我怎么就攤上這事台谍。” “怎么了吁断？”我有些...
開封第一講書人閱讀 152,370評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵趁蕊，是天一觀的道長。經常有香客問我仔役，道長掷伙，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,168評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任又兵，我火速辦了婚禮任柜，結果婚禮上，老公的妹妹穿的比我還像新娘沛厨。我一直安慰自己宙地，他們只是感情好，可當我...
茶點故事閱讀 64,153評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布逆皮。她就那樣靜靜地躺著宅粥，像睡著了一般。火紅的嫁衣襯著肌膚如雪电谣。梳的紋絲不亂的頭發(fā)上秽梅，一...
開封第一講書人閱讀 48,954評論 1贊 283
城市分裂傳說
那天，我揣著相機與錄音辰企，去河邊找鬼风纠。笑死，一個胖子當著我的面吹牛牢贸，可吹牛的內容都是我干的竹观。我是一名探鬼主播，決...
沈念sama閱讀 38,271評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼潜索，長吁一口氣：“原來是場噩夢啊……” “哼臭增！你這毒婦竟也來了？” 一聲冷哼從身側響起竹习，我...
開封第一講書人閱讀 36,916評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤誊抛，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后整陌，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拗窃，經...
沈念sama閱讀 43,382評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡瞎领，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 35,877評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了随夸。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片九默。...
茶點故事閱讀 37,989評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖宾毒，靈堂內的尸體忽然破棺而出驼修，到底是詐尸還是另有隱情，我是刑警寧澤诈铛，帶...
沈念sama閱讀 33,624評論 4贊 322
?日本核電站爆炸內幕
正文年R本政府宣布乙各，位于F島的核電站，受9級特大地震影響幢竹，放射性物質發(fā)生泄漏耳峦。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,209評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一妨退、第九天我趴在偏房一處隱蔽的房頂上張望妇萄。院中可真熱鬧，春花似錦咬荷、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,199評論 0贊 19
一樁弒父案幸乒，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至唇牧，卻和暖如春罕扎，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背丐重。一陣腳步聲響...
開封第一講書人閱讀 31,418評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工腔召，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人扮惦。一個月前我還...
沈念sama閱讀 45,401評論 2贊 352
代替公主和親
正文我出身青樓臀蛛，卻偏偏與公主長得像，于是被迫代替她去往敵國和親崖蜜。傳聞我的和親對象是個殘疾皇子浊仆，可洞房花燭夜當晚...
茶點故事閱讀 42,700評論 2贊 345

Day6——Doc.Shu

R語言學習Day6——學習R包

1.安裝和加載R包

1.1 鏡像設置

1.2 安裝R包

1.3 加載R包

1.4 安裝三部曲

2.dplyr五個基礎函數(shù)

2.1 新增列:mutate()

2.2 按列篩選:select()

2.3 按行篩選:filter()

2.4 按列對整個表格進行排序:arrange()

2.5 匯總：summarise()

3.dplyr兩個實用技能

3.1 管道操作 %>% (cmd/ctr + shift + M)

3.2 統(tǒng)計（count）某列的unique值

4.dplyr處理關系數(shù)據(jù)

4.1 內連inner_join,取交集

4.2 左連left_join

4.3 全連full_join

4.4 半連接：返回能夠與y表匹配的x表所有記錄semi_join

4.5 反連接：返回無法與y表匹配的x表的所記錄anti_join

4.6 簡單合并

推薦閱讀更多精彩內容