R數(shù)據(jù)科學(xué)--詳解ggplot2
R for Data Science
1.安裝R和Rstudio
Rstudio相當(dāng)于R語言的一個人性化/圖形的界面
果子學(xué)生信 給自己一個全新的R語言環(huán)境
之前有裝過舷蒲,但感覺還是很陌生。行楞。韧献。
2.粗略了解R語言长赞、Rstudio
[圖片上傳失敗...(image-fdc38d-1619083056171)]
1:腳本區(qū)域
腳本區(qū)域的主要作用是記錄代碼渠啤。A區(qū)域的頂上的標(biāo)簽可以切換跛锌。A區(qū)域中的腳本的內(nèi)容可以查找贱呐,刪除丧诺,替換,回撤奄薇〔笛郑快捷鍵如下:
Ctrl + F 查找(替換)
Ctrl + Z 回撤
2:交互區(qū)域/控制臺(腳本運行和結(jié)果顯示)
交互區(qū)域是你與R語言談話的一個區(qū)域,你輸入一個命令,R給你返回一個結(jié)果呵晚。B區(qū)域會記錄你之前運行過的命令蜘腌,可以通過“↑”和“↓”查找之前運行的命令。
3:參數(shù)區(qū)域(環(huán)境/對象/變量列表劣纲;歷史命令)
參數(shù)區(qū)域會記錄你賦值的變量逢捺,之前運行過的命令●荆可以直接點擊變量名稱查看劫瞳,也通過點擊命令,將命令快速存儲在腳本區(qū)域內(nèi)绷柒。
參數(shù)區(qū)域的import dataset這個功能大家以后可能會經(jīng)常用的志于,它的作用是導(dǎo)入外部數(shù)據(jù),并且自動生成響應(yīng)的代碼在交互區(qū)域废睦。
4:輔助區(qū)域(文件/圖片/幫助/包)
輔助區(qū)域是一個非常友好的區(qū)域伺绽,在這個區(qū)域里面,我們可以查看已經(jīng)安裝的R包嗜湃,加載新的R包奈应,查看幫助文檔,顯示繪圖以及管理你的R文檔购披,我愛輔助區(qū)域杖挣!
3.嘗試兩個函數(shù)
plot()
plot()函數(shù)是一種常用的繪圖函數(shù),用其可以繪制散點圖刚陡、曲線圖等惩妇。
R語言中plot()函數(shù)的基本格式如下:
plot(x,y,...)
plot函數(shù)中,x和y分別表示所繪圖形的橫坐標(biāo)和縱坐標(biāo)筐乳;函數(shù)中的...為附加的參數(shù)歌殃。
plot函數(shù)默認(rèn)的使用格式如下:
plot(x, y = NULL, type = "p", xlim = NULL, ylim = NULL, log = "", main = NULL, sub = NULL, xlab = NULL, ylab = NULL, ann = par("ann"), axes = TRUE, frame.plot = axes, panel.first = NULL, panel.last = NULL, asp = NA, ...)
主要參數(shù)的含義如下:
(1)type為一個字符的字符串,用于給定繪圖的類型蝙云,可選的值如下:
"p":繪點(默認(rèn)值)氓皱;
"l":繪制線;
"b":同時繪制點和線勃刨;
"c":僅繪制參數(shù)"b"所示的線波材;
"o":同時繪制點和線,且線穿過點朵你;
"h":繪制出點到橫坐標(biāo)軸的垂直線各聘;
"s":繪制出階梯圖(先橫后縱);
"S":繪制出階梯圖(先縱后豎)抡医;
"n":作空圖躲因。
(2)main參數(shù) 字符串早敬,給出圖形的標(biāo)題;
(3)sub參數(shù) 字符串大脉,給出圖形的子標(biāo)題搞监;
(4)xlab 和 ylab參數(shù) 字符串,用于給出x軸和y軸的標(biāo)簽镰矿。
(5)xlim 和 ylim參數(shù) 都是二維向量琐驴,分別表示x軸和y軸的取值范圍。
rnorm(n, mean = 0, sd = 1)
n 為產(chǎn)生隨機(jī)值個數(shù)(長度)秤标,mean 是平均數(shù)绝淡, sd 是標(biāo)準(zhǔn)差 。
使用該函數(shù)的時候后苍姜,一般要賦予它 3個值.
rnorm() 函數(shù)會隨機(jī)正態(tài)分布牢酵,然后隨機(jī)抽樣 或者取值 n 次,
rnorm(5衙猪,0,1) 以N(0,1)的正態(tài)分布馍乙,分別列出5個值。
r 這列代表隨機(jī)垫释,可以替換成dnorm, pnorm, qnorm 作不同計算
r = random = 隨機(jī)丝格, d= density = 密度, p= probability = 概率 棵譬, q =quantile = 分位
plot(rnorm(50))
boxplot()
boxplot(iris$Sepal.Length~iris$Species,col = c("lightblue","lightyellow","lightpink"))
iris是R語言自帶的一個數(shù)據(jù)框.講解函數(shù)時以iris數(shù)據(jù)集為基礎(chǔ)可以方便理解显蝌。(https://zhuanlan.zhihu.com/p/26383846)
iris以鳶尾花的特征作為數(shù)據(jù)來源,常用在分類操作中茫船。該數(shù)據(jù)集由3種不同類型的鳶尾花的50個樣本數(shù)據(jù)構(gòu)成琅束。其中的一個種類與另外兩個種類是線性可分離的扭屁,后兩個種類是非線性可分離的算谈。 該數(shù)據(jù)集包含了5個屬性:
Sepal.Length(花萼長度),單位是cm;
Sepal.Width(花萼寬度)料滥,單位是cm;
Petal.Length(花瓣長度)然眼,單位是cm;
Petal.Width(花瓣寬度),單位是cm;
種類:Setosa(山鳶尾)葵腹、Versicolour(雜色鳶尾)高每,以及Virginica(維吉尼亞鳶尾)。
4.學(xué)會外觀設(shè)置和基本操作
設(shè)置字體大小
用Rproject管理工作目錄
R語言只能和一個文件夾進(jìn)行互動
R-project管理多個R工作目錄-生物星球
#設(shè)置工作目錄:setwd()
#查看工作目錄:getwd()
getwd()
[1] "D:/bio/入門學(xué)習(xí)"
發(fā)現(xiàn)了寶藏“生信技能樹”
隔壁生信技能樹公益視頻合輯(學(xué)習(xí)順序是linux践宴,r鲸匿,軟件安裝,geo阻肩,小技巧带欢,ngs組學(xué)T耸凇)
國內(nèi)看B站,教學(xué)視頻鏈接:https://m.bilibili.com/space/338686099
國外看YouTube乔煞,教學(xué)視頻鏈接:https://m.youtube.com/channel/UC67sImqK7V8tSWHMG8azIVA/playlists
友情鏈接:
生信工程師入門最佳指南
學(xué)徒培養(yǎng)
資料大全
顯示文件列表
#直接打命令不跟路徑會顯示默認(rèn)路徑吁朦,也就是工作目錄。相當(dāng)于linux的ls渡贾。
> dir()
[1] "入門學(xué)習(xí).Rproj"
> list.files()
[1] "入門學(xué)習(xí).Rproj"
#在文件夾內(nèi)新建一個txt
> list.files()
[1] "入門學(xué)習(xí).Rproj" "學(xué)習(xí).txt"
加減乘除
> 1+2
[1] 3
> 1-2
[1] -1
> 1*2
[1] 2
> 3^2
[1] 9
> 1/2
[1] 0.5
> sqrt(9)
[1] 3
> abs(-5)
[1] 5
> log2(16)
[1] 4
> log10(1000)
[1] 3
賦值
> x <- 3+3
#賦值后逗宜,x會顯示在右上角的框,Environment里的Value列表里
> x
[1] 6
刪除變量
> a<-3
> b <- 1
> c <- 4
> u <- 5+6
> rm(b)
> rm(a,u)
> rm(list=ls()) #刪除所有變量
列出歷史命令
history() #相當(dāng)于鼠標(biāo)單擊右上角的history標(biāo)簽
當(dāng)你雙擊參數(shù)區(qū)歷史命令中的某個命令空骚,他就會跳到你的控制臺大于號后面了纺讲,可以修改后運行。
清空控制臺
快捷鍵ctrl+l