今天學(xué)習(xí)的內(nèi)容是R和Rstudio的安裝,以及R的基礎(chǔ)操作。學(xué)習(xí)資源主要有:
一仇味、認識R與Rstudio
- R:一種編程語言,匯集了許多函數(shù),能夠提供統(tǒng)計、繪圖等強大功能咱圆。
- Rstudio:R語言軟件界面簡陋,圖形界面的Rstudio能夠使R更方便使用功氨。RStudio是免費提供的開源集成開發(fā)環(huán)境(IDE)序苏。
二、安裝R與Rstudio
我的電腦之前已經(jīng)安裝了這兩個軟件捷凄,為了學(xué)習(xí)的完整性忱详,還是要梳理一下整個安裝的過程。并且跺涤,安裝會涉及用戶名中英文的問題匈睁,我在首次安裝的時候沒有遇到管钳,這次記錄了如果用戶名是英文,該怎么修改的方法软舌。
1. 查看電腦用戶名是中文還是英文
查看任意一個桌面文件的路徑,Desktop的上一級就是用戶名牛曹。
2. 修改用戶名
如果用戶名是中文佛点,則需要修改
電腦搜索欄 - 控制面板 - 環(huán)境變量 - 修改TEMP、TMP為不帶中文的路徑 - 重啟電腦
注:所有自己的重要文件要云備份:堅果云黎比、iCloud云盤都是非常好的雙向同步云
3.下載R與Rstudio
登錄官網(wǎng)后超营,按文末思維導(dǎo)圖的指引進行操作,比較簡單阅虫,不贅述演闭。下載好之后,打開Rstudio颓帝,界面長這樣:三米碰、Rstudio基本操作
1. 設(shè)置字體大小
Tools - Global Options - Appearance
2. 用Rproject管理工作目錄
新建project - New Directory - New project - 設(shè)置文件名、路徑 - 在文件夾里打開project
3. 顯示文件列表
getwd
:顯示當前路徑
setwd
:設(shè)置當前路徑购城,注意吕座,直接復(fù)制電腦的路徑過來,要把/改為\瘪板,否則識別不了
dir()
吴趴、list.files()
:顯示當前路徑有哪些文件
4.數(shù)學(xué)運算
加:a+b
減:a-b
乘:a*b
除:a/b
平方:a^b
開方:sqrt()
求絕對值:abs()
取對數(shù):loga(b)
5. 賦值
用<-
或->
賦值,箭頭指向?qū)ο笪昱剩珹lt+-可以打出锣枝。例如:x <-5
6. 刪除
刪除對象:rm()
刪除所有變量:rm(list = ls())
7. 歷史命令
history()
8. 清空控制臺
Ctrl+l
四、嘗試做幾個圖
- plot()函數(shù)
詳情參考:
- R語言基礎(chǔ)備忘-plot()詳解
- 聽說你還不會 plot 函數(shù)兰英? (這個鏈接講得很好理解)
plot()函數(shù)是基礎(chǔ) R 包 graphics 里的函數(shù)撇叁,對于繪制一些簡單基礎(chǔ)的圖形完全可以,想要繪制復(fù)雜一點的也是完全可以箭昵。
做一個圖試試:代碼如下
a<-c(1:5)
b<-c(2:6)
plot(a,b,type = "p",main="圖1",xlab="橫軸",ylab="縱軸",col="red")
定義變量a為1到5的整數(shù)税朴,定義變量b為2到6的整數(shù),圖的類型是點圖家制,標題為“圖1”正林,橫軸標注為“橫軸”,縱軸標注為“縱軸”颤殴,圖形顏色是紅色觅廓。
-
rnorm()函數(shù)
rnorm(n, mean = 0, sd = 1)
n 為產(chǎn)生隨機值個數(shù)(長度),mean 是平均數(shù)涵但, sd 是標準差 ,rnorm() 函數(shù)呈隨機正態(tài)分布杈绸,隨機抽樣或者取值 n 次帖蔓。
plot(rnorm(10,5,1))
的圖像如下:
圖2 -
runif()函數(shù)
runif()和rnorm()都是用于隨機生成數(shù)值的函數(shù),但是有區(qū)別瞳脓。注意對比兩者圖像的差異塑娇。
runif(n, min = 0, max = 1)
n為產(chǎn)生隨機值的個數(shù),min為最小值劫侧,max為最大值埋酬。
plot(runif(10,1,5))
的圖像如下:
圖3.PNG -
boxplot()函數(shù)
boxplot()用于繪制箱線圖∩斩埃可給出變量的中心趨勢写妥,發(fā)散情況和離群值。
箱子中間的線代表中位數(shù)审姓,表示平均水平珍特;箱子上下兩條邊分別代表第三、第一個四分位數(shù)魔吐,箱子的長度可反應(yīng)數(shù)據(jù)的離散情況扎筒;箱子外的上下兩條線代表最大最小值,線外的點可能為離群值画畅。
boxplot(iris$Sepal.Length~iris$Species,col = c("lightblue","lightyellow","lightpink"))
表示繪制一個箱線圖砸琅,呈現(xiàn)不同種類鳶尾花的花萼長度的統(tǒng)計情況,箱子的顏色分別為淺藍轴踱,淺黃症脂,淺粉。
圖4
注:iris是一個R語言自帶的數(shù)據(jù)框淫僻,通常用作示例诱篷。iris$Sepal.Length表示iris數(shù)據(jù)框的Sepal.Length這一列數(shù)據(jù)。以此類推雳灵。