001 什么是數(shù)據(jù)分析:從海量的數(shù)據(jù)中提取出有價(jià)值有意義的信息
002 為什么要進(jìn)行數(shù)據(jù)分析:獲取數(shù)據(jù)報(bào)告叁幢,以實(shí)現(xiàn)工作部署調(diào)整
003 需要的最新方法是什么:R語(yǔ)言程序
一疙赠、 R語(yǔ)言的優(yōu)勢(shì)
a免費(fèi)自由平臺(tái);b分析數(shù)據(jù)兼容性強(qiáng)大;c突出的可視化亮點(diǎn)铐殃;d多平臺(tái)支持更新快等。
二、安裝獲取The R Project for Statistical Computing(包可極大增強(qiáng)R的功能)
三休里、R語(yǔ)言
001 R是一種區(qū)分大小寫的解釋性語(yǔ)言蛆挫。(有大小寫之分、語(yǔ)言代碼的可解釋性)
002 命令符 >妙黍。a每次輸入并執(zhí)行一條命令悴侵;b一次性執(zhí)行寫在腳本文件中的一組命令。(Rstudio的使用體會(huì)到真實(shí)方便快捷拭嫁,Rstudio下載地址:Download RStudio
003 R功能由程序內(nèi)置函數(shù)可免、用戶自編函數(shù)和對(duì)對(duì)象的創(chuàng)建和操作所提供。對(duì)R來(lái)說一個(gè)對(duì)象可以是任何東西做粤,包括數(shù)據(jù)浇借、函數(shù)、圖形怕品、分析結(jié)果等妇垢,對(duì)象的類屬性告訴R如何執(zhí)行運(yùn)算,即R識(shí)別出對(duì)象的屬性并按照規(guī)則進(jìn)行處理肉康。
004R語(yǔ)句由函數(shù)和賦值構(gòu)成闯估。“x <- rnorm(5)”中對(duì)象“x”,函數(shù)“rnorm()”,”5”為賦值吼和。
四涨薪、新手上路
通過一個(gè)R會(huì)話示例,讓我們簡(jiǎn)潔直觀的感受到R的是如何操作和運(yùn)行的。示例如下:
> age <- c(1,3,5,2,11,9,3,9,12,3)
>weight<c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)
> mean(weight)
[1] 7.06
> sd(weight)
[1] 2.077498
> cor(age,weight)
[1] 0.9075655
> plot(age,weight)
> q()
五炫乓、獲取幫助刚夺,是學(xué)會(huì)學(xué)習(xí)的一個(gè)好策略,嘗試R中的幫助函數(shù)厢岂,了解其功能光督。
六、工作空間(workspace)
a.使用函數(shù) getwd() 來(lái)查看當(dāng)前的工作目錄
示例如下:
> getwd()
[1] "C:/Users/LENOVO/Documents/one"
b.使用函數(shù) setwd() 設(shè)定當(dāng)前的工作目錄
c.用于管理R工作空間的命令使用示例
setwd("C:/users/LENOVO/Documents/one") #當(dāng)前工作目錄被設(shè)置為C:/users/LENOVO/Documents/one
options() #當(dāng)前的選項(xiàng)設(shè)置情況將顯示出來(lái)(信息量太大)
options(digits=3) # 數(shù)字將被格式化塔粒,顯示為具有小數(shù)點(diǎn)后三位有效數(shù)字的格式
x <- runif(20) # 創(chuàng)建了一個(gè)包含20個(gè)均勻分布隨機(jī)變量的向量
summary(x) #生成此數(shù)據(jù)的摘要統(tǒng)計(jì)量
Min. 1st Qu. ?Median ? ?Mean 3rd Qu. ? ?Max.
0.058 ? 0.244 ? 0.478 ? 0.494 ? 0.723 ? ? 0.998
hist(x) # 生成直方圖
q() #詢問是否保存工作空間
> q()
Save workspace image to ~/one/.RData? [y/n]:
注意事項(xiàng):R將反斜杠(\)作為一個(gè)轉(zhuǎn)義符结借。Windows平臺(tái)上運(yùn)行R,在路徑中也要使用正斜杠卒茬。同時(shí)注意船老,函數(shù) setwd() 不會(huì)自動(dòng)創(chuàng)建一個(gè)不存在的目錄。如果必要的話圃酵,可以使用函數(shù) dir.create() 來(lái)創(chuàng)建新目錄柳畔,然后使用 setwd()將工作目錄指向這個(gè)新目錄。
示例如下:
>dir.create("C:/users/LENOVO/Documents/two")
Warning message:
Indir.create("C:/users/LENOVO/Documents/two") :
'C:\users\LENOVO\Documents\two' already exists
>setwd("C:/users/LENOVO/Documents/two")
七郭赐、輸入和輸出
使用函數(shù) source() 進(jìn)行輸入并使用函數(shù) sink() 進(jìn)行輸出薪韩。
八、包(package)
a.可從Contributed Packages下載。
b. 什么是包:包是R函數(shù)俘陷、數(shù)據(jù)罗捎、預(yù)編譯代碼以一種定義完善的格式組成的集合。
示例如下:
> .libPaths()#顯示庫(kù)所在的位置
[1] "C:/Users/LENOVO/Documents/R/win-library/3.3"
[2] "C:/Program Files/R/R-3.3.2/library"
> library()#顯示庫(kù)中有哪些包
圖書館‘C:/Program Files/R/R-3.3.2/library’里有個(gè)程輯包(很多)
> library()
Warning message:
In library() :
圖書館‘C:/Users/LENOVO/Documents/R/win-library/3.3’里沒有程輯包
> search()#哪些包已加載并可以使用拉盾。顯示如下:
[1] ".GlobalEnv"
[2] "tools:rstudio"
[3] "package:stats"
[4] "package:graphics"
[5] "package:grDevices"
[6] "package:utils"
[7] "package:datasets"
[8] "package:methods"
[9] "Autoloads"
[10] "package:base"
c. 包的安裝和載入
第一次安裝一個(gè)包桨菜,使用命令 install.packages() 。使用命令install.packages("gclus") 來(lái)下載和安裝包gclus捉偏。安裝后方可載入倒得,使用 library() 命令載入包。要使用 gclus 包夭禽,執(zhí)行命令 library(gclus)即可霞掺。
> library(class)#載入包c(diǎn)lass。
d.包的使用方法
> help(package="class")#輸出class包的簡(jiǎn)短描述以及包中的函數(shù)名稱和數(shù)據(jù)集名稱的列表
e. R語(yǔ)言編程中的常見錯(cuò)誤(需要多實(shí)踐多操作驻粟,并對(duì)照常見錯(cuò)誤根悼,進(jìn)一步學(xué)習(xí)