R的安裝幼东、運(yùn)行與基本操作
以下內(nèi)容是我在R語言學(xué)習(xí)過程中的每一課的重點(diǎn)筆記記錄。
02? 數(shù)據(jù)分析
數(shù)據(jù):是指對客觀事件進(jìn)行記錄并可以鑒別的符號(hào)茂卦,是對客觀事物的性質(zhì)豁生、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些符號(hào)的組合酸纲。
通過數(shù)據(jù)分析的結(jié)果指導(dǎo)決策捣鲸。
數(shù)據(jù)分析的一般步驟:
① 數(shù)據(jù)采集? ②數(shù)據(jù)存儲(chǔ) (存儲(chǔ)于計(jì)算機(jī)文件,大量數(shù)據(jù)即數(shù)據(jù)庫)③數(shù)據(jù)統(tǒng)計(jì):使用統(tǒng)計(jì)方法福青,有目的的對收集到的數(shù)據(jù)進(jìn)行分析處理摄狱,并解讀分析結(jié)果(目標(biāo)明確)。
④數(shù)據(jù)挖掘:Data Mining,又稱為資料勘探无午、數(shù)據(jù)采礦媒役,一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程(探索過程)。
⑤數(shù)據(jù)可視化:圖形展示
⑥進(jìn)行決策
03? 數(shù)據(jù)挖掘
大數(shù)據(jù)分析的思維轉(zhuǎn)變:
1.要分析與某事物相關(guān)的所有數(shù)據(jù)宪迟,而不是依靠分析少量的樣本酣衷。
2.我們樂于接受數(shù)據(jù)的紛繁復(fù)雜,而不再追求精確性次泽。
3.不再探求難以琢磨的因果關(guān)系穿仪,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系席爽。
05? R語言
R語言的前身為S語言,S語言可用S-PLUS軟件實(shí)現(xiàn)啊片。
R語言最開始的目的是為了生物統(tǒng)計(jì)與計(jì)算只锻。
R語言的優(yōu)點(diǎn):
① 有效的數(shù)據(jù)處理與保存機(jī)制
② 擁有一整套數(shù)組與矩陣的操作運(yùn)算符。
③ 一系列完整而又連貫的數(shù)據(jù)分析工具紫谷。
④ 圖形統(tǒng)計(jì)可以對數(shù)據(jù)直接進(jìn)行分析和顯示齐饮,可用多種圖形設(shè)備。
⑤ 一種相當(dāng)完善笤昨、簡潔和高效的程序設(shè)計(jì)語言祖驱。
⑥ R語言是徹底面向?qū)ο蟮慕y(tǒng)計(jì)編程語言。
⑦ R語言與其他編程語言瞒窒、數(shù)據(jù)庫之間有很好的的接口捺僻。
⑧ R語言是自由的軟件,可以放心大膽使用崇裁,但其功能卻不比其他同類軟件差匕坯。
⑨ R語言具有豐富的網(wǎng)上資源(R語言官網(wǎng):r-project.org)
R語言的缺點(diǎn):
① R語言不夠規(guī)范,不易上手拔稳,需要付出大量的學(xué)習(xí)成本醒颖。
② R的擴(kuò)展包太多了,需利用較多的時(shí)間查找學(xué)習(xí)壳炎。
07? R的安裝
R語言官網(wǎng)——點(diǎn)擊Download下的CRAN——點(diǎn)擊China,選其中任一鏡像網(wǎng)站——點(diǎn)擊Download R for Windows——點(diǎn)base,再點(diǎn)下載即可
08? R的運(yùn)行
R的運(yùn)行方式:①交互式 ②R腳本 ③R工作空間
交互式:>為命令提示符逼侦,換行時(shí)>切換為+表示繼續(xù)輸入匿辩,直至補(bǔ)齊括號(hào)
R腳本:后綴名為.R的文件
R工作空間,即建立一個(gè)Project,相當(dāng)于建立一個(gè)文件夾
在R安裝根目錄下有一個(gè)Rproject.site的文件可以設(shè)置R語言默認(rèn)程序選項(xiàng)榛丢,可加上:
.First(),打開包
.Last(),清理操作
09? Rstudio
Rstudio類似python的pycharm铲球,一般在Rstudio中進(jìn)行R語言數(shù)據(jù)分析
直接從國外官方網(wǎng)站下載速度太慢,可以從清華鏡像下載:mirrors.tuna.tsinghua.edu.cn
在Rstudio中晰赞,注意以下:
① ctrl+Enter相當(dāng)于Run運(yùn)行按鈕
② 上方的Source按鈕相當(dāng)于運(yùn)行所有代碼
③ 放大鏡可以進(jìn)行查找替換
④ Tab鍵可以自動(dòng)補(bǔ)齊殘缺的代碼
⑤ 上方菜單欄里的Tools中Global Options 可以設(shè)置Appearance以設(shè)置主題外觀稼病,包括背景以及字體,字號(hào)等
⑥ Ctrl+鍵盤的向上箭頭:可列出之前敲過的命令
⑦ Alt+shift+K:可以查找所有的快捷鍵
10.? R語言基本操作
(1)getwd():查找工作目錄
(2)setwd(dir=”C:/Users/Rdata/”):設(shè)置當(dāng)前工作目錄
注:在Windows中為“\”,R中為“/”
(3)list.files():可以查看目錄下的文件 dir()也可完成同樣的功能
(4)定義變量不可以以數(shù)字開頭
R中的賦值符號(hào)為? <-? ,而并非? =,用=賦值會(huì)出問題
此賦值符號(hào)可用鍵盤上的Alt加-輸入
例子:y? <-? sum(1,2,3,4,5) 將1,2,3,4,5的總和值賦給變量y
5? ->? x 將5向右賦值給x
X? <<-? 5 將5強(qiáng)行賦值給一個(gè)全局變量掖鱼,而并非局部變量
(5)ls():列出當(dāng)前所有的變量
(6)ls.str():列出當(dāng)前每個(gè)變量的詳細(xì)信息
(7)str(x):列出x變量的詳細(xì)信息
(8)ls(all.names=TRUE):找出以.命名的所有文件然走,包括以.開頭的
(9)rm(x)刪除變量x
(10)rm(list=ls()):一次刪除所有的變量
(11)history():可列出所有的歷史記錄
(12)history(5):只列出最近5條歷史記錄
(13)ctrl+L:清屏
(14)save.image():保存當(dāng)前空間
(15)q()退出