R數(shù)據(jù)科學day2-1

如果不想麻煩每次設置工作目錄蛛倦,可以多保存幾個R文件著隆。需要哪個就打開哪個。

工作流-基礎

  • 使用RStudio 快捷鍵:Alt+-(Alt 加上減號)梯轻。RStudio 會自動在<- 的兩端加上空格。

  • 對象名稱必須以字母開頭尽棕,并且只能包含字母喳挑、數(shù)字、_ 和.

  • 快速輸入變量萄金,輸入開頭蟀悦,按Tab;再次輸入可以按后按Ctrl+ ↑氧敢。

  • Alt+Shift+K顯示所有快捷鍵日戈。

基礎.png

dplyr數(shù)據(jù)轉換

終于知道變量名下面的<chr>代表啥了。

? int 表示整數(shù)型變量孙乖。
? dbl 表示雙精度浮點數(shù)型變量浙炼,或稱實數(shù)。
? chr 表示字符向量唯袄,或稱字符串弯屈。
? dttm 表示日期時間(日期+ 時間)型變量。
? lgl 表示邏輯型變量恋拷,是一個僅包括TRUE 和FALSE 的向量资厉。
? fctr 表示因子,R 用其來表示具有固定數(shù)目的值的分類變量蔬顾。
? date 表示日期型變量宴偿。

1. 準備

install.packages("nycflights13") library(nycflights13) library(tidyverse)
因為要用的數(shù)據(jù)flights是nycflights13包里的,所以要先加載诀豁。

-- Conflicts ------------------------------------- tidyverse_conflicts() --
x dplyr::filter() masks stats::filter()
x dplyr::lag()    masks stats::lag()
dplyr包覆蓋了基礎R包中的兩個函數(shù)窄刘,如果你要使用被覆蓋的函數(shù),需要輸入他們的完整名稱舷胜,以::連接包名和函數(shù)名娩践。

flights #就瞅一眼,看看幾行幾列
?flights #好好瞅瞅每列表示什么意思
View(flights)#以表格的形式好好瞅瞅
class(flights)#了解他的數(shù)據(jù)類型

2. dplyr包的核心函數(shù)

? 按變量篩選觀測值(filter())。
? 對行進行重新排序(arrange())翻伺。
? 按名稱選取變量(select())材泄。
? 使用現(xiàn)有變量的函數(shù)創(chuàng)建新變量(mutate())。
? 將多個值總結為一個摘要統(tǒng)計量(summarize())穆趴。
分組操作group_by(),可以和以上函數(shù)聯(lián)合使用脸爱。

dplyr函數(shù)不修改原數(shù)據(jù)框遇汞,只從原數(shù)據(jù)框中生成新數(shù)據(jù)框未妹,如果新生成的數(shù)據(jù)框不賦值給一個新的變量,那么就會丟失空入。
R要么輸出結果络它,要么賦值。將賦值語句用括號括起來則可以同時完成這兩種操作歪赢。

filter(flights, month == 1, day == 1) #輸出結果
jan1 <- filter(flights, month == 1, day == 1) #賦值
(dec25 <- filter(flights, month == 12, day == 25))#兩種操作

3.filter進行篩選

(1) 比較運算符

比較運算符:>化戳、>=、<埋凯、<=点楼、!=(不等于)和==(等于)

=是賦值操作,a=3是將3這個數(shù)值賦值給a這個變量白对。而==才是平時的數(shù)學中的等于掠廓,意思是比較是否相等,如a==b意思是a的值是否和b的值相等

near(1 / 49 * 49, 1)
#> [1] TRUE

計算機使用的是有限精度運算(顯然無法存儲無限位的數(shù))甩恼,因此請記住蟀瞧,你看到的每個
數(shù)都是一個近似值。比較浮點數(shù)是否相等時条摸,不能使用==悦污,而應該使用near()。

(2)邏輯元算法

& 表示“與”钉蒲、
| 表示“或”切端、
! 表示“非”

x %in% y。這會選取出x 是y 中的一個值時的所有行顷啼。

filter(flights, month == 11 | month == 12) filter(flights, month %in% c(11, 12))表達意思相同踏枣。
注:%in%是非常好的一個函數(shù),解決了我以前的一個大問題线梗。比如我想找到excel中c列中和a列相同的行椰于。
只需要c%in%a就可以了。

!(x & y)等價于!x | !y仪搔,!(x | y)等價于!x & !y

(3)缺失值

NA瘾婿,表示有一個值,但是不知道具體是啥,相當于個陌生人偏陪。而NULL相當于抢呆,根本沒人。笛谦。抱虐。
NA與NULL的區(qū)分:一個元素值全為NA的向量,它的長度是存在的饥脑,就等于元素的個數(shù)恳邀。而如果把一個向量的所有元素的值都設為NULL,這個向量就變成了“空值”灶轰,其長度為0谣沸,表明“空無一物”。

注:NA為缺失值笋颤,is.na()判斷是否為缺失值乳附,filter() 只能篩選出條件為TRUE 的行;它會排除那些條件為FALSE 和NA 的行伴澄。如果想保留缺失值赋除,可以用這個函數(shù)

dplyr數(shù)據(jù)轉換.png

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市非凌,隨后出現(xiàn)的幾起案子举农,更是在濱河造成了極大的恐慌,老刑警劉巖清焕,帶你破解...
    沈念sama閱讀 219,589評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件并蝗,死亡現(xiàn)場離奇詭異,居然都是意外死亡秸妥,警方通過查閱死者的電腦和手機滚停,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評論 3 396
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來粥惧,“玉大人键畴,你說我怎么就攤上這事⊥谎” “怎么了起惕?”我有些...
    開封第一講書人閱讀 165,933評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長咏删。 經(jīng)常有香客問我惹想,道長,這世上最難降的妖魔是什么督函? 我笑而不...
    開封第一講書人閱讀 58,976評論 1 295
  • 正文 為了忘掉前任嘀粱,我火速辦了婚禮激挪,結果婚禮上,老公的妹妹穿的比我還像新娘锋叨。我一直安慰自己垄分,他們只是感情好,可當我...
    茶點故事閱讀 67,999評論 6 393
  • 文/花漫 我一把揭開白布娃磺。 她就那樣靜靜地躺著薄湿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪偷卧。 梳的紋絲不亂的頭發(fā)上豺瘤,一...
    開封第一講書人閱讀 51,775評論 1 307
  • 那天,我揣著相機與錄音涯冠,去河邊找鬼炉奴。 笑死逼庞,一個胖子當著我的面吹牛蛇更,可吹牛的內容都是我干的。 我是一名探鬼主播赛糟,決...
    沈念sama閱讀 40,474評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼派任,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了璧南?” 一聲冷哼從身側響起掌逛,我...
    開封第一講書人閱讀 39,359評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎司倚,沒想到半個月后豆混,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,854評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡动知,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,007評論 3 338
  • 正文 我和宋清朗相戀三年皿伺,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盒粮。...
    茶點故事閱讀 40,146評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡鸵鸥,死狀恐怖,靈堂內的尸體忽然破棺而出丹皱,到底是詐尸還是另有隱情妒穴,我是刑警寧澤,帶...
    沈念sama閱讀 35,826評論 5 346
  • 正文 年R本政府宣布摊崭,位于F島的核電站讼油,受9級特大地震影響,放射性物質發(fā)生泄漏呢簸。R本人自食惡果不足惜矮台,卻給世界環(huán)境...
    茶點故事閱讀 41,484評論 3 331
  • 文/蒙蒙 一淆攻、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧嘿架,春花似錦瓶珊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,029評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蝉娜,卻和暖如春唱较,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背召川。 一陣腳步聲響...
    開封第一講書人閱讀 33,153評論 1 272
  • 我被黑心中介騙來泰國打工南缓, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人荧呐。 一個月前我還...
    沈念sama閱讀 48,420評論 3 373
  • 正文 我出身青樓汉形,卻偏偏與公主長得像,于是被迫代替她去往敵國和親倍阐。 傳聞我的和親對象是個殘疾皇子概疆,可洞房花燭夜當晚...
    茶點故事閱讀 45,107評論 2 356

推薦閱讀更多精彩內容