數(shù)據(jù)整理

1 tidyverse系統(tǒng)

https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/summary-manip.html#summm-tidyv
(完整版)
載入tidyverse包卿操, 則magrittr包枚驻,readr包,dplyr包和tidyr包都會被自動載入:

library(tidyverse)

下面的例子中用如下的一個(gè)班的學(xué)生數(shù)據(jù)作為例子甫何, 保存在如下class.csv文件中:

name,sex,age,height,weight
Alice,F,13,56.5,84
Becka,F,13,65.3,98
Gail,F,14,64.3,90
Karen,F,12,56.3,77
Kathy,F,12,59.8,84.5
Mary,F,15,66.5,112
Sandy,F,11,51.3,50.5
Sharon,F,15,62.5,112.5
Tammy,F,14,62.8,102.5
Alfred,M,14,69,112.5
Duke,M,14,63.5,102.5
Guido,M,15,67,133
James,M,12,57.3,83
Jeffrey,M,13,62.5,84
John,M,12,59,99.5
Philip,M,16,72,150
Robert,M,12,64.8,128
Thomas,M,11,57.5,85
William,M,15,66.5,112

讀入為tibble:

d.class <- read_csv(
  "class.csv", 
  col_types=cols(
  .default = col_double(),
  name=col_character(),
  sex=col_factor(levels=c("M", "F"))
))

這個(gè)數(shù)據(jù)框有19個(gè)觀測唁影, 有如下5個(gè)變量:

  • name
  • sex
  • age
  • height
  • weight

R的NHANES擴(kuò)展包提供了一個(gè)規(guī)模更大的示例數(shù)據(jù)框NHANES耕陷, 可以看作是美國扣除住院病人以外的人群的一個(gè)隨機(jī)樣本, 有10000個(gè)觀測据沈,有76個(gè)變量哟沫, 主題是個(gè)人的健康與營養(yǎng)方面的信息。 僅作為教學(xué)使用而不足以作為嚴(yán)謹(jǐn)?shù)目蒲杏脭?shù)據(jù)锌介。 原始數(shù)據(jù)的情況詳見http://www.cdc.gov/nchs/nhanes.htm嗜诀。 載入NHANES數(shù)據(jù)框:

library(NHANES)
data(NHANES)
print(dim(NHANES))
## [1] 10000    76
print(names(NHANES))
##  [1] "ID"               "SurveyYr"         "Gender"           "Age"             
##  [5] "AgeDecade"        "AgeMonths"        "Race1"            "Race3"           
##  [9] "Education"        "MaritalStatus"    "HHIncome"         "HHIncomeMid"     
## [13] "Poverty"          "HomeRooms"        "HomeOwn"          "Work"            
## [17] "Weight"           "Length"           "HeadCirc"         "Height"          
## [21] "BMI"              "BMICatUnder20yrs" "BMI_WHO"          "Pulse"           
## [25] "BPSysAve"         "BPDiaAve"         "BPSys1"           "BPDia1"          
## [29] "BPSys2"           "BPDia2"           "BPSys3"           "BPDia3"          
## [33] "Testosterone"     "DirectChol"       "TotChol"          "UrineVol1"       
## [37] "UrineFlow1"       "UrineVol2"        "UrineFlow2"       "Diabetes"        
## [41] "DiabetesAge"      "HealthGen"        "DaysPhysHlthBad"  "DaysMentHlthBad" 
## [45] "LittleInterest"   "Depressed"        "nPregnancies"     "nBabies"         
## [49] "Age1stBaby"       "SleepHrsNight"    "SleepTrouble"     "PhysActive"      
## [53] "PhysActiveDays"   "TVHrsDay"         "CompHrsDay"       "TVHrsDayChild"   
## [57] "CompHrsDayChild"  "Alcohol12PlusYr"  "AlcoholDay"       "AlcoholYear"     
## [61] "SmokeNow"         "Smoke100"         "Smoke100n"        "SmokeAge"        
## [65] "Marijuana"        "AgeFirstMarij"    "RegularMarij"     "AgeRegMarij"     
## [69] "HardDrugs"        "SexEver"          "SexAge"           "SexNumPartnLife" 
## [73] "SexNumPartYear"   "SameSex"          "SexOrientation"   "PregnantNow"

變量ID是受試者編號, SurveyYr是調(diào)查年份掏湾, 同一受試者可能在多個(gè)調(diào)查年份中有數(shù)據(jù)裹虫。 變量中包括性別、年齡融击、種族筑公、收入等人口學(xué)數(shù)據(jù), 包括體重尊浪、身高匣屡、脈搏封救、血壓等基本體檢數(shù)據(jù), 以及是否糖尿病捣作、是否抑郁誉结、是否懷孕、已生產(chǎn)子女?dāng)?shù)等更詳細(xì)的健康數(shù)據(jù)券躁, 運(yùn)動習(xí)慣惩坑、飲酒、性生活等行為方面的數(shù)據(jù)也拜。 這個(gè)教學(xué)用數(shù)據(jù)集最初的使用者是Cashmere高中的Michelle Dalrymple 和新西蘭奧克蘭大學(xué)的Chris Wild以舒。

2 用filter()選擇行子集

行子集可以用行下標(biāo)選取, 如d.class[8:12,]慢哈。 函數(shù)head()取出數(shù)據(jù)框的前面若干行蔓钟, tail()取出數(shù)據(jù)框的最后若干行。
d.class中選出年齡在13歲和13歲以下的女生:

d.class %>%
  filter(sex=="F", age<=13) %>%
  knitr::kable()
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末卵贱,一起剝皮案震驚了整個(gè)濱河市滥沫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌键俱,老刑警劉巖兰绣,帶你破解...
    沈念sama閱讀 211,265評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異方妖,居然都是意外死亡狭魂,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評論 2 385
  • 文/潘曉璐 我一進(jìn)店門党觅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來雌澄,“玉大人,你說我怎么就攤上這事杯瞻「湮” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評論 0 347
  • 文/不壞的土叔 我叫張陵魁莉,是天一觀的道長睬涧。 經(jīng)常有香客問我,道長旗唁,這世上最難降的妖魔是什么畦浓? 我笑而不...
    開封第一講書人閱讀 56,408評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮检疫,結(jié)果婚禮上讶请,老公的妹妹穿的比我還像新娘。我一直安慰自己屎媳,他們只是感情好夺溢,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評論 5 384
  • 文/花漫 我一把揭開白布论巍。 她就那樣靜靜地躺著,像睡著了一般风响。 火紅的嫁衣襯著肌膚如雪嘉汰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,772評論 1 290
  • 那天状勤,我揣著相機(jī)與錄音鞋怀,去河邊找鬼。 笑死持搜,一個(gè)胖子當(dāng)著我的面吹牛接箫,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播朵诫,決...
    沈念sama閱讀 38,921評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼薄扁!你這毒婦竟也來了剪返?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評論 0 266
  • 序言:老撾萬榮一對情侶失蹤邓梅,失蹤者是張志新(化名)和其女友劉穎脱盲,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體日缨,經(jīng)...
    沈念sama閱讀 44,130評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钱反,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了匣距。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片面哥。...
    茶點(diǎn)故事閱讀 38,617評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖毅待,靈堂內(nèi)的尸體忽然破棺而出尚卫,到底是詐尸還是另有隱情,我是刑警寧澤尸红,帶...
    沈念sama閱讀 34,276評論 4 329
  • 正文 年R本政府宣布吱涉,位于F島的核電站,受9級特大地震影響外里,放射性物質(zhì)發(fā)生泄漏怎爵。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評論 3 312
  • 文/蒙蒙 一盅蝗、第九天 我趴在偏房一處隱蔽的房頂上張望鳖链。 院中可真熱鬧,春花似錦风科、人聲如沸撒轮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽题山。三九已至兰粉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間顶瞳,已是汗流浹背玖姑。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留慨菱,地道東北人焰络。 一個(gè)月前我還...
    沈念sama閱讀 46,315評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像符喝,于是被迫代替她去往敵國和親闪彼。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評論 2 348