1.條件與循環(huán)語句
- 條件語句
if
語句形式
if (condition) {
expr
} else if (condition){
}
...
else {
}
例子:
num_views <- 14
# Control structure for num_views
if (num_views > 15) {
print("You're popular!")
}else{
print("Try to be more visible!")
}
ifelse
> ifelse(2>1,'haha','zzzz')
[1] haha
switch
switch相當(dāng)于一個(gè)函數(shù)硫狞,而且這個(gè)函數(shù)第一個(gè)表達(dá)式只能是字符類型聋丝。
> name <- 'john'
> switch(name,john = 'Hello John', zeus = 'Hello zeus','Hello')
[1] Hello John
上面name要尋找到與其匹配的變量名就會返回等號后面的表達(dá)式,如果匹配到變量名而等號后沒有值他去,那就會就從后面一個(gè)表達(dá)式返回篙骡。如果沒有變量名的表達(dá)式,就是默認(rèn)值剩拢,不允許有兩個(gè)默認(rèn)值。
> switch(name,john = , zeus = 'Hello zeus','Hello')
[1] "Hello zeus"
一個(gè)小例子饶唤,根據(jù)factor變量輸出:
> sex <- factor(c('M','F'))
> switch(as.character(sex[1]),M = 'male',F = 'female')
[1] male
這個(gè)例子里面需要把factor變量就行類型轉(zhuǎn)換徐伐,否則會報(bào)錯(cuò)。
- 循環(huán)語句
while
x <- 10
while(i>0){
print('Hello')
x <- i - 1
}
for
for(i in 1:10){
}
2.factor
factor有人翻譯成因子募狂,根據(jù)語法這有點(diǎn)類似c語言中的枚舉办素,這里就不翻譯了。在數(shù)據(jù)中某些字段自會是一些可選字段中的某個(gè)值祸穷,那么就可以用factor性穿,比如說人的性別就可以用factor。
- 建立factor
> gender_vector <- c("Male", "Female", "Female", "Male", "Male")
> factor_gender_vector <-factor(gender_vector)
> factor_gender_vector
[1] Male Female Female Male Male
Levels: Female Male
> mode(factor_gender_vector)
[1] "numeric"
上面的測試可以看出factor變量其實(shí)是個(gè)數(shù)值類型雷滚。
- 有序
對于factor類型的變量季二,可以有序也可以無序。上面的例子中性別就是無序的揭措,如果考慮溫度的低胯舷、中、高的問題绊含,那么factor就是有序的桑嘶。
> temperature_vector <- c("High", "Low", "High","Low", "Medium")
> factor_temperature_vector <- factor(temperature_vector, order = TRUE, levels = c("Low", "Medium", "High"))
> factor_temperature_vector
[1] High Low High Low Medium
Levels: Low < Medium < High
- 修改名稱
> survey_vector <- c("M", "F", "F", "M", "M")
> factor_survey_vector <- factor(survey_vector)
> factor_survey_vector
[1] M F F M M
Levels: F M
上面的示例代碼自動生成的factor是F
,M
,顯然我們可以把它改成更有意義的名字躬充。
> levels(factor_survey_vector) <- c('女','男')
> factor_survey_vector
[1] 男 女 女 男 男
Levels: 女 男
- 查看變量信息
> mode(factor_survey_vector)
[1] "numeric"
> summary(factor_survey_vector)
Female Male
2 3
> summary(survey_vector)
Length Class Mode
5 character character
mode
查看數(shù)據(jù)類型逃顶,summary
查看數(shù)據(jù)信息。
3. DataFrame
DataFrame
類似于數(shù)據(jù)庫中的表或者是pandas中的DataFrame充甚。
- 查看數(shù)據(jù)
> head(mtcars)#從頭列出部分?jǐn)?shù)據(jù)
> str(mtcars)#查看數(shù)據(jù)信息
'data.frame': 32 obs. of 11 variables:
$ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ...
$ cyl : num 6 6 4 6 8 6 8 4 4 6 ...
$ disp: num 160 160 108 258 360 ...
$ hp : num 110 110 93 110 175 105 245 62 95 123 ...
$ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ...
$ wt : num 2.62 2.88 2.32 3.21 3.44 ...
$ qsec: num 16.5 17 18.6 19.4 17 ...
$ vs : num 0 0 1 1 0 1 0 1 1 1 ...
$ am : num 1 1 1 0 0 0 0 0 0 0 ...
$ gear: num 4 4 4 3 3 3 3 4 4 4 ...
$ carb: num 4 4 1 1 2 1 4 2 2 4 ...
- 創(chuàng)建DataFrame
# Definition of vectors
name <- c("Mercury", "Venus", "Earth", "Mars", "Jupiter", "Saturn", "Uranus", "Neptune")
type <- c("Terrestrial planet", "Terrestrial planet", "Terrestrial planet",
"Terrestrial planet", "Gas giant", "Gas giant", "Gas giant", "Gas giant")
diameter <- c(0.382, 0.949, 1, 0.532, 11.209, 9.449, 4.007, 3.883)
rotation <- c(58.64, -243.02, 1, 1.03, 0.41, 0.43, -0.72, 0.67)
rings <- c(FALSE, FALSE, FALSE, FALSE, TRUE, TRUE, TRUE, TRUE)
# Create a data frame from the vectors
planets_df <-data.frame(name,type,diameter,rotation,rings)
- 元素選擇
# 查找單個(gè)元素第一行第三列
> print(planets_df[1,3])
[1] 0.382
#查找第四行以政,注意這里選擇一行所有列的寫法
> print(planets_df[4,])
name type diameter rotation rings
4 Mars Terrestrial planet 0.532 1.03 FALSE
#查找第四行,2,3,4列伴找,類似于切片操作
> print(planets_df[4,2:4])
type diameter rotation
4 Terrestrial planet 0.532 1.03
#使用列名獲取數(shù)據(jù)
> planets_df[1:5,'diameter']
[1] 0.382 0.949 1.000 0.532 11.209
#使用列名獲取一列數(shù)據(jù)
> planets_df['diameter']
diameter
1 0.382
2 0.949
3 1.000
4 0.532
5 11.209
6 9.449
7 4.007
8 3.883
#使用簡化寫法獲取一列數(shù)據(jù)
> planets_df$diameter#與planets_df[,"diameter"]相同
[1] 0.382 0.949 1.000 0.532 11.209 9.449 4.007 3.883
#這里要注意上面和下面的差異盈蛮,為何一個(gè)豎排和一個(gè)豎排輸出,原因就是上面輸出的是list技矮,下面的是numberic抖誉。
- 條件選擇
上面的例子中,有些行星有行星環(huán)衰倦,有些沒有袒炉,如何獲取有環(huán)的行星名字。
> rings_vector <- planets_df$rings
> rings_vector
[1] FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE
> planets_df[rings_vector, "name"]
[1] Jupiter Saturn Uranus Neptune
Levels: Earth Jupiter Mars Mercury Neptune Saturn Uranus Venus
#要獲取沒環(huán)的行星名字樊零,使用我磁!操作取反。
#一個(gè)不輸入name,直接獲取整個(gè)篩選數(shù)據(jù)表夺艰。
使用subset來獲取子集芋哭,選擇直徑小于的1的行星
> subset(planets_df, subset = diameter < 1)
name type diameter rotation rings
1 Mercury Terrestrial planet 0.382 58.64 FALSE
2 Venus Terrestrial planet 0.949 -243.02 FALSE
4 Mars Terrestrial planet 0.532 1.03 FALSE
- 排序
使用order函數(shù)進(jìn)行排序,整個(gè)函數(shù)返回的排序之后的位置劲适。
> a = c(2,3,1)
> order(a)
[1] 3 1 2
> a[order(a)]
[1] 1 2 3
根據(jù)直徑進(jìn)行排序
> positions <- order(planets.$diameter)
> planets[positions,]