《學(xué)習(xí)小組Day6筆記--加菲貓 補(bǔ)》

學(xué)習(xí)R包

這是跟隨生信星球?qū)W習(xí)小組學(xué)習(xí)的第六天的課程,最近要跟門(mén)診桨踪,不像病房相對(duì)自由一些老翘,時(shí)間有點(diǎn)緊,沒(méi)有按時(shí)完成花花交的任務(wù)锻离,很抱歉铺峭。
上一節(jié)課學(xué)習(xí)了有一些基礎(chǔ)的R語(yǔ)言的代碼,感覺(jué)我們的課程很好纳账,在初學(xué)者入門(mén)時(shí)逛薇,交給他們良好的學(xué)習(xí)習(xí)慣,這才是事半功倍的好方法疏虫,在建立某一個(gè)項(xiàng)目的時(shí)候,應(yīng)該在RStudio中新建~.Rproj的文件夾,這樣不同的項(xiàng)目都有各自的文件夾卧秘,管理呢袱、操作起來(lái)都會(huì)方便,以及如何保存一段代碼翅敌,一邊之后再次運(yùn)行羞福,當(dāng)然重要的是帶我們初識(shí)R中重要的兩種數(shù)據(jù)格式,vector data.frame蚯涮,各自額組成治专,如何從中抓取想要的數(shù)據(jù),這都是基礎(chǔ)的知識(shí)遭顶。今天又進(jìn)入了R重要的組成packages张峰,形形色色的,可以幫助實(shí)現(xiàn)統(tǒng)計(jì)棒旗、作圖喘批,幾乎無(wú)所不能,因此在生物醫(yī)學(xué)中铣揉,R語(yǔ)言運(yùn)用也十分適宜以及廣泛饶深。

鏡像設(shè)置

如果平時(shí)不去設(shè)置下載的源地址,那么會(huì)默認(rèn)的使用國(guó)外CRAN的鏡像逛拱,這樣下載包的速度會(huì)很慢敌厘,我之前沒(méi)有修改鏡像時(shí),一到晚上下載速度就不行了朽合,經(jīng)常失敗告終

工欲善其事必先利其器

修改RStudio的包安裝鏡像到國(guó)內(nèi)服務(wù)器额湘,會(huì)十分便利,這當(dāng)然依靠配置軟件環(huán)境實(shí)現(xiàn)旁舰。
有三種方式:

  1. 點(diǎn)擊RStudio中的Tools,進(jìn)入Global Options中锋华,點(diǎn)擊packages,可以添加鏡像網(wǎng)站URL,更改自己下載包的鏡像站點(diǎn)箭窜。
  2. 使用代碼更改鏡像網(wǎng)站毯焕。
# options函數(shù)就是設(shè)置R運(yùn)行過(guò)程中的一些選項(xiàng)設(shè)置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #對(duì)應(yīng)清華源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #對(duì)應(yīng)中科大源
# 當(dāng)然可以換成其他地區(qū)的鏡像

但是這樣設(shè)置后,每次重啟R后磺樱,仍然需要再次設(shè)置纳猫。

  1. 高級(jí)方法,一勞永逸竹捉。
    利用R的配置文件.Rprofile
file.edit('~/.Rprofile')

新建配置文件芜辕。在新開(kāi)的窗口中,輸入

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
options(download.file.method = 'libcurl')
options(url.method='libcurl')

有人問(wèn)块差,為什么我的代碼比花花給的多了兩行侵续?
其實(shí)我開(kāi)始時(shí)也是用的教程給的方法倔丈,但是發(fā)現(xiàn)配置文件做好了,但是下載不到任何包状蜗,最后也是花花老師提供的結(jié)局辦法需五。代碼貼上來(lái)了,以供有緣人使用轧坎。

開(kāi)始安裝

就是兩種命令

install.packages(“包”)
BiocManager::install(“包”)

具體使用那種下載宏邮,可以自行\color{blue}{G} \color{red}{o}\ \color{yellow}{o}\ \color{blue}{g}\ \color{green}{l}\ \color{red}{e}\

加載 包

1. library(“包”)
2. require(“包”)

加載dplyr包,并調(diào)用iris數(shù)據(jù)集

關(guān)于dplyr包介紹缸血,推薦如下鏈接dplyr包介紹學(xué)習(xí)

dplyr`包介紹

包內(nèi)內(nèi)置了數(shù)據(jù)集蜜氨,例如今天使用的iris,Iris 鳶尾花數(shù)據(jù)集是一個(gè)經(jīng)典數(shù)據(jù)集捎泻,在統(tǒng)計(jì)學(xué)習(xí)和機(jī)器學(xué)習(xí)領(lǐng)域都經(jīng)常被用作示例飒炎。數(shù)據(jù)集內(nèi)包含 3 類(lèi)共 150 條記錄,每類(lèi)各 50 個(gè)數(shù)據(jù)族扰,每條記錄都有 4 項(xiàng)特征:花萼長(zhǎng)度厌丑、花萼寬度、花瓣長(zhǎng)度渔呵、花瓣寬度怒竿,可以通過(guò)這4個(gè)特征預(yù)測(cè)鳶尾花卉屬于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品種。[1]
截取部分?jǐn)?shù)據(jù)進(jìn)行后續(xù)練習(xí)

test <- iris[c(1:2,51:52,101:102),]

截取iris數(shù)據(jù)集中的第1-2扩氢、51-52耕驰、101-102行蟆炊,命名為test數(shù)據(jù)集

dplyr五個(gè)基礎(chǔ)函數(shù)

  1. mutate(),新增列
  2. select(),按列篩選:
    按列號(hào)篩選遥缕、按列名篩選
  3. filter()篩選行


    來(lái)自公眾號(hào)生信星球
  4. arrange(),按某1列或某幾列對(duì)整個(gè)表格進(jìn)行排序
    函數(shù)默認(rèn)從大到小排列陆错,如果反過(guò)來(lái)遥巴,需要在參照的某一列前加desc()參數(shù)
  5. summarise():匯總
    結(jié)合group_by分組后,可以針對(duì)不同類(lèi)別的分組進(jìn)行數(shù)據(jù)統(tǒng)計(jì)

dplyr兩個(gè)實(shí)用技能

  1. 管道操作 %>% (cmd/ctr + shift + M)
    我對(duì)這個(gè)符號(hào)的簡(jiǎn)單理解就是有簡(jiǎn)單單一運(yùn)算逐漸累加到復(fù)雜大量運(yùn)算朽缴,將一個(gè)復(fù)雜的函數(shù)進(jìn)行拆解蝇完,再逐步賦值到下一步命令中洒敏。結(jié)構(gòu)會(huì)比較清晰明了咏花,看著也會(huì)舒服趴生,這個(gè)符號(hào)好神奇~~~
    來(lái)自公眾號(hào)生信星球

    選定數(shù)據(jù)
    分組處理
    計(jì)算組間均數(shù) 標(biāo)準(zhǔn)差
  2. count統(tǒng)計(jì)某列的unique值
    count()函數(shù)統(tǒng)計(jì)多列文件
dplyr處理關(guān)系數(shù)據(jù)

創(chuàng)建兩組data.frame,要求不要引入factor

options(stringsAsFactors = F)

test1 <- data.frame(x = c('b','e','f','x'), 
                    z = c("A","B","C",'D'),
                    stringsAsFactors = F)
test1
   x z
 1 b A
 2 e B
 3 f C
 4 x D
test2 <- data.frame(x = c('a','b','c','d','e','f'), 
                    y = c(1,2,3,4,5,6),
                    stringsAsFactors = F)
test2 
   x y
 1 a 1
 2 b 2
 3 c 3
 4 d 4
 5 e 5
 6 f 6

兩組表格有相同的x列昏翰,其中test1中的x中有b e ftest2中的x相交苍匆。
如果兩個(gè)表中的重合列名字不同,解決如下

names(test1)[1]="n1"
names(test2)[1]="n2"
test1 %>%
 inner_join(test2,by=c("n1" = ''n2"))
## 或省去by
test1 %>%
 inner_join(test2,c("n1" = ''n2"))
  1. 內(nèi)連inner_join,取交集
inner_join(test1, test2, by = "x")
   x z y
 1 b A 2
 2 e B 5
 3 f C 6
來(lái)自R for data science(十六)-dplyr 連接函數(shù)
  1. 左連left_join
left_join(test1, test2, by = 'x')
   x z  y
 1 b A  2
 2 e B  5
 3 f C  6
 x D NA
left_join(test2, test1, by = 'x')
   x y    z
 1 a 1 
 2 b 2    A
 3 c 3 
 4 d 4 
 5 e 5    B
 6 f 6    C
來(lái)自R for data science(十六)-dplyr 連接函數(shù)
  1. 全連full_join
full_join( test1, test2, by = 'x')
   x    z  y
 1 b    A  2
 2 e    B  5
 3 f    C  6
 4 x    D NA
 5 a 
 6 c 
 7 d
Snipaste_2020-04-11_13-58-46.png
  1. 半連接:返回能夠與y表匹配的x表所有記錄semi_join
semi_join(x = test1, y = test2, by = 'x')
  x z
 1 b A
 2 e B
 3 f C
來(lái)自R for data science(十六)-dplyr 連接函數(shù)
來(lái)自R for data science(十六)-dplyr 連接函數(shù)
  1. 反連接:返回?zé)o法與y表匹配的x表的所記錄anti_join
anti_join(x = test2, y = test1, by = 'x')
   x y
 1 a 1
 2 c 3
 3 d 4

在test2中有部分值無(wú)法與test1匹配棚菊,這里的函數(shù)便列出了不能匹配的數(shù)據(jù)

  1. 簡(jiǎn)單合并
    bind_rows()函數(shù)需要兩個(gè)表格列數(shù)相同浸踩,而bind_cols()函數(shù)則需要兩個(gè)數(shù)據(jù)框有相同的行數(shù)

  1. 來(lái)自 鳶尾花(iris)數(shù)據(jù)集分析 ?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市统求,隨后出現(xiàn)的幾起案子检碗,更是在濱河造成了極大的恐慌据块,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件后裸,死亡現(xiàn)場(chǎng)離奇詭異瑰钮,居然都是意外死亡冒滩,警方通過(guò)查閱死者的電腦和手機(jī)微驶,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)开睡,“玉大人因苹,你說(shuō)我怎么就攤上這事∑悖” “怎么了扶檐?”我有些...
    開(kāi)封第一講書(shū)人閱讀 153,220評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)胁艰。 經(jīng)常有香客問(wèn)我款筑,道長(zhǎng),這世上最難降的妖魔是什么腾么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,416評(píng)論 1 279
  • 正文 為了忘掉前任奈梳,我火速辦了婚禮,結(jié)果婚禮上解虱,老公的妹妹穿的比我還像新娘攘须。我一直安慰自己,他們只是感情好殴泰,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評(píng)論 5 374
  • 文/花漫 我一把揭開(kāi)白布于宙。 她就那樣靜靜地躺著,像睡著了一般悍汛。 火紅的嫁衣襯著肌膚如雪捞魁。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,144評(píng)論 1 285
  • 那天离咐,我揣著相機(jī)與錄音谱俭,去河邊找鬼。 笑死健霹,一個(gè)胖子當(dāng)著我的面吹牛旺上,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播糖埋,決...
    沈念sama閱讀 38,432評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼宣吱,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了瞳别?” 一聲冷哼從身側(cè)響起征候,我...
    開(kāi)封第一講書(shū)人閱讀 37,088評(píng)論 0 261
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤杭攻,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后疤坝,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體兆解,經(jīng)...
    沈念sama閱讀 43,586評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評(píng)論 2 325
  • 正文 我和宋清朗相戀三年跑揉,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了锅睛。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,137評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡历谍,死狀恐怖现拒,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情望侈,我是刑警寧澤印蔬,帶...
    沈念sama閱讀 33,783評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站脱衙,受9級(jí)特大地震影響侥猬,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜捐韩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評(píng)論 3 307
  • 文/蒙蒙 一退唠、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧奥帘,春花似錦铜邮、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,333評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至已旧,卻和暖如春秸苗,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背运褪。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,559評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工惊楼, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人秸讹。 一個(gè)月前我還...
    沈念sama閱讀 45,595評(píng)論 2 355
  • 正文 我出身青樓檀咙,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親璃诀。 傳聞我的和親對(duì)象是個(gè)殘疾皇子弧可,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 2020-04-08今天的內(nèi)容是學(xué)習(xí)R包(多個(gè)函數(shù)的集合),以dplyr為例劣欢。 一棕诵、配置Rstudio的下載鏡像 ...
    a飯飯o閱讀 272評(píng)論 0 1
  • 今天學(xué)習(xí)與R包相關(guān)的內(nèi)容今天起了個(gè)大早裁良,因?yàn)橛⒄Z(yǔ)老師在美國(guó)有時(shí)差?? 一、配置Rstudio的下載鏡像 R的配置文件...
    豬莎愛(ài)學(xué)習(xí)閱讀 263評(píng)論 0 1
  • 生信第6天——學(xué)習(xí)R包校套。 R包是多個(gè)函數(shù)的集合价脾,具有詳細(xì)的說(shuō)明和示例。 學(xué)生信笛匙,R語(yǔ)言必學(xué)的原因是豐富的圖表和Bi...
    knightxm閱讀 148評(píng)論 0 0
  • 思維導(dǎo)圖 鏡像設(shè)置 第一種方法: 第二種方法(可以免去下次打開(kāi)的鏡像設(shè)置):file.edit('~/.Rprof...
    bhwang192閱讀 199評(píng)論 0 0
  • 鏡像設(shè)置 不想每次手動(dòng)設(shè)置鏡像侨把?來(lái)吧,解放你的雙手膳算! 設(shè)置R的配置文件 .Rprofile 說(shuō)起來(lái)這個(gè)座硕,就必須提到...
    apple仔_6967閱讀 128評(píng)論 0 1