學(xué)習(xí)小組Day6筆記-夢幻天堂

今天任務(wù)安裝R包并處理一個(gè)數(shù)據(jù)文件

R包

R包都有自己的說明書（cheatsheet）锣险，俗稱小抄蹄皱。

以后學(xué)習(xí)R包，主要自己研究小抄芯肤，那么小抄的獲得方式有哪些巷折？

方法1：去百度/谷歌XX小抄
方法2：找Rstudio的cheatsheet網(wǎng)站（網(wǎng)速好慢的）
https://www.rstudio.com/resources/cheatsheets/
方法3. 教程里用到的包都可以到生信星球公眾號回復(fù)相應(yīng)的包名來獲取

了解tidyr包

tidyr的功能主要有：
（1）數(shù)據(jù)框的變形
（2）處理數(shù)據(jù)框中的空值
（3）根據(jù)一個(gè)表格衍生出其他表格
（4）實(shí)現(xiàn)行或列的分割和合并

這個(gè)包是把你要用的數(shù)據(jù)處理成標(biāo)準(zhǔn)而統(tǒng)一的數(shù)據(jù)框,就是數(shù)據(jù)分析前的準(zhǔn)備工作。

安裝tidyr包

下載和安裝tidyr包

install.packages("tidyr")

加載tidyr包

library(tidyr)

新建數(shù)據(jù)框

a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))

自己隨便建立一個(gè)數(shù)據(jù)框如下

bioplanet<-data.frame(ID=c(1:5),genesmyble=c("w","f","d","e","p"),expression=c(6:10))

Snipaste_2018-10-27_19-59-39.png

注釋與注意事項(xiàng)

rep崖咨，重復(fù)锻拘，括號中填要重復(fù)的字符和重復(fù)次數(shù)。
paste，連接兩個(gè)字符串署拟，括號要填兩個(gè)代連接字符并指定分隔符（sep）婉宰，沒有分隔符就填sep=“”。
1：3表示從1到三推穷。如需一列中需要填入三個(gè)無規(guī)律的數(shù)字心包，可以用向量c(1，3馒铃，4)蟹腾，同樣如果填的是字符串也需要加雙引號，例如c("doudou","huahua","xiaoyu")骗露。
2.了解概念：key-value--“鍵值對” 岭佳，表示一種對應(yīng)關(guān)系∠麸保“鍵”和“值”都是列名珊随，如SampleName和Expression的對應(yīng)。
3.函數(shù)后面一般都要加括號柿隙，括號里第一個(gè)參數(shù)是都數(shù)據(jù)框名
4.字符串要加雙引號（行名和列名也是字符串叶洞，但是可以不用加），其他單元格（姑且這么叫了）里出現(xiàn)的字符串要加禀崖。
行 raw
列 column衩辟，簡化寫法為col

了解Tidyr Data

這是一種組織表格數(shù)據(jù)的方式，提供了一種能夠跨包使用的“統(tǒng)一”的數(shù)據(jù)格式波附。
什么叫“統(tǒng)一”艺晴？
每個(gè)變量（variable）占一列，每個(gè)情況（case掸屡，姑且這么翻譯）和觀測值（observation）占一行封寞。

整理數(shù)據(jù)（Reshape Data）

先了解兩個(gè)函數(shù)

gather函數(shù)：將寬數(shù)據(jù)變成長數(shù)據(jù)格式。把列名變行數(shù)值仅财。
spread函數(shù)：將長數(shù)據(jù)變成寬數(shù)據(jù)格式狈究。把列數(shù)值變列名。

新建一個(gè)數(shù)據(jù)文件

> a<- data.frame(country=c("A","B","C"),"1999"=paste("K",c(0.7,37,212)),"2000"=paste("K",c(2,80,213)))
> View(a)

Snipaste_2018-10-27_20-58-40.png

將列名合并成一個(gè)列

gather(a,X1999,X2000,key = "year",value = "cases")

Snipaste_2018-10-27_21-09-13.png

gather括號里的分別是：
數(shù)據(jù)框名盏求，需合并的列名（兩個(gè)）抖锥，合并后的key列名，value列名碎罚。
其中磅废，需合并的列名也可以列在最后(其實(shí)個(gè)順序才是默認(rèn)的)，key=和value=也可以省略荆烈，如果按照上面小抄的命令括號里那個(gè)順序拯勉，省略了就會(huì)報(bào)錯(cuò)。
簡化代碼gather(a,"year","cases",X1999,X2000) #推薦的偷懶做法
合并前的列名如果比較多，可以用排除法來偷懶谜喊，在上圖例子中可用gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列潭兽。

處理丟失的數(shù)據(jù)

三種處理方式：
(1).刪除整行
(2).根據(jù)上下文（瞎）蒙一個(gè)
(3).同一列的空值填上同一個(gè)數(shù)。

刪除整行
drop_na()：有空值的斗遏，整行刪除掉
括號里填數(shù)據(jù)框名山卦，依據(jù)的列名（有空值那一列的列名）

Snipaste_2018-10-27_21-19-05.png

這里注意讀入數(shù)據(jù)并賦值給一個(gè)變量

Snipaste_2018-10-27_21-21-04.png

在這里之所以選擇了csv，是因?yàn)檫@個(gè)神奇的格式支持R和Excel诵次，默認(rèn)參數(shù)好的很（默認(rèn)分隔符是“账蓉，”，導(dǎo)出時(shí)也不會(huì)默認(rèn)加引號逾一。如果你用read.table試試就知道默認(rèn)參數(shù)多笨了）铸本，并且轉(zhuǎn)換txt也不會(huì)變亂碼！
在這里補(bǔ)充下csv的導(dǎo)入和導(dǎo)出方式遵堵。(默認(rèn)參數(shù)好箱玷，學(xué)R沒煩惱)
導(dǎo)入：X<-read.csv('doudou.csv')
導(dǎo)出：write.csv(X,'doudou.csv')

根據(jù)上下文（瞎）蒙一個(gè)
fill()，根據(jù)上一行的數(shù)值填充上（好應(yīng)付的感覺）

Snipaste_2018-10-27_22-09-00.png

原文件

Snipaste_2018-10-27_22-11-13.png

分割后的文件

Snipaste_2018-10-27_22-09-06.png

csv 文件是用逗號分隔的陌宿，故而 sep = ","
tsv 文件是用制表符分隔的锡足，故而 sep = "\t"
常用的分隔符還有空格 sep = " "
分隔符是任意的，可根據(jù)具體情況指定的壳坪。
在輸入的時(shí)候舶得，原內(nèi)容是用什么符號分隔的，sep就要保持一致爽蝴，否則可能無法正確讀取

因?yàn)樯俅蛄藄ep函數(shù)0.7變成0了沐批，經(jīng)花花指導(dǎo)，原來不加sep自動(dòng)識別分隔符蝎亚，把小數(shù)點(diǎn)也算成分隔符了九孩。因?yàn)橹恢付ǚ指顑闪校?不出來了颖对。
改為separate(a,X1999,into = c("cas","rep"),sep=" ")成功分割捻撑。

Snipaste_2018-10-27_22-34-23.png

思維導(dǎo)圖

R處理數(shù)據(jù)文件.png

今天學(xué)習(xí)結(jié)束磨隘，好像比昨天簡單了一些缤底，也許是我進(jìn)步了。^_

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末番捂，一起剝皮案震驚了整個(gè)濱河市个唧，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌设预，老刑警劉巖徙歼，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡魄梯，警方通過查閱死者的電腦和手機(jī)桨螺，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來酿秸，“玉大人灭翔，你說我怎么就攤上這事±彼眨” “怎么了肝箱？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長稀蟋。經(jīng)常有香客問我煌张，道長，這世上最難降的妖魔是什么退客？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任骏融，我火速辦了婚禮，結(jié)果婚禮上萌狂，老公的妹妹穿的比我還像新娘绎谦。我一直安慰自己，他們只是感情好粥脚，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布窃肠。她就那樣靜靜地躺著，像睡著了一般刷允。火紅的嫁衣襯著肌膚如雪冤留。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天树灶，我揣著相機(jī)與錄音纤怒，去河邊找鬼。笑死天通，一個(gè)胖子當(dāng)著我的面吹牛泊窘，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播像寒，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼烘豹，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了诺祸？” 一聲冷哼從身側(cè)響起携悯，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎筷笨，沒想到半個(gè)月后憔鬼，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體龟劲，經(jīng)...
沈念sama閱讀 43,400評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年轴或，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了昌跌。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 37,997評論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡照雁，死狀恐怖避矢，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情囊榜，我是刑警寧澤审胸，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站卸勺，受9級特大地震影響砂沛，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜曙求，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一碍庵、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧悟狱，春花似錦静浴、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案苹享，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至浴麻，卻和暖如春得问，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背软免。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工宫纬，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人膏萧。一個(gè)月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓漓骚，卻偏偏與公主長得像，于是被迫代替她去往敵國和親榛泛。傳聞我的和親對象是個(gè)殘疾皇子蝌蹂，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評論 2贊 345

學(xué)習(xí)小組Day6筆記-夢幻天堂

今天任務(wù)安裝R包并處理一個(gè)數(shù)據(jù)文件

R包

了解tidyr包

安裝tidyr包

下載和安裝tidyr包

加載tidyr包

新建數(shù)據(jù)框

了解Tidyr Data

整理數(shù)據(jù)（Reshape Data）

新建一個(gè)數(shù)據(jù)文件

將列名合并成一個(gè)列

處理丟失的數(shù)據(jù)

推薦閱讀更多精彩內(nèi)容