Day6-孟思博

R包小抄的介紹：

R包都有自己的說(shuō)明書(shū)（cheatsheet）湿镀，俗稱小抄椎侠。在對(duì)包有了一定的了解后，小抄是一個(gè)很好的學(xué)習(xí)操作指南，但是對(duì)于新手來(lái)說(shuō)般眉，很有可能完全看不懂了赵。今天的教程有一部分參照了小抄，并作出了通俗的解釋甸赃。相信跟著教程走下去柿汛，就可以學(xué)個(gè)七七八八，跟著練練埠对，然后自己研究一下小抄苛茂，一個(gè)R包就學(xué)個(gè)差不多啦。

準(zhǔn)備工作part1：學(xué)會(huì)獲取一個(gè)R包的小抄

方法1：去百度/谷歌XX小抄
方法2：找Rstudio的cheatsheet網(wǎng)站（網(wǎng)速好慢的）
https://www.rstudio.com/resources/cheatsheets/
方法3：到生信星球公眾號(hào)回復(fù)相應(yīng)的包名來(lái)獲取

準(zhǔn)備工作part2：初步了解tidyr

它的功能主要有：
（1）數(shù)據(jù)框的變形
（2）處理數(shù)據(jù)框中的空值
（3）根據(jù)一個(gè)表格衍生出其他表格
（4）實(shí)現(xiàn)行或列的分割和合并
　　這個(gè)包是把你要用的數(shù)據(jù)處理成標(biāo)準(zhǔn)而統(tǒng)一的數(shù)據(jù)框（Tidy Data鸠窗，）妓羊，才能進(jìn)行進(jìn)一步的數(shù)據(jù)處理和作圖。

準(zhǔn)備工作part3--學(xué)習(xí)極簡(jiǎn)安裝R包：

1.下載和安裝tydir：install.packages("tidyr")
2.在控制臺(tái)輸入：library(tidyr)加載

準(zhǔn)備工作part4：數(shù)據(jù)框的小常識(shí)
1.新建數(shù)據(jù)框(這里直接把新建的數(shù)據(jù)框賦值給了a)
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
新建一個(gè)數(shù)據(jù)框并賦值給bioplanet這個(gè)變量（賦值符號(hào)<-還記得嘛）括號(hào)里是“列名”=列值稍计，這里列名要加雙引號(hào)躁绸。這里涉及的幾個(gè)給列填充數(shù)值的函數(shù)有
rep，重復(fù)臣嚣，括號(hào)中填要重復(fù)的字符和重復(fù)次數(shù)净刮。
paste，連接兩個(gè)字符串硅则，括號(hào)要填兩個(gè)代連接字符并指定分隔符（sep）淹父，沒(méi)有分隔符就填sep=“”。
1：3表示從1到3怎虫。如需一列中需要填入三個(gè)無(wú)規(guī)律的數(shù)字暑认，可以用向量c(1，3大审，4)蘸际，同樣如果填的是字符串也需要加雙引號(hào)，例如c("doudou","huahua","xiaoyu")徒扶。
2.了解概念：key-value--“鍵值對(duì)” 粮彤，表示一種對(duì)應(yīng)關(guān)系〗猓“鍵”和“值”都是列名导坟，如SampleName和Expression的對(duì)應(yīng)。
3.函數(shù)后面一般都要加括號(hào)圈澈，括號(hào)里第一個(gè)參數(shù)是都數(shù)據(jù)框名
4.字符串要加雙引號(hào)（行名和列名也是字符串惫周，但是可以不用加），其他單元格（姑且這么叫了）里出現(xiàn)的字符串要加士败。

準(zhǔn)備工作part5：認(rèn)識(shí)Tidy Data

這是一種組織表格數(shù)據(jù)的方式闯两，提供了一種能夠跨包使用的“統(tǒng)一”的數(shù)據(jù)格式褥伴。
什么叫“統(tǒng)一”：每個(gè)變量（variable）占一列，每個(gè)情況（case漾狼，姑且這么翻譯）和觀測(cè)值（observation）占一行重慢。

tidyr包的應(yīng)用

1.Reshape Data

gather：我就是剛才的魔法棒
spread：我能讓tidy data一夜回到解放前。
輸入數(shù)據(jù)（舉例）：a<-data.frame(country=c("A","B","C"),1999=paste(c(0.7,37,212),"K"),2000=paste(c(2,80,213),"K"))
gather(a,X1999,X2000,key = "year",value = "cases") gather括號(hào)里的分別是：數(shù)據(jù)框名逊躁，需合并的列名（兩個(gè)）似踱，合并后的key列名，value列名稽煤。
gather(a,"year","cases",X1999,X2000) #推薦的偷懶做法
gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列核芽。
結(jié)果示例：

image.png

2.Handle Missing Values

三種處理方式：
(1).刪除整行
(2).根據(jù)上下文（瞎）蒙一個(gè)
(3).同一列的空值填上同一個(gè)數(shù)。
X<-read.csv('doudou.txt')讀取數(shù)據(jù)

drop_na()：有空值的酵熙，整行刪除掉

括號(hào)里填數(shù)據(jù)框名轧简，依據(jù)的列名（有空值那一列的列名）
如drop_na(X,X2)

fill()，根據(jù)上一行的數(shù)值填充上（好應(yīng)付的感覺(jué)）

如fill(X,X2)

replace_na()匾二，空值填進(jìn)去特定的一個(gè)數(shù)值（還是在應(yīng)付）

括號(hào)里填數(shù)據(jù)框名哮独，要填的列名=要填的值
replace_na(X,list(X2=2))

3. Expand Tables

complete（把空值的位置補(bǔ)全）

image.png

expand

數(shù)據(jù)pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
結(jié)果示例：

image.png

4.split cells(選修)

separate：按列分割
separate_rows：按行分割
unite：分割完了再合并回去
思維導(dǎo)圖：

image.png

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市察藐，隨后出現(xiàn)的幾起案子皮璧，更是在濱河造成了極大的恐慌，老刑警劉巖分飞，帶你破解...
沈念sama閱讀 219,188評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件悴务，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡譬猫，警方通過(guò)查閱死者的電腦和手機(jī)讯檐，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,464評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)删窒，“玉大人裂垦，你說(shuō)我怎么就攤上這事顺囊〖∷鳎” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,562評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵特碳，是天一觀的道長(zhǎng)诚亚。經(jīng)常有香客問(wèn)我，道長(zhǎng)午乓，這世上最難降的妖魔是什么站宗？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,893評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮益愈，結(jié)果婚禮上梢灭，老公的妹妹穿的比我還像新娘夷家。我一直安慰自己，他們只是感情好敏释，可當(dāng)我...
茶點(diǎn)故事閱讀 67,917評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布库快。她就那樣靜靜地躺著，像睡著了一般钥顽。火紅的嫁衣襯著肌膚如雪义屏。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 51,708評(píng)論 1贊 305
城市分裂傳說(shuō)
那天蜂大，我揣著相機(jī)與錄音闽铐，去河邊找鬼。笑死奶浦，一個(gè)胖子當(dāng)著我的面吹牛兄墅，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播澳叉，決...
沈念sama閱讀 40,430評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼察迟，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了耳高？” 一聲冷哼從身側(cè)響起扎瓶，我...
開(kāi)封第一講書(shū)人閱讀 39,342評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎泌枪，沒(méi)想到半個(gè)月后概荷，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,801評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡碌燕，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,976評(píng)論 3贊 337
?白月光啟示錄
正文我和宋清朗相戀三年误证，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片修壕。...
茶點(diǎn)故事閱讀 40,115評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡愈捅，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出慈鸠，到底是詐尸還是另有隱情蓝谨，我是刑警寧澤，帶...
沈念sama閱讀 35,804評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布青团，位于F島的核電站譬巫，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏督笆。R本人自食惡果不足惜芦昔，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,458評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望娃肿。院中可真熱鬧咕缎，春花似錦珠十、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,008評(píng)論 0贊 22
一樁弒父案宵睦，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至墅诡，卻和暖如春壳嚎，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背末早。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,135評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工烟馅，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人然磷。一個(gè)月前我還...
沈念sama閱讀 48,365評(píng)論 3贊 373
代替公主和親
正文我出身青樓郑趁，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親姿搜。傳聞我的和親對(duì)象是個(gè)殘疾皇子寡润，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,055評(píng)論 2贊 355

Day6-孟思博

R包小抄的介紹：

準(zhǔn)備工作part1：學(xué)會(huì)獲取一個(gè)R包的小抄

準(zhǔn)備工作part2：初步了解tidyr

準(zhǔn)備工作part3--學(xué)習(xí)極簡(jiǎn)安裝R包：

準(zhǔn)備工作part5：認(rèn)識(shí)Tidy Data

tidyr包的應(yīng)用

1.Reshape Data

2.Handle Missing Values

drop_na()：有空值的酵熙，整行刪除掉

fill()，根據(jù)上一行的數(shù)值填充上（好應(yīng)付的感覺(jué)）

replace_na()匾二，空值填進(jìn)去特定的一個(gè)數(shù)值（還是在應(yīng)付）

3. Expand Tables

complete（把空值的位置補(bǔ)全）

expand

4.split cells(選修)

推薦閱讀更多精彩內(nèi)容