Day6-孟思博

R包小抄的介紹:

R包都有自己的說(shuō)明書(shū)(cheatsheet)湿镀,俗稱小抄椎侠。在對(duì)包有了一定的了解后,小抄是一個(gè)很好的學(xué)習(xí)操作指南,但是對(duì)于新手來(lái)說(shuō)般眉,很有可能完全看不懂了赵。今天的教程有一部分參照了小抄,并作出了通俗的解釋甸赃。相信跟著教程走下去柿汛,就可以學(xué)個(gè)七七八八,跟著練練埠对,然后自己研究一下小抄苛茂,一個(gè)R包就學(xué)個(gè)差不多啦。

準(zhǔn)備工作part1:學(xué)會(huì)獲取一個(gè)R包的小抄

方法1:去百度/谷歌XX小抄
方法2:找Rstudio的cheatsheet網(wǎng)站(網(wǎng)速好慢的)
https://www.rstudio.com/resources/cheatsheets/
方法3:到生信星球公眾號(hào)回復(fù)相應(yīng)的包名來(lái)獲取

準(zhǔn)備工作part2:初步了解tidyr

它的功能主要有:
(1)數(shù)據(jù)框的變形
(2)處理數(shù)據(jù)框中的空值
(3)根據(jù)一個(gè)表格衍生出其他表格
(4)實(shí)現(xiàn)行或列的分割和合并
  這個(gè)包是把你要用的數(shù)據(jù)處理成標(biāo)準(zhǔn)而統(tǒng)一的數(shù)據(jù)框(Tidy Data鸠窗,)妓羊,才能進(jìn)行進(jìn)一步的數(shù)據(jù)處理和作圖。

準(zhǔn)備工作part3--學(xué)習(xí)極簡(jiǎn)安裝R包:

1.下載和安裝tydir:install.packages("tidyr")
2.在控制臺(tái)輸入:library(tidyr)加載

準(zhǔn)備工作part4:數(shù)據(jù)框的小常識(shí)
1.新建數(shù)據(jù)框(這里直接把新建的數(shù)據(jù)框賦值給了a)
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
新建一個(gè)數(shù)據(jù)框并賦值給bioplanet這個(gè)變量(賦值符號(hào)<-還記得嘛)括號(hào)里是“列名”=列值稍计,這里列名要加雙引號(hào)躁绸。這里涉及的幾個(gè)給列填充數(shù)值的函數(shù)有
rep,重復(fù)臣嚣,括號(hào)中填要重復(fù)的字符和重復(fù)次數(shù)净刮。
paste,連接兩個(gè)字符串硅则,括號(hào)要填兩個(gè)代連接字符并指定分隔符(sep)淹父,沒(méi)有分隔符就填sep=“”。
1:3表示從1到3怎虫。如需一列中需要填入三個(gè)無(wú)規(guī)律的數(shù)字暑认,可以用向量c(1,3大审,4)蘸际,同樣如果填的是字符串也需要加雙引號(hào),例如c("doudou","huahua","xiaoyu")徒扶。
2.了解概念:key-value--“鍵值對(duì)” 粮彤,表示一種對(duì)應(yīng)關(guān)系〗猓“鍵”和“值”都是列名导坟,如SampleName和Expression的對(duì)應(yīng)。
3.函數(shù)后面一般都要加括號(hào)圈澈,括號(hào)里第一個(gè)參數(shù)是都數(shù)據(jù)框名
4.字符串要加雙引號(hào)(行名和列名也是字符串惫周,但是可以不用加),其他單元格(姑且這么叫了)里出現(xiàn)的字符串要加士败。

準(zhǔn)備工作part5:認(rèn)識(shí)Tidy Data

這是一種組織表格數(shù)據(jù)的方式闯两,提供了一種能夠跨包使用的“統(tǒng)一”的數(shù)據(jù)格式褥伴。
什么叫“統(tǒng)一”:每個(gè)變量(variable)占一列,每個(gè)情況(case漾狼,姑且這么翻譯)和觀測(cè)值(observation)占一行重慢。

tidyr包的應(yīng)用

1.Reshape Data

gather:我就是剛才的魔法棒
spread:我能讓tidy data一夜回到解放前。
輸入數(shù)據(jù)(舉例):a<-data.frame(country=c("A","B","C"),1999=paste(c(0.7,37,212),"K"),2000=paste(c(2,80,213),"K"))
gather(a,X1999,X2000,key = "year",value = "cases") gather括號(hào)里的分別是:數(shù)據(jù)框名逊躁,需合并的列名(兩個(gè))似踱,合并后的key列名,value列名稽煤。
gather(a,"year","cases",X1999,X2000) #推薦的偷懶做法
gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列核芽。
結(jié)果示例:

image.png

2.Handle Missing Values

三種處理方式:
(1).刪除整行
(2).根據(jù)上下文(瞎)蒙一個(gè)
(3).同一列的空值填上同一個(gè)數(shù)。
X<-read.csv('doudou.txt')讀取數(shù)據(jù)

drop_na():有空值的酵熙,整行刪除掉

括號(hào)里填數(shù)據(jù)框名轧简,依據(jù)的列名(有空值那一列的列名)
drop_na(X,X2)

fill(),根據(jù)上一行的數(shù)值填充上(好應(yīng)付的感覺(jué))

fill(X,X2)

replace_na()匾二,空值填進(jìn)去特定的一個(gè)數(shù)值(還是在應(yīng)付)

括號(hào)里填數(shù)據(jù)框名哮独,要填的列名=要填的值
replace_na(X,list(X2=2))

3. Expand Tables

complete(把空值的位置補(bǔ)全)

image.png

expand

數(shù)據(jù)pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
結(jié)果示例:

image.png

4.split cells(選修)

separate:按列分割
separate_rows:按行分割
unite:分割完了再合并回去
思維導(dǎo)圖:

image.png

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市察藐,隨后出現(xiàn)的幾起案子皮璧,更是在濱河造成了極大的恐慌,老刑警劉巖分飞,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件悴务,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡譬猫,警方通過(guò)查閱死者的電腦和手機(jī)讯檐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)删窒,“玉大人裂垦,你說(shuō)我怎么就攤上這事顺囊〖∷鳎” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵特碳,是天一觀的道長(zhǎng)诚亚。 經(jīng)常有香客問(wèn)我,道長(zhǎng)午乓,這世上最難降的妖魔是什么站宗? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮益愈,結(jié)果婚禮上梢灭,老公的妹妹穿的比我還像新娘夷家。我一直安慰自己,他們只是感情好敏释,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布库快。 她就那樣靜靜地躺著,像睡著了一般钥顽。 火紅的嫁衣襯著肌膚如雪义屏。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,708評(píng)論 1 305
  • 那天蜂大,我揣著相機(jī)與錄音闽铐,去河邊找鬼。 笑死奶浦,一個(gè)胖子當(dāng)著我的面吹牛兄墅,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播澳叉,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼察迟,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了耳高?” 一聲冷哼從身側(cè)響起扎瓶,我...
    開(kāi)封第一講書(shū)人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎泌枪,沒(méi)想到半個(gè)月后概荷,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡碌燕,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年误证,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片修壕。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡愈捅,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出慈鸠,到底是詐尸還是另有隱情蓝谨,我是刑警寧澤,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布青团,位于F島的核電站譬巫,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏督笆。R本人自食惡果不足惜芦昔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望娃肿。 院中可真熱鬧咕缎,春花似錦珠十、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至墅诡,卻和暖如春壳嚎,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背末早。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工烟馅, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人然磷。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓郑趁,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親姿搜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子寡润,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容