生信星球第12期 Day6-小夢(mèng)想在努力

繼續(xù)學(xué)R颇蜡!

  • 1.前言
  • 2.安裝tidyr
  • 3.數(shù)據(jù)框小常識(shí)
  • 4.認(rèn)識(shí)tidyr
  • 5.reshape data
  • 6.Handle Missing Values
  • 7.Expand Tables
  • 8.split cells(選修)
    第12期Day6

1.前言

R包都有自己的說(shuō)明書(shū)(cheatsheet)为牍。

2.安裝tidyr

(1)獲取一個(gè)R包的小抄

公眾號(hào)回復(fù)最偷懶了,不過(guò)不夠優(yōu)秀严嗜。。洲敢。

(2)初步了解tidyr

①數(shù)據(jù)框的變形
②處理數(shù)據(jù)框中的空值
③根據(jù)一個(gè)表格衍生出其他表格
④實(shí)現(xiàn)行或列的分割和合并
把要用的數(shù)據(jù)處理成標(biāo)準(zhǔn)而統(tǒng)一的數(shù)據(jù)框(Tidy Data漫玄,下面有解釋),才能進(jìn)行進(jìn)一步的數(shù)據(jù)處理和作圖

(3)極簡(jiǎn)安裝

①打開(kāi)RStudio,設(shè)置好工作環(huán)境睦优,輸入library(tidyr)渗常,沒(méi)有就報(bào)錯(cuò)。

設(shè)置工作環(huán)境都沒(méi)記住汗盘,丟人皱碘!

②下載安裝tidyr。
命令是 install.packages("tidyr")

  • 下載很慢隐孽,只要控制臺(tái)不出現(xiàn)>尸执,就一直等著

事實(shí)證明,確實(shí)比較慢

安裝完是這樣

運(yùn)行一下看看缓醋,library(tidyr)
沒(méi)報(bào)錯(cuò)就是成功

3.數(shù)據(jù)框

(1)新建數(shù)據(jù)框

這里直接把新建的數(shù)據(jù)框賦值給了a


命令和輸出效果

命令的細(xì)節(jié)

新建一個(gè)數(shù)據(jù)框并賦值給bioplanet這個(gè)變量(賦值符號(hào)<-還記得嘛)括號(hào)里是“列名”=列值如失,這里列名要加雙引號(hào)。這里涉及的幾個(gè)給列填充數(shù)值的函數(shù)有
rep送粱,重復(fù)褪贵,括號(hào)中填要重復(fù)的字符和重復(fù)次數(shù)。
paste抗俄,連接兩個(gè)字符串脆丁,括號(hào)要填兩個(gè)代連接字符并指定分隔符(sep),沒(méi)有分隔符就填sep=“”动雹。
1:3表示從1到三槽卫。如需一列中需要填入三個(gè)無(wú)規(guī)律的數(shù)字,可以用向量c(1胰蝠,3歼培,4),同樣如果填的是字符串也需要加雙引號(hào)茸塞,例如c("doudou","huahua","xiaoyu")躲庄。
2.了解概念:key-value--“鍵值對(duì)” ,表示一種對(duì)應(yīng)關(guān)系钾虐≡刖剑“鍵”和“值”都是列名,如SampleName和Expression的對(duì)應(yīng)效扫。
3.函數(shù)后面一般都要加括號(hào)倔监,括號(hào)里第一個(gè)參數(shù)是都數(shù)據(jù)框名
4.字符串要加雙引號(hào)(行名和列名也是字符串,但是可以不用加)菌仁,其他單元格(姑且這么叫了)里出現(xiàn)的字符串要加浩习。
行 raw
列 column,簡(jiǎn)化寫(xiě)法為col ——生信星球

以上慢慢理解吧掘托。

4.認(rèn)識(shí)tidyr

學(xué)習(xí)了瘦锹。

這是一種組織表格數(shù)據(jù)的方式,提供了一種能夠跨包使用的“統(tǒng)一”的數(shù)據(jù)格式闪盔。
什么叫“統(tǒng)一”弯院?
每個(gè)變量(variable)占一列,每個(gè)情況(case泪掀,姑且這么翻譯)和觀測(cè)值(observation)占一行听绳。
舉個(gè)栗子——生信星球

一目了然

5.reshape data

gather:我就是剛才的魔法棒
spread:我能讓tidy data一夜回到解放前。

截圖來(lái)自小抄

在這里如何復(fù)制上圖中的數(shù)據(jù)异赫?(比較特殊的一點(diǎn)是列名是數(shù)字椅挣,這個(gè)還沒(méi)碰見(jiàn)過(guò),因此對(duì)它這個(gè)列名動(dòng)了一點(diǎn)手腳塔拳,不管給他們加雙引號(hào)鼠证、單引號(hào)還是反引號(hào)(英文模式下的1前面那個(gè)鍵),都沒(méi)有報(bào)錯(cuò)靠抑!但是不加引號(hào)是不行滴量九。

命令

命令及效果

命令特寫(xiě)

需要變化

命令

gather括號(hào)里的分別是:
數(shù)據(jù)框名,需合并的列名(兩個(gè))颂碧,合并后的key列名荠列,value列名。
其中载城,需合并的列名也可以列在最后(其實(shí)個(gè)順序才是默認(rèn)的)肌似,key=和value=也可以省略(我愛(ài)偷懶),如果按照上面小抄的命令括號(hào)里那個(gè)順序诉瓦,省略了就會(huì)報(bào)錯(cuò)川队。

偷懶做法

如此。

6.Handle Missing Values

處理丟失的數(shù)據(jù)睬澡。就是某些單元格有空值的情況呼寸。
三種處理方式:
(1).drop。刪除整行猴贰。
(2).fill对雪。根據(jù)上下文(瞎)蒙一個(gè)。
(3).replace米绕。同一列的空值填上同一個(gè)數(shù)瑟捣。

小抄截圖

csv這么牛么?

命令

區(qū)分大小寫(xiě)

自動(dòng)填充和替換

填充和替換效果圖

7.Expand Tables

①complete

小抄截圖

complete的命令

效果圖

3個(gè)空值

填充

②expand

(列出每列值所有可能的組合--根據(jù)下面的示例來(lái)理解這句話)
來(lái)看示例(以前年紀(jì)小不懂事栅干,數(shù)據(jù)框名胡亂取的):
示例數(shù)據(jù)(就是剛才新建出來(lái)的數(shù)據(jù)框a):

第1次的a值

原來(lái)就是換了個(gè)pin2的名字迈套。。碱鳞。懵B了半天桑李。。。

expand的命令

效果圖贵白。也要注意大小寫(xiě)率拒,錯(cuò)了好幾遍才寫(xiě)對(duì)命令

8.split cells(選修)

①分割分兩種

把一列拆成兩列。目測(cè)原列必須要有分隔符才行啊好像禁荒。

小抄截圖

按列和按行分割

②合并
合并小抄截圖

合并

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末猬膨,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子呛伴,更是在濱河造成了極大的恐慌勃痴,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件热康,死亡現(xiàn)場(chǎng)離奇詭異沛申,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)姐军,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門铁材,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人庶弃,你說(shuō)我怎么就攤上這事衫贬。” “怎么了歇攻?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵固惯,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我缴守,道長(zhǎng)葬毫,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任屡穗,我火速辦了婚禮贴捡,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘村砂。我一直安慰自己烂斋,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布础废。 她就那樣靜靜地躺著汛骂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪评腺。 梳的紋絲不亂的頭發(fā)上帘瞭,一...
    開(kāi)封第一講書(shū)人閱讀 51,482評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音蒿讥,去河邊找鬼蝶念。 笑死抛腕,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的媒殉。 我是一名探鬼主播担敌,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼适袜!你這毒婦竟也來(lái)了柄错?” 一聲冷哼從身側(cè)響起舷夺,我...
    開(kāi)封第一講書(shū)人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤苦酱,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后给猾,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體疫萤,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年敢伸,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了扯饶。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡池颈,死狀恐怖尾序,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情躯砰,我是刑警寧澤每币,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站琢歇,受9級(jí)特大地震影響兰怠,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜李茫,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一揭保、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧魄宏,春花似錦秸侣、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至名秀,卻和暖如春励负,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背匕得。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工继榆, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留巾表,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓略吨,卻偏偏與公主長(zhǎng)得像集币,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子翠忠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 官網(wǎng) 中文版本 好的網(wǎng)站 Content-type: text/htmlBASH Section: User ...
    不排版閱讀 4,381評(píng)論 0 5
  • 手動(dòng)不易鞠苟,轉(zhuǎn)發(fā)請(qǐng)注明出處 --Trance 數(shù)據(jù)庫(kù)系統(tǒng)命令: (1).查看存儲(chǔ)過(guò)程狀態(tài):show pro...
    Trance_b54c閱讀 1,663評(píng)論 0 8
  • 前兩天一直覺(jué)得R太難了,學(xué)的頭大秽之,通過(guò)今天的學(xué)習(xí)当娱,終于讓我擯棄前嫌,開(kāi)始喜歡上了R考榨,真的是功能強(qiáng)大又簡(jiǎn)潔跨细,非常友好...
    胡瑩crystal閱讀 571評(píng)論 0 1
  • 2018.12.21日 周五 日更第280天 1 按照前天的進(jìn)度,今天產(chǎn)品需要交貨了河质,中午軟件技術(shù)人員就到了車間去...
    任正飛人性營(yíng)銷閱讀 405評(píng)論 2 3
  • 看過(guò)一句話:“不是所有人都能叫前任冀惭,而前任也并非是某個(gè)人,它是每一個(gè)走過(guò)的人掀鹅,在你心里留下的痕跡散休。”是啊乐尊,人這一生...
    Rove_閱讀 290評(píng)論 0 1