R語言學(xué)習(xí).5-數(shù)據(jù)讀寫

數(shù)據(jù)讀寫練習(xí)是生信技能樹生信爆款入門課程R語言部分Day5的講到的一個重要知識點(diǎn)瑰抵。
為加深理解,現(xiàn)在做下練習(xí)鞏固。

Last compiled on 01/10/21

rm(list = ls())

1.讀取ex1.txt

a <- read.table('ex1.txt')
dim(a)
## [1] 75  6
head(a)
##                                                                               V1
## 1                                                                          title
## 2    Illumina Sentrix Array Matrix (SAM) - GoldenGate Methylation Cancer Panel I
## 3         Illumina HumanMethylation27 BeadChip (HumanMethylation27_270596_v.1.2)
## 4           Illumina HumanMethylation450 BeadChip (HumanMethylation450_15017482)
## 5 GE Healthcare/Amersham Biosciences CodeLink鈩\xa2   ADME Rat 16-Assay Bioarray
## 6                                       [AG] Affymetrix Arabidopsis Genome Array
##         V2                           V3             V4                   V5
## 1      gpl                 bioc_package   manufacturer             organism
## 2 GPL15380     GGHumanMethCancerPanelv1       Illumina         Homo sapiens
## 3  GPL8490  IlluminaHumanMethylation27k Illumina, Inc.         Homo sapiens
## 4 GPL13534 IlluminaHumanMethylation450k Illumina, Inc.         Homo sapiens
## 5  GPL2898                    adme16cod  GE Healthcare    Rattus norvegicus
## 6    GPL71                           ag     Affymetrix Arabidopsis thaliana
##               V6
## 1 data_row_count
## 2           1536
## 3          27578
## 4         485577
## 5           1280
## 6           8297

2.讀取ex2_B cell receptor signaling pathway.csv

ex2 <- read.csv('ex2_B cell receptor signaling pathway.csv',
                row.names = 1)
dim(ex2)
## [1]  18 168
ex2[1:4,1:4]
##         TCGA.06.0238.01A TCGA.06.0171.02A TCGA.28.5218.01A TCGA.06.0130.01A
## NCKAP1L         10.96088         13.67818         11.69558         12.41409
## SYK             10.64797         12.99044         11.07856         11.88787
## PTPRC           10.61789         13.49278         11.26111         12.33504
## PTPN6           10.49375         12.35558         10.58999         11.66260

3.讀取GSE32575_series_matrix.txt时肿,賦值給gse释簿。

gse <- read.table('GSE32575_series_matrix.txt',
                  comment.char = '!',
                  header = T,
                  row.names = 1)

dim(gse)
## [1] 336  48
gse[1:4,1:4]
##               GSM807339  GSM807340  GSM807341  GSM807342
## ILMN_1343289 19525.4400 20503.6100 18821.2200 17943.6300
## ILMN_1343290 20599.1000 21696.7000 16206.9200 18101.9800
## ILMN_1343291 25829.9200 24742.1800 23758.1200 24592.3600
## ILMN_1343292   383.6296   353.3019   303.2715   375.0452

4.描述gse的屬性

#View(gse)
as.matrix(gse)[1:4,1:4]
##               GSM807339  GSM807340  GSM807341  GSM807342
## ILMN_1343289 19525.4400 20503.6100 18821.2200 17943.6300
## ILMN_1343290 20599.1000 21696.7000 16206.9200 18101.9800
## ILMN_1343291 25829.9200 24742.1800 23758.1200 24592.3600
## ILMN_1343292   383.6296   353.3019   303.2715   375.0452
class(gse)
## [1] "data.frame"

5.將gse導(dǎo)出為新的txt和csv文件。

write.table(gse,'z.txt')
write.csv(gse,'zz.csv')

6.將gse保存為Rdata并加載贴硫。

save(gse,file = 'ex.Rdata')#file = 必須寫
rm(list = ls())
load('ex.Rdata')

練習(xí)4-1:

1.讀取complete_set.txt(已保存在工作目錄)

a <- read.table('complete_set.txt')
#先 dim
dim(a)
## [1] 51 20
a[1:4,1:4]
##                   V1                 V2                V3                 V4
## 1              geneA              geneB             geneC              geneD
## 2 -0.635020187971398  -0.49728008811353 0.514896730700242  -1.01508182502931
## 3   0.91605661780324 -0.545381308500589  1.20238322656491  0.956212067289626
## 4  0.805995294157758 -0.315914513323816  0.27825197143441 -0.727119736260533
# 讀入之后 要先查看數(shù)據(jù) 是必經(jīng)步驟
# 需要header= T
# 否則列名被改變了,可以看出列名多了V1
a <- read.table('complete_set.txt',header = T)
dim(a)
## [1] 50 20
a[1:4,1:4]
##        geneA       geneB      geneC      geneD
## 1 -0.6350202 -0.49728009  0.5148967 -1.0150818
## 2  0.9160566 -0.54538131  1.2023832  0.9562121
## 3  0.8059953 -0.31591451  0.2782520 -0.7271197
## 4  0.5380081 -0.06739211 -0.6237648 -1.6250202
#正確
#先 dim

2.查看有多少行馋吗、多少列

dim(a)
## [1] 50 20

3.獲取行名和列名

rownames(a)
##  [1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10" "11" "12" "13" "14" "15"
## [16] "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30"
## [31] "31" "32" "33" "34" "35" "36" "37" "38" "39" "40" "41" "42" "43" "44" "45"
## [46] "46" "47" "48" "49" "50"
colnames(a)
##  [1] "geneA" "geneB" "geneC" "geneD" "geneE" "geneF" "geneG" "geneH" "geneI"
## [10] "geneJ" "geneK" "geneL" "geneM" "geneN" "geneO" "geneP" "geneQ" "geneR"
## [19] "geneS" "geneT"

4.導(dǎo)出為csv格式

write.csv(a,'a.csv')

5.保存為Rdata

save(a,file = 'a.Rdata')

6.加載class.Rdata,查看數(shù)據(jù)類型

load('class.Rdata')
#環(huán)境變量出現(xiàn)了y的數(shù)據(jù)
#在環(huán)境變量里面  可以看出都是字符型chr
class(y[2])#從一行一列也可以看出數(shù)據(jù)類型
## [1] "character"
y#從矩陣也可以看出
##      gene1 gene2 gene3 gene4 gene5 gene6 grouplist
## GSM1 "40"  "15"  "22"  "600" "25"  "123" "control"
## GSM2 "20"  "45"  "77"  "544" "33"  "124" "control"
## GSM3 "51"  "12"  "26"  "350" "30"  "55"  "control"
## GSM4 "46"  "11"  "20"  "390" "45"  "334" "treat"  
## GSM5 "38"  "12"  "24"  "260" "20"  "543" "treat"  
## GSM6 "49"  "10"  "25"  "220" "33"  "239" "treat"
class(y)#
## [1] "matrix" "array"
#字符和數(shù)字的數(shù)據(jù)框 轉(zhuǎn)為矩陣 就會這樣

高階數(shù)據(jù)讀取指南http://www.reibang.com/p/4ea320c0dcc6

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市胯府,隨后出現(xiàn)的幾起案子介衔,更是在濱河造成了極大的恐慌,老刑警劉巖骂因,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件炎咖,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)乘盼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門升熊,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人绸栅,你說我怎么就攤上這事级野。” “怎么了粹胯?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵蓖柔,是天一觀的道長。 經(jīng)常有香客問我风纠,道長况鸣,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任竹观,我火速辦了婚禮镐捧,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘臭增。我一直安慰自己懂酱,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布誊抛。 她就那樣靜靜地躺著列牺,像睡著了一般。 火紅的嫁衣襯著肌膚如雪芍锚。 梳的紋絲不亂的頭發(fā)上昔园,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天蔓榄,我揣著相機(jī)與錄音并炮,去河邊找鬼。 笑死甥郑,一個胖子當(dāng)著我的面吹牛逃魄,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播澜搅,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼伍俘,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了勉躺?” 一聲冷哼從身側(cè)響起癌瘾,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎饵溅,沒想到半個月后妨退,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年咬荷,在試婚紗的時候發(fā)現(xiàn)自己被綠了冠句。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡幸乒,死狀恐怖懦底,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情罕扎,我是刑警寧澤聚唐,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站壳影,受9級特大地震影響拱层,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宴咧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一根灯、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧掺栅,春花似錦烙肺、人聲如沸邦马。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽档插。三九已至沙绝,卻和暖如春搏明,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背闪檬。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工星著, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人粗悯。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓虚循,卻偏偏與公主長得像,于是被迫代替她去往敵國和親样傍。 傳聞我的和親對象是個殘疾皇子横缔,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容