R作業(yè)初級(jí)

初級(jí)題目

正式開始我們的旅程

library(tidyverse)
library(ggpubr)

軟件安裝以及R包安裝
參考：http://www.bio-info-trainee.com/3727.html

# # 先注釋掉吉挣，避免在Rmarkdown中運(yùn)行
# rm(list = ls()) 
# options()$repos 
# options()$BioC_mirror
# options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
# options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
# options()$repos 
# options()$BioC_mirror
# 
# # https://bioconductor.org/packages/release/bioc/html/GEOquery.html
# if (!requireNamespace("BiocManager", quietly = TRUE))
#  install.packages("BiocManager")
# BiocManager::install("KEGG.db",ask = F,update = F)
# BiocManager::install(c("GSEABase","GSVA","clusterProfiler" ),ask = F,update = F)
# BiocManager::install(c("GEOquery","limma","impute" ),ask = F,update = F)
# BiocManager::install(c("genefu","org.Hs.eg.db","hgu133plus2.db" ),ask = F,update = F)
# 
# # 下面代碼被我注釋了，意思是這些代碼不需要運(yùn)行废麻，因?yàn)樗^時(shí)了，很多舊教程就忽略
# # source("https://bioconductor.org/biocLite.R") 
# # library('BiocInstaller') 
# # options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
# # BiocInstaller::biocLite("GEOquery")
# # BiocInstaller::biocLite(c("limma"))
# # BiocInstaller::biocLite(c("impute"))
# 
# options()$repos
# install.packages('WGCNA')
# install.packages(c("FactoMineR", "factoextra"))
# install.packages(c("ggplot2", "pheatmap","ggpubr"))
# library("FactoMineR")
# library("factoextra")
# 
# library(GSEABase)
# library(GSVA)
# library(clusterProfiler)
# library(genefu)
# library(ggplot2)
# library(ggpubr)
# library(hgu133plus2.db)
# library(limma)
# library(org.Hs.eg.db)
# library(pheatmap)

getwd()

3.新建6個(gè)向量模庐，基于不同的原子類型烛愧。（重點(diǎn)是字符串，數(shù)值掂碱，邏輯值）

a1 <- 1:10
a1
class(a1)
a2 <- c('hello','the','world')
class(a2)
a3 <- c(T,T,T,F,F,T,T,F)
a3
class(a3)
a4 <- 607L
a4
class(a4)
a5 <- seq(from = 0, to = 20, by =2)
a5
class(a5)
a6 <- c(13.14,14)
a6
class(a6)

4.新建一些數(shù)據(jù)結(jié)構(gòu)屑彻，比如矩陣，數(shù)組顶吮，數(shù)據(jù)框，列表等重點(diǎn)是數(shù)據(jù)框粪薛，矩陣）

c <- c(1,2,3)
list <- list(c(1,2,3),'3,14')
M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)
a <- array(c('a','b'),dim = c(3,3,2))
f <- factor(c)
df <- data.frame(gene=paste0("gene",1:15),
                 s1=rnorm(n=15),s2=rnorm(n=15),s3=rnorm(n=15),s4=rnorm(n=15),s5=rnorm(n=15))
# 取df的第1悴了，3行，取第4违寿，6列
df[c(1,3),]
df[,c(4,6)]

5.使用data函數(shù)來加載R內(nèi)置數(shù)據(jù)集 rivers湃交，其他數(shù)據(jù)集：

data("rivers")
#Lengths of Major North American Rivers

head(rivers)
tail(rivers)

# 數(shù)據(jù)集的長(zhǎng)
length(rivers)
# structure 顯示對(duì)象內(nèi)部結(jié)構(gòu)
str(rivers) 
# 獲取描述性統(tǒng)計(jì)量（最小值/最大值/四分位數(shù)/數(shù)值型變量/因子向量/邏輯型向量）
summary(rivers) 
rm(list = ls())

下載 https://www.ncbi.nlm.nih.gov/sra?term=SRP133642 里面的 RunInfo Table 文件讀入到R里面，了解這個(gè)數(shù)據(jù)框藤巢，多少列搞莺，每一列都是什么屬性的元素
打開鏈接https://www.ncbi.nlm.nih.gov/sra?term=SRP133642
點(diǎn)擊Send results to Run selector鏈接
點(diǎn)擊RunInfo Table按鈕即可下載RunInfo Table文件

rm(list = ls())
options(stringsAsFactors = F)
Table <- read.table(file = "SraRunTable.txt",header = T,sep = '\t')
class(Table)
dim(Table) # 查看data.frame維度
ncol(Table) #查看data.frame列數(shù)
str(Table)

下載 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE111229 里面的樣本信息sample.csv讀入到R里面，了解這個(gè)數(shù)據(jù)框掂咒，多少列才沧，每一列都是什么屬性的元素
7.1 打開GEO主頁https://www.ncbi.nlm.nih.gov/geo/，點(diǎn)擊Samples鏈接
7.2 在搜索欄中輸入GSE111229绍刮，點(diǎn)擊Search按鈕温圆，然后點(diǎn)擊Export按鈕
7.3 在彈出的對(duì)話框點(diǎn)擊Export按鈕，得到sample.csv

# 讀取樣本信息
sample <-read.csv("sample.csv")
colnames(sample)
dim(Table)
## [1] 768  31
dim(sample)
## [1] 768  12
d = merge(Table,sample,by.x = "Sample_Name",by.y = "Accession")
# merge() 函數(shù) 此時(shí)Table的Sample_Name列和sample的Accession列內(nèi)容相同孩革，合并這一列
dim(d)
library(tidyverse)
d = sample %>% 
  dplyr::rename("Sample_Name" = "Accession") %>%
  left_join(Table,by = "Sample_Name")
dim(d)

對(duì)前面讀取的 RunInfo Table 文件在R里面探索其MBases列岁歉，包括箱線圖(boxplot)和五分位數(shù)(fivenum)，還有頻數(shù)圖(hist)膝蜈，以及密度圖(density)

# Mbases樣本的堿基數(shù)
# 舉例：
boxplot(Table$MBases, main = "boxplot of MBases")
plot(fivenum(Table$MBases), main = "fivenum of MBases")
hist(Table$MBases, main = "hist of MBases")
plot(density(Table$MBases,na.rm=T), main = "density of MBases")

把前面讀取的樣本信息表格的樣本名字根據(jù)下劃線分割看第3列元素的統(tǒng)計(jì)情況锅移。第三列代表該樣本所在的plate

title = sample$Title
plate = unlist(lapply(title,function(x){stringr::str_split(x,"_")[[1]][3]}))
table(plate)

根據(jù)plate把關(guān)聯(lián)到的 RunInfo Table 信息的MBases列分組檢驗(yàn)是否有統(tǒng)計(jì)學(xué)顯著的差異

# plate 指384孔PCR板熔掺，編號(hào)分別是48號(hào)和49號(hào)

t.test(Table$MBases~plate)

分組繪制箱線圖(boxplot)，頻數(shù)圖(hist)非剃，以及密度圖(density)

boxplot(d$MBases~plate)
typeof(plate)
e = d[,c("MBases","Title")]
e$plate = plate
hist(e$MBases,freq = F, breaks = "sturges")
plot(density(e$MBases,na.rm=T))
# 比較簡(jiǎn)陋置逻，可以嘗試用ggplot2和ggpubr畫圖包

使用ggplot2把上面的圖進(jìn)行重新繪制

suppressMessages(library(ggplot2))
e$plate = plate
e$num=c(1:768)
colnames(e)
# 箱線圖
ggplot(e,aes(x=plate,y=MBases)) + geom_boxplot()   
# 頻數(shù)圖
ggplot(e,aes(x=MBases)) + geom_histogram(fill="lightblue",colour="grey") + facet_grid(plate ~ .) # 頻數(shù)圖
ggplot(e,aes(x=MBases,fill=plate))+geom_histogram()
# 密度圖
ggplot(e,aes(y=MBases,x=num)) + geom_point() + stat_density2d(aes(alpha=..density..),geom = "raster",contour = F)+ facet_grid(plate ~ .)  
ggplot(e,aes(x=MBases,fill=plate))+geom_density()

使用ggpubr把上面的圖進(jìn)行重新繪制

suppressMessages(library(ggpubr))
ggboxplot(e, x="plate", y="MBases", color = "plate", palette = "aaas",add = "jitter") + stat_compare_means(method = "t.test")
gghistogram(e, x="MBases", fill = "plate",palette = c("#f4424e", "#41a6f4"))
ggdensity(e, x="MBases", fill = "plate", color = "plate", add = "mean",palette = c("#f4424e", "#41a6f4"))

隨機(jī)取384個(gè)MBases信息，跟前面的兩個(gè)plate的信息組合成新的數(shù)據(jù)框努潘，第一列是分組诽偷，第二列是MBases，總共是384*3行數(shù)據(jù)

# sample() 函數(shù) 隨機(jī)抽樣
data <- e[sample(nrow(e),384),][,c(3,1,2)]
str(data)

感謝

http://www.reibang.com/p/c07e67e2c757
http://www.reibang.com/p/2e5a5192f219
歡迎關(guān)注生信菜鳥團(tuán)疯坤、生信技能樹１健！压怠！

最后編輯于：2019.06.29 12:20:40

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末眠冈，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子菌瘫，更是在濱河造成了極大的恐慌蜗顽，老刑警劉巖，帶你破解...
沈念sama閱讀 216,372評(píng)論 6贊 498
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件雨让，死亡現(xiàn)場(chǎng)離奇詭異雇盖，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)栖忠，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,368評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門崔挖，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人庵寞，你說我怎么就攤上這事狸相。” “怎么了捐川？”我有些...
開封第一講書人閱讀 162,415評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵脓鹃，是天一觀的道長(zhǎng)。經(jīng)常有香客問我古沥，道長(zhǎng)瘸右，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,157評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任渐白，我火速辦了婚禮尊浓，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘纯衍。我一直安慰自己栋齿，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,171評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著瓦堵，像睡著了一般基协。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上菇用，一...
開封第一講書人閱讀 51,125評(píng)論 1贊 297
城市分裂傳說
那天澜驮，我揣著相機(jī)與錄音，去河邊找鬼惋鸥。笑死杂穷，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的卦绣。我是一名探鬼主播耐量，決...
沈念sama閱讀 40,028評(píng)論 3贊 417
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼滤港！你這毒婦竟也來了廊蜒？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 38,887評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤溅漾，失蹤者是張志新（化名）和其女友劉穎山叮，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體添履，經(jīng)...
沈念sama閱讀 45,310評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡屁倔，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,533評(píng)論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了暮胧。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片汰现。...
茶點(diǎn)故事閱讀 39,690評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖叔壤，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情口叙，我是刑警寧澤炼绘，帶...
沈念sama閱讀 35,411評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站妄田，受9級(jí)特大地震影響俺亮，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜疟呐，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,004評(píng)論 3贊 325
男人毒藥：我在死后第九天來索命
文/蒙蒙一脚曾、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧启具，春花似錦本讥、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,659評(píng)論 0贊 22
一樁弒父案拷沸，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽色查。三九已至，卻和暖如春撞芍，著一層夾襖步出監(jiān)牢的瞬間秧了，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,812評(píng)論 1贊 268
情欲美人皮
我被黑心中介騙來泰國打工序无，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留验毡，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,693評(píng)論 2贊 368
代替公主和親
正文我出身青樓帝嗡，卻偏偏與公主長(zhǎng)得像晶通，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子丈探，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,577評(píng)論 2贊 353

R作業(yè)初級(jí)

初級(jí)題目

正式開始我們的旅程

感謝

推薦閱讀更多精彩內(nèi)容