GPL16686芯片平臺(tái)分析

＃芯片分析中經(jīng)常會(huì)遇到Affymetrix Human Transcriptome Array 2.0芯片,由于目前還沒有現(xiàn)成的R包可以用，因此分析方法也不統(tǒng)一寻狂。見生信技能樹Jimmy老師HTA2.0芯片比較麻煩瞬项，其實(shí)這類常見的有3個(gè)平臺(tái)蔗蹋，3種類型：

GPL17586 [HTA-2_0] Affymetrix Human Transcriptome Array 2.0 [transcript (gene) version]
GPL19251 [HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [probe set (exon) version]
GPL16686 [HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [transcript (gene) version]
對(duì)于這三種平臺(tái)可以去Affymetrix的官網(wǎng)去查看其區(qū)別，也可以去NCBI去查看:
GPL17586
GPL19251
GPL16686

我安裝芯片分析的一般流程進(jìn)行分析,以GPL16686平臺(tái)囱淋，GSE77532

1纸颜、讀入soft文件，手動(dòng)下載GSE77532對(duì)應(yīng)的soft文件绎橘，實(shí)際應(yīng)該下載GPL16686對(duì)應(yīng)的GPL16686.soft文件胁孙，網(wǎng)速原因，只能退而求其次称鳞。

rm(list = ls())
options(stringsAsFactors = F)

#讀入soft文件
library(GEOquery)
gse77532 <- getGEO(filename = "GSE77532_family.soft.gz",destdir = ".")
dim(gse77532)

y <- gse77532@gpls$GPL16686@dataTable@table
dim(y)

head(y)
y[1:4,1:8]

2涮较、 id轉(zhuǎn)換


#### id conversion

library(clusterProfiler)
ENTREZID<- bitr(y[,6], fromType = "ACCNUM", 
                toType=c("SYMBOL","ENSEMBL","ENTREZID"),
                OrgDb = org.Hs.eg.db)
ls(package:clusterProfiler)

dim(ENTREZID)
ENTREZID[1:5,1:4]

save(y,ENTREZID,file = "ids.Rdata")

#ids過濾探針
table(y$GB_ACC %in% ENTREZID$ACCNUM)
y1 <- y[y$GB_ACC %in% ENTREZID$ACCNUM,]
y1[1:5,1:8]
y2 <- y1[,c(1,6)]
names(y2) <- c("probe_id","ACCNUM")

#合并y2與ENTREZID
ids <- merge(y2,ENTREZID,by ="ACCNUM",all=F)
ids[1:5,1:5]
dim(ids)
##載入表達(dá)矩陣
load("GSE77532_exprSet.Rdata")

exprSet <- exprSet2
exprSet[1:5,1:6]

#過濾表達(dá)矩陣

exprSet <- exprSet[rownames(exprSet) %in% ids$probe_id,]
dim(exprSet)
exprSet[1:5,1:5]

#ids過濾探針
ids <- ids[match(rownames(exprSet),ids$probe_id),]
dim(ids)
ids[1:2,1:5]
ids <- ids[,c(2,3)]
dim(ids)
ids[1:2,1:2]
#合并表達(dá)矩陣和ids

idcombine <- function(exprSet, ids){
  tmp <- by(exprSet,
            ids$SYMBOL,
            function(x) rownames(x)[which.max(rowMeans(x))])
  probes <- as.character(tmp)
  print(dim(exprSet))
  exprSet <- exprSet[rownames(exprSet) %in% probes,]
  
  print(dim(exprSet))
  rownames(exprSet) <- ids[match(rownames(exprSet), ids$probe_id),2]
  return(exprSet)
}

new_exprSet <- idcombine(exprSet,ids)
new_exprSet[1:4,1:6]

id 轉(zhuǎn)換用biomaRt包，更方便一些冈止，知識(shí)網(wǎng)速支持不下來狂票。

GPL17586平臺(tái)芯片

#
rm(list = ls())
options(stringsAsFactors = F)

#加載R包

library(GEOquery)

#讀入soft文件

GSE110359 <- getGEO(filename = "GSE110359_family.soft.gz",destdir = ".")
dim(GSE110359)

y <- GSE110359@gpls$GPL17586@dataTable@table
 

dim(y)

head(y)
y[1:4,1:15]
View(head(y))## you need to check this , which column do you need

probe2gene <- y[,c(2,8)] 

library(stringr)  
probe2gene$symbol=trimws(str_split(probe2gene$gene_assignment,'//',simplify = T)[,2])
plot(table(table(probe2gene$symbol)),xlim=c(1,50))
head(probe2gene)


dim(probe2gene)
View(head(probe2gene))
ids2 <- probe2gene[,c(1,3)]
View(head(ids))
ids2[1:20,1:2]#含有缺失值
save(ids2,probe2gene,file='GSE110359-probe2gene.Rdata')

load("GSE110359-probe2gene.Rdata")
#####
View(head(probe2gene))
dim(probe2gene)

ID 轉(zhuǎn)換

library(biomaRt)

x <- probe2gene$probeset_id
value <- x
attr <- c("affy_hta_2_0","hgnc_symbol")

ensembl <- useMart("ensembl", dataset = "hsapiens_gene_ensembl") 



ids <- getBM(attributes = attr,
             filters = "affy_hta_2_0",
             values = value,
             mart = ensembl,
             useCache = F)

dim(ids)#[1] 1041    2
View(head(ids))

save(ids,file = "GPL17586_ids.Rdata")


#去重之后
table(unique(ids$hgnc_symbol))#28262

attributes <- listAttributes(ensembl)
View(attributes) # 查看轉(zhuǎn)換格式

save(ids,ensembl,y,file = "ensembl.Rdata")

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市熙暴，隨后出現(xiàn)的幾起案子闺属，更是在濱河造成了極大的恐慌慌盯，老刑警劉巖，帶你破解...
沈念sama閱讀 206,839評(píng)論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件掂器，死亡現(xiàn)場(chǎng)離奇詭異亚皂，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)国瓮，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門灭必，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人乃摹，你說我怎么就攤上這事禁漓。” “怎么了孵睬？”我有些...
開封第一講書人閱讀 153,116評(píng)論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵播歼，是天一觀的道長(zhǎng)。經(jīng)常有香客問我掰读，道長(zhǎng)秘狞，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,371評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任磷支，我火速辦了婚禮谒撼，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘雾狈。我一直安慰自己廓潜，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,384評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布善榛。她就那樣靜靜地躺著辩蛋，像睡著了一般。火紅的嫁衣襯著肌膚如雪移盆。梳的紋絲不亂的頭發(fā)上悼院，一...
開封第一講書人閱讀 49,111評(píng)論 1贊 285
城市分裂傳說
那天，我揣著相機(jī)與錄音咒循，去河邊找鬼据途。笑死，一個(gè)胖子當(dāng)著我的面吹牛叙甸，可吹牛的內(nèi)容都是我干的颖医。我是一名探鬼主播，決...
沈念sama閱讀 38,416評(píng)論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼裆蒸，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼熔萧！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,053評(píng)論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤佛致，失蹤者是張志新（化名）和其女友劉穎贮缕，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體俺榆，經(jīng)...
沈念sama閱讀 43,558評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡感昼，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,007評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了肋演。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片抑诸。...
茶點(diǎn)故事閱讀 38,117評(píng)論 1贊 334
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡烂琴，死狀恐怖爹殊，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情奸绷，我是刑警寧澤梗夸，帶...
沈念sama閱讀 33,756評(píng)論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站号醉，受9級(jí)特大地震影響反症，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜畔派，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,324評(píng)論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一铅碍、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧线椰，春花似錦胞谈、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評(píng)論 0贊 19
一樁弒父案烦绳，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至配紫，卻和暖如春径密，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背躺孝。一陣腳步聲響...
開封第一講書人閱讀 31,539評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來泰國(guó)打工享扔，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人植袍。一個(gè)月前我還...
沈念sama閱讀 45,578評(píng)論 2贊 355
代替公主和親
正文我出身青樓惧眠，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親奋单。傳聞我的和親對(duì)象是個(gè)殘疾皇子锉试，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,877評(píng)論 2贊 345