miRNA array筆記1

1. 對(duì)gtf文件進(jìn)行處理:

cat GSE52313_transcripts.gtf | grep "gene_name" |sed 's/\(.*\)gene_id\(.*\); transcript_id\(.*\); gene_name\(.*\); oId\(.*\)/\2\4/g' |sed 's/"http://g' | awk '{print $1"="$2}' | sort -n | uniq -c > GSE52313_transcripts_sort.gtf

awk -F" *" '{print $3}' GSE52313_transcripts_sort.gtf | awk -F"=" '{print $1,$2}' > GSE52313_transcripts_renew.gtf

2. 提取lncRNA:

awk 'NR==FNR{a[$1]=$2}NR!=FNR{if ($1 in a){print a[$1],$2,$3,$4,$5,$6,$7,$8,$9}}' GSE52313_transcripts_renew.gtf GSE52313_lnRNA

3. 對(duì)lncRNA表達(dá)量文件進(jìn)行基因名替換

awk 'NR==FNR{a[$1]=$2}NR!=FNR{if ($1 in a){print a[$1],$2,$3,$4,$5,$6,$7,$8,$9}}' GSE52313_transcripts_renew.gtf GSE52313_lnRNA_gene_counts > GSE52313_lnRNA_gene_counts_renew

4.根據(jù)table S1的信息:sharm:?8R 3RL 12RL 7LR

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? MI:5O 7R 11L 2L

5. 對(duì)lncRNA進(jìn)行差異表達(dá)分析:

首先需要讀入一個(gè)數(shù)據(jù)框搂漠,列代表每個(gè)sample承绸,行代表每個(gè)gene

database_all <- read.table(file = "GSE52313_lnRNA_gene_counts_renew", sep = "\t", header = T, row.names=1)

這里主要對(duì)于兩兩比較的數(shù)據(jù)钠怯,因此我取了數(shù)據(jù)的前6列,分別是兩組樣品冕末,每組3個(gè)生物學(xué)重復(fù)

設(shè)定分組信息,也就是樣本分組的名稱(chēng)

type <- factor(c(rep("LC_1",4), rep("LC_2",4)))

我這里是樣品1是LC_1,樣品2是LC_2

由于DESeq包要求接下來(lái)的count data必須要整數(shù)型饮醇,因此我們需要對(duì)數(shù)據(jù)進(jìn)行取整,然后將數(shù)據(jù)database和分組信息type讀入到cds對(duì)象中

database <- round(as.matrix(database_all))

source("https://bioconductor.org/biocLite.R")

biocLite('BiocInstaller')

biocLite("DESeq2")

coldata <- data.frame(row.names = colnames(database), type)

dds <- DESeqDataSetFromMatrix(countData=database, colData=coldata, design=~type)

DESeq2的使用方法:

輸入矩陣數(shù)據(jù),行名為sample浪漠,列名為gene陕习;DESeq2不支持無(wú)生物學(xué)重復(fù)的數(shù)據(jù),因此我選擇了2個(gè)樣本郑藏,3個(gè)生物學(xué)重復(fù)的數(shù)據(jù)衡查;并對(duì)count data取整(經(jīng)大神指點(diǎn),這里需要說(shuō)明下必盖,我的測(cè)試數(shù)據(jù)readcount是RSEM定量的結(jié)果拌牲,并不是常見(jiàn)的htseq-count的結(jié)果,所以count值會(huì)有小數(shù)點(diǎn)歌粥,而DESeq2包不支持count數(shù)有小數(shù)點(diǎn)塌忽,所以這里需要round取整)。

設(shè)置分組信息以及構(gòu)建dds對(duì)象

dds <- DESeqDataSetFromMatrix(countData=database, colData=coldata, design=~condition)

使用DESeq函數(shù)進(jìn)行估計(jì)離散度失驶,然后進(jìn)行標(biāo)準(zhǔn)的差異表達(dá)分析土居,得到res對(duì)象結(jié)果

前過(guò)濾:

keep<-rowSums(counts(dds)) >= 10

dds<-dds[keep,]

:并不是必須,不影響計(jì)算結(jié)果嬉探,這樣做的優(yōu)點(diǎn)是dds對(duì)象占用的內(nèi)存小點(diǎn)擦耀,后續(xù)的計(jì)算耗時(shí)小點(diǎn)。

dds <- DESeq(dds)

res <- results(dds)

最后設(shè)定閾值涩堤,篩選差異基因眷蜓,導(dǎo)出數(shù)據(jù)

table(res$padj <0.05)

res <- res[order(res$padj),]

resdata <- merge(as.data.frame(res), as.data.frame(counts(dds, normalized=TRUE)),by="row.names",sort=FALSE)

write.csv(resdata,file = "LC_1_vs_LC_2.csv")

#從LC_1_vs_LC_2.csv中篩選lncRNA和mRNA,

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末胎围,一起剝皮案震驚了整個(gè)濱河市吁系,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌白魂,老刑警劉巖汽纤,帶你破解...
    沈念sama閱讀 222,946評(píng)論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異福荸,居然都是意外死亡蕴坪,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,336評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)逞姿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)辞嗡,“玉大人,你說(shuō)我怎么就攤上這事滞造⌒遥” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,716評(píng)論 0 364
  • 文/不壞的土叔 我叫張陵谒养,是天一觀的道長(zhǎng)挺狰。 經(jīng)常有香客問(wèn)我明郭,道長(zhǎng),這世上最難降的妖魔是什么丰泊? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,222評(píng)論 1 300
  • 正文 為了忘掉前任薯定,我火速辦了婚禮,結(jié)果婚禮上瞳购,老公的妹妹穿的比我還像新娘话侄。我一直安慰自己,他們只是感情好学赛,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,223評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布年堆。 她就那樣靜靜地躺著,像睡著了一般盏浇。 火紅的嫁衣襯著肌膚如雪变丧。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 52,807評(píng)論 1 314
  • 那天绢掰,我揣著相機(jī)與錄音痒蓬,去河邊找鬼。 笑死滴劲,一個(gè)胖子當(dāng)著我的面吹牛攻晒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播班挖,決...
    沈念sama閱讀 41,235評(píng)論 3 424
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼炎辨,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了聪姿?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 40,189評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤乙嘀,失蹤者是張志新(化名)和其女友劉穎末购,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體虎谢,經(jīng)...
    沈念sama閱讀 46,712評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡盟榴,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,775評(píng)論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了婴噩。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片擎场。...
    茶點(diǎn)故事閱讀 40,926評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖几莽,靈堂內(nèi)的尸體忽然破棺而出迅办,到底是詐尸還是另有隱情,我是刑警寧澤章蚣,帶...
    沈念sama閱讀 36,580評(píng)論 5 351
  • 正文 年R本政府宣布站欺,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏矾策。R本人自食惡果不足惜磷账,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,259評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望贾虽。 院中可真熱鬧逃糟,春花似錦、人聲如沸蓬豁。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,750評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)庆尘。三九已至剃诅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間驶忌,已是汗流浹背矛辕。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,867評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留付魔,地道東北人聊品。 一個(gè)月前我還...
    沈念sama閱讀 49,368評(píng)論 3 379
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像几苍,于是被迫代替她去往敵國(guó)和親翻屈。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,930評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容