day48 轉(zhuǎn)錄組 計(jì)數(shù)&表達(dá)矩陣

轉(zhuǎn)錄組分析要用比對(duì)后的bam或sam文件進(jìn)行后續(xù)計(jì)數(shù)。也就是對(duì)基因/轉(zhuǎn)錄本的區(qū)域上比對(duì)到的reads進(jìn)行計(jì)數(shù)。最后算出來某個(gè)轉(zhuǎn)錄本或者外顯子上比對(duì)上多少個(gè)reads订晌。顯然,如果某個(gè)樣本中比對(duì)到某個(gè)基因轉(zhuǎn)錄本上的reads多蚌吸,那這個(gè)基因的表達(dá)量理論上就高锈拨。在不同樣本之間只用計(jì)數(shù)來比對(duì)似乎比較簡單。但考慮到不同基因長度不一樣羹唠,還有管家基因等奕枢,在計(jì)算表達(dá)矩陣的時(shí)候要更復(fù)雜些。
用于計(jì)數(shù)的軟件有:htseq-count佩微,featurecounts(subread)等缝彬。

一、featurecounts
這個(gè)用于計(jì)數(shù)的軟件時(shí)集成在subread里面的哺眯」惹常可以用作RNAseq數(shù)據(jù)計(jì)數(shù),也可以用于ChIPseq的數(shù)據(jù)計(jì)數(shù)分析哦奶卓。運(yùn)行它需要兩種文件:
1一疯,BAM/SAM作為樣本輸入,里面有每個(gè)reads比對(duì)到染色體上的位置信息寝杖。
2违施,GFF/GTF/SAF文件作為注釋文件,里面有feature 的屬性瑟幕,染色體位置起始點(diǎn)這類信息磕蒲。
注意的是:第二類文件要和前面BAM/SAM獲得用的注釋fa文件的版本來源一致留潦。比如用了UCSC的hg38的fa文件去比對(duì),那現(xiàn)在就要用UCSC的gtr來注釋feature辣往。(查看day41復(fù)習(xí))
此外對(duì)feature還要理解一下兔院,feature就是基因組上的一段序列,在一條染色體上的某一片段站削,有明確起點(diǎn)和終點(diǎn)坊萝,有明確的特定功能——也就是它的大小性質(zhì)已被定義。那么mapping到某個(gè)feature上的reads多少许起,就能反應(yīng)樣本的某個(gè)特定功能的強(qiáng)或弱十偶。metafeature就是一些feature組成的集合。比如exon可以說是feature园细,一個(gè)基因所有exon組成了一個(gè)metafeature惦积。

1.單端數(shù)據(jù)

參數(shù)
-g 默認(rèn)為gene_id,就是需要提供一個(gè)id identifier 來將feature水平的統(tǒng)計(jì)匯總為meta-feature水平的統(tǒng)計(jì)猛频。此參數(shù)必須為gtf上有的列名 狮崩。
-t 默認(rèn)為exon,就是read只有落到這些feature上才會(huì)被統(tǒng)計(jì)到鹿寻。此參數(shù)必須為gtf上有的列名 睦柴。可以設(shè)定為-t gene毡熏,就不按照exon了吧坦敌。
-f 設(shè)定后統(tǒng)計(jì)feature層面的數(shù)據(jù),如exon-level招刹,否則會(huì)統(tǒng)計(jì)meta-feature層面的數(shù)據(jù)

conda activate py2.7 #激活2.7環(huán)境
project=~/rnaseq #項(xiàng)目文件夾
#step5:count
mkdir $project/count
output_dir=$project/count
GTF=/home/cloudam/reference/subread_index/hg38.knownGene.gtf
featureCounts -a $GTF -o $output_dir/counts.txt $project/align/*.bam

用UCSC里面的knownGene.gtf做出來的注釋恬试,基因名完全看不懂。運(yùn)行速度倒是很快疯暑,每個(gè)樣本都不到1min,最后生成的count.txt文件幾十M哑舒,而且是包含了四個(gè)樣本的呢妇拯。


image.png
conda activate py2.7 #激活2.7環(huán)境
project=~/rnaseq #項(xiàng)目文件夾
#step5:count
mkdir $project/count
output_dir=$project/count
GTF=/home/cloudam/reference/subread_index/hg38.ncbiRefSeq.gtf
featureCounts -a $GTF -o $output_dir/counts2.txt $project/align/*.bam

用ncbiRefSeq.gtf做注釋文件,就能得到熟悉的gene名啦洗鸵。


image.png

2.雙端數(shù)據(jù)

待續(xù)越锈。。膘滨。甘凭。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市火邓,隨后出現(xiàn)的幾起案子丹弱,更是在濱河造成了極大的恐慌德撬,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件躲胳,死亡現(xiàn)場離奇詭異蜓洪,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)坯苹,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門隆檀,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人粹湃,你說我怎么就攤上這事恐仑。” “怎么了为鳄?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵菊霜,是天一觀的道長。 經(jīng)常有香客問我济赎,道長鉴逞,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任司训,我火速辦了婚禮构捡,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘壳猜。我一直安慰自己勾徽,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布统扳。 她就那樣靜靜地躺著喘帚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪咒钟。 梳的紋絲不亂的頭發(fā)上吹由,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天,我揣著相機(jī)與錄音朱嘴,去河邊找鬼倾鲫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛萍嬉,可吹牛的內(nèi)容都是我干的乌昔。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼壤追,長吁一口氣:“原來是場噩夢啊……” “哼磕道!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起行冰,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤溺蕉,失蹤者是張志新(化名)和其女友劉穎伶丐,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體焙贷,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡撵割,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辙芍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啡彬。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖故硅,靈堂內(nèi)的尸體忽然破棺而出庶灿,到底是詐尸還是另有隱情,我是刑警寧澤吃衅,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布往踢,位于F島的核電站,受9級(jí)特大地震影響徘层,放射性物質(zhì)發(fā)生泄漏峻呕。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一趣效、第九天 我趴在偏房一處隱蔽的房頂上張望瘦癌。 院中可真熱鬧,春花似錦跷敬、人聲如沸讯私。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斤寇。三九已至,卻和暖如春拥褂,著一層夾襖步出監(jiān)牢的瞬間娘锁,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國打工肿仑, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留致盟,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓尤慰,卻偏偏與公主長得像,于是被迫代替她去往敵國和親雷蹂。 傳聞我的和親對(duì)象是個(gè)殘疾皇子伟端,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容