基因長度計算——非冗余外顯子長度之和

定義基因的長度(生信菜鳥團

一個基因可以轉錄為多個轉錄本脖祈,真核生物里面每個轉錄本通常是由一個或者多個exon組成固阁,能翻譯為蛋白的exon區(qū)域是CDS區(qū)域,不能翻譯的那些exon的開頭和結尾是UTR區(qū)域,翻譯區(qū)域合起來是ORF序列娱仔,轉錄本逆轉錄就是cDNA序列须肆。基因長度并不是簡單的 end - start

目前主流定義基因長度的幾種方式:

  • 挑選基因的最長轉錄本
  • 選取多個轉錄本長度的平均值
  • 非冗余外顯子長度之和
  • 非冗余 CDS(Coding DNA Sequence) 長度之和
  • 非冗余外顯子

基因長度計算——非冗余外顯子長度之和

注意到這里的"非冗余"合敦,就是存在一個基因的多個外顯子之間存在重疊(比如基因A的1號外顯子較短初橘,2號外顯子長,1號包含在2號中)充岛,單純的相加會重復計算保檐。

R:
安裝R包"GenomicFeatures"
if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
BiocManager::install("GenomicFeatures")
加載R包
library("GenomicFeatures")
setwd(" ")

導入gff3文件
txdb <- makeTxDbFromGFF("1.gff3",format="gff3")
獲取外顯子位置
exons_gene <- exonsBy(txdb, by = "gene")
去除外顯子重疊部分,計算外顯子長度
exons_gene_len <- lapply(exons_gene,function(x){sum(width(reduce(x)))})

write.table(exons_gene_len,file ="gene_exons_len.txt",sep ="\t",quote =F,col.names =T,row.names =F)

linux:
行列轉換
cat gene_exons_len.txt | awk '{ for(i=1;i<=NF;i++){ if(NR==1){ arr[i]=$i; }else{ arr[i]=arr[i]"\t"$i; } } }  \
END{ for(i=1;i<=NF;i++){ print arr[i]; } }'  > geneexons_len.txt
rm exons_gene_len.txt
其他計算基因長度的方法可見:http://www.reibang.com/p/abea4033b61e 小潔忘了怎么分身

參考:
http://www.bio-info-trainee.com/3991.html 生信菜鳥團
https://cloud.tencent.com/developer/article/1606491
http://www.reibang.com/p/abea4033b61e 小潔忘了怎么分身

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末崔梗,一起剝皮案震驚了整個濱河市展东,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌炒俱,老刑警劉巖盐肃,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件爪膊,死亡現(xiàn)場離奇詭異,居然都是意外死亡砸王,警方通過查閱死者的電腦和手機推盛,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來谦铃,“玉大人耘成,你說我怎么就攤上這事【匀颍” “怎么了瘪菌?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長嘹朗。 經常有香客問我师妙,道長,這世上最難降的妖魔是什么屹培? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任默穴,我火速辦了婚禮,結果婚禮上褪秀,老公的妹妹穿的比我還像新娘蓄诽。我一直安慰自己,他們只是感情好媒吗,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布仑氛。 她就那樣靜靜地躺著,像睡著了一般闸英。 火紅的嫁衣襯著肌膚如雪调衰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天自阱,我揣著相機與錄音嚎莉,去河邊找鬼。 笑死沛豌,一個胖子當著我的面吹牛趋箩,可吹牛的內容都是我干的。 我是一名探鬼主播加派,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼叫确,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了芍锦?” 一聲冷哼從身側響起竹勉,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎娄琉,沒想到半個月后次乓,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吓歇,經...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年票腰,在試婚紗的時候發(fā)現(xiàn)自己被綠了城看。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡杏慰,死狀恐怖测柠,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情缘滥,我是刑警寧澤轰胁,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站朝扼,受9級特大地震影響赃阀,放射性物質發(fā)生泄漏。R本人自食惡果不足惜吟税,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一凹耙、第九天 我趴在偏房一處隱蔽的房頂上張望姿现。 院中可真熱鬧肠仪,春花似錦、人聲如沸备典。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽提佣。三九已至吮蛹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間拌屏,已是汗流浹背潮针。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留倚喂,地道東北人每篷。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像端圈,于是被迫代替她去往敵國和親焦读。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內容