計算基因序列中ATCG的含量以及堿基motif的繪制

1头谜、ATCG含量計算

讀取fasta序列文件

setwd("e://compute language/NGS/Modern Statistics for Modern Biology/data/")  
> library(Biostrings)
> staph = readDNAStringSet("staphsequence.ffn.txt", "fasta") ## 讀取fasta文件
fastat文件格式如下
>a
ATGTCGGAAAAAGAAATTTGGGAAAAAGTGCTTGAAATTGCTCAAGAAAAATTATCAGCTGTAAGTTACT
CAACTTTCCTAAAAGATACTGAGCTTTACACGATCAAAGATGGTGAAGCTATCGTATTATCGAGTATTCC
TTTTAATGCAAATTGGTTAAATCAACAATATGCTGAAATTATCCAAGCAATCTTATTTGATGTTGTAGGC
TATGAAGTAAAACCTCACTTTATTACTACTGAAGAATTAGCAAATTATAGTAATAATGAAACTGCTACTC
CAAAAGAAGCAACAAAACCTTCTACTGAAACAACTGAGGATAATCATGTGCTTGGTAGAGAGCAATTCAA

單個基因計算

> staph[1]
  A DNAStringSet instance of length 1
    width seq                                                                        names               
[1]  1362 ATGTCGGAAAAAGAAATTTGGGAAAAAGTGCTTGAA...TAGAGAATCTTGAAAAAGAAATAAGAAATGTATAA lcl|NC_002952.2_c...
> letterFrequency(staph[[1]], letters = "ACTG", OR = 0)
  A   C   T   G 
522 219 392 229

多個基因計算

> letterFrq = vapply(staph, letterFrequency, FUN.VALUE = numeric(4), letters = "ACGT", OR = 0)
> colnames(letterFrq) = paste0("gene", seq(along = staph))
> computerProportions = function(x){x/sum(x)}
> prop10 = apply(tab10, 2, computerProportions) ## 2表示列
> round(prop10, digits = 2)
  gene1 gene2 gene3 gene4 gene5 gene6 gene7 gene8 gene9 gene10
A  0.38  0.36  0.35  0.37  0.35  0.33  0.33  0.34  0.38   0.27
C  0.16  0.16  0.13  0.15  0.15  0.15  0.16  0.16  0.14   0.16
G  0.17  0.17  0.23  0.19  0.22  0.22  0.20  0.21  0.20   0.20
T  0.29  0.31  0.30  0.29  0.27  0.30  0.30  0.29  0.28   0.36
> p0 = rowMeans(prop10)
> p0
        A         C         G         T 
0.3470531 0.1518313 0.2011442 0.2999714 

2巧娱、motif繪制

> setwd("e://compute language/NGS/Modern Statistics for Modern Biology/data/")
> library("seqLogo")
載入需要的程輯包:grid
Warning message:
程輯包‘seqLogo’是用R版本3.5.1 來建造的 
> load("kozak.RData")
> kozak
  [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
A 0.33 0.25  0.4 0.15 0.20    1    0    0 0.05
C 0.12 0.25  0.1 0.40 0.40    0    0    0 0.05
G 0.33 0.25  0.4 0.20 0.25    0    0    1 0.90
T 0.22 0.25  0.1 0.25 0.15    0    1    0 0.00
> pwm = makePWM(kozak)
> seqLogo(pwm, ic.scale = FALSE)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市需忿,隨后出現(xiàn)的幾起案子古拴,更是在濱河造成了極大的恐慌,老刑警劉巖璧帝,帶你破解...
    沈念sama閱讀 212,542評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異富寿,居然都是意外死亡睬隶,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評論 3 385
  • 文/潘曉璐 我一進店門页徐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來苏潜,“玉大人,你說我怎么就攤上這事变勇⌒糇螅” “怎么了?”我有些...
    開封第一講書人閱讀 158,021評論 0 348
  • 文/不壞的土叔 我叫張陵搀绣,是天一觀的道長飞袋。 經(jīng)常有香客問我,道長链患,這世上最難降的妖魔是什么巧鸭? 我笑而不...
    開封第一講書人閱讀 56,682評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮麻捻,結(jié)果婚禮上纲仍,老公的妹妹穿的比我還像新娘呀袱。我一直安慰自己,他們只是感情好郑叠,可當(dāng)我...
    茶點故事閱讀 65,792評論 6 386
  • 文/花漫 我一把揭開白布夜赵。 她就那樣靜靜地躺著,像睡著了一般锻拘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上击蹲,一...
    開封第一講書人閱讀 49,985評論 1 291
  • 那天署拟,我揣著相機與錄音,去河邊找鬼歌豺。 笑死推穷,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的类咧。 我是一名探鬼主播馒铃,決...
    沈念sama閱讀 39,107評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼痕惋!你這毒婦竟也來了区宇?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,845評論 0 268
  • 序言:老撾萬榮一對情侶失蹤值戳,失蹤者是張志新(化名)和其女友劉穎议谷,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體堕虹,經(jīng)...
    沈念sama閱讀 44,299評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡卧晓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,612評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了赴捞。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片逼裆。...
    茶點故事閱讀 38,747評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖赦政,靈堂內(nèi)的尸體忽然破棺而出胜宇,到底是詐尸還是另有隱情,我是刑警寧澤恢着,帶...
    沈念sama閱讀 34,441評論 4 333
  • 正文 年R本政府宣布掸屡,位于F島的核電站,受9級特大地震影響然评,放射性物質(zhì)發(fā)生泄漏仅财。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,072評論 3 317
  • 文/蒙蒙 一碗淌、第九天 我趴在偏房一處隱蔽的房頂上張望盏求。 院中可真熱鬧抖锥,春花似錦、人聲如沸碎罚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽荆烈。三九已至拯勉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間憔购,已是汗流浹背宫峦。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評論 1 267
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留玫鸟,地道東北人导绷。 一個月前我還...
    沈念sama閱讀 46,545評論 2 362
  • 正文 我出身青樓,卻偏偏與公主長得像屎飘,于是被迫代替她去往敵國和親妥曲。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,658評論 2 350

推薦閱讀更多精彩內(nèi)容