密碼子使用偏性的分析方法介紹


DNA通過轉(zhuǎn)錄,控制著mRNA的合成洁墙,而mRNA是蛋白質(zhì)合成的模板蛹疯,它決定了蛋白質(zhì)的序列結(jié)構(gòu)、功能等信息热监。把mRNA看作一種語言捺弦,它由4種不同堿基的核苷酸組成(A、U孝扛、C列吼、G),蛋白質(zhì)序列則是完全不同的另外一種語言苦始,它由20種基本氨基酸組成寞钥。在生命體內(nèi)就有一種機制,它通過識別這4種堿基的不同排列組合來翻譯成對應(yīng)的氨基酸陌选,因此在mRNA中的堿基順序稱為遺傳密碼(Genetic Code)理郑,mRNA中每三個核苷酸組成的三聯(lián)體稱為一個密碼子(Codon),遺傳密碼子表見下圖咨油。



64組密碼子(4*4*4)中您炉,有三組不編碼(UAG、UAA和UGA)役电,它們是終止密碼子赚爵,還有一組AUG既是甲硫氨酸(Met)的密碼子,又是多肽合成的起始密碼子。另外冀膝,在很多原核生物中GUG和UUG也為起始密碼子膏蚓。
由于密碼子具有簡并性的特征,即一種氨基酸對應(yīng)不同的密碼子畸写,因此不同氨基酸對應(yīng)的不同密碼子的使用頻率是不一定相同的,我們把氨基酸對應(yīng)的各自密碼子使用頻次的不同叫做密碼子使用偏性氓扛。不同種屬生物的氨基酸偏愛的密碼子是不一樣的枯芬,甚至同一物種內(nèi),不同功能和不同保守程度的基因采郎,它們的密碼子使用偏性也是不一樣的千所。



例如,上圖的工作中(López, J. L蒜埋,2019)淫痰,作者使用了Rhizobiales目中不同物種的細(xì)菌基因組,找出不同保守程度的core gene(不同顏色的原點表示)整份,分析不同物種以及不同基因的密碼子偏性待错。圖中展示的是對這些不同gene set的密碼子偏性的主成分分析結(jié)果,可以看出烈评,確實存在的很大的差異火俄,這些這些往往和物種的進(jìn)化相關(guān)。

同樣以這份工作為例讲冠,細(xì)菌相對于真核生物來說瓜客,可以較高頻率的與外界發(fā)生遺傳信息交流,比如通過水平基因轉(zhuǎn)移(HGT)從環(huán)境中直接獲取到其他物種的基因竿开,在細(xì)菌內(nèi)部也十分容易發(fā)生基因組的大片段重組谱仪,這樣就可以把外界吸收來的有利基因慢慢的整合到核心基因組中去。因此通過對基因中密碼子的使用偏好進(jìn)行分析能幫助判斷這些基因的來源和進(jìn)化歷程否彩。另外密碼子使用頻率也和基因的表達(dá)量相關(guān)疯攒,如果基因使用了和tRNA更相似的密碼子,它就可以減少與對應(yīng)的tRNA分子匹配的時間列荔,使具有較高表達(dá)量卸例,那么這個基因可能對維持物種的生命活動是十分重要的。

衡量指標(biāo)介紹

目前肌毅,已經(jīng)提出了很多數(shù)學(xué)量來對密碼子的使用偏性進(jìn)行量化筷转,有些是對整個基因組內(nèi)單個密碼子的分析,有些則是從一個基因的角度來衡量其密碼子偏好性悬而。下面對常用的幾個指標(biāo)做簡要的介紹:

1. 密碼子使用頻次(Observed number of occurrences of codon 'i', Obsi)

對于某一特定的密碼子i呜舒,其在基因中實際出現(xiàn)的次數(shù)稱為密碼子使用頻次。

2. 相對同義密碼子使用度(Relative synonymous codon usage, RSCU)

RSCU定義是以某一個同義密碼子的使用次數(shù)為分子笨奠,以該密碼子預(yù)期出現(xiàn)的次數(shù)為分母袭蝗。其中唤殴,預(yù)測出現(xiàn)的次數(shù)為該密碼子所編碼的氨基酸的所有密碼子平均使用的次數(shù),公式如下:



如果密碼子使用沒有偏好到腥,則該密碼子的RSCU值等于1朵逝。當(dāng)某一密碼子的RSCU值大于1,則表明其的使用頻率相對較高乡范。由于它計算方便配名,而且很直觀的反映出密碼子使用的偏好性,因此在大多數(shù)的密碼子相關(guān)分析中晋辆,都使用了它作為衡量偏好性的標(biāo)準(zhǔn)渠脉。

3. 有效密碼子數(shù)(Effective Number of Codon, ENC)

指基因中使用的有效密碼子的數(shù)量,公式如下



公式中瓶佳,n表示基因中所使用的密碼子總數(shù)芋膘,k表示同一密碼子數(shù)量,p表示密碼子使用頻率霸饲。ENC值的范圍為20到61为朋,20表示每個氨基酸只使用了一個密碼子,61表示每個密碼子都被平均使用厚脉。其值越低潜腻,說明密碼子使用偏好性越強,反之亦然器仗。
ENC能反映密碼子家族中同義密碼子非均衡使用的偏好程度融涣,是評價基因整體密碼子偏好性中最具有參考價值的參數(shù)。通常高表達(dá)基因的密碼子偏好程度大精钮,從而其ENC值較型埂爽待;低表達(dá)基因則含有較多種類的稀有密碼子鳍刷,其ENC值較小。所以确镊,可以通過比較ENC值來確定內(nèi)源基因表達(dá)量的相對高低臂容。

4. 密碼子適應(yīng)指數(shù)(Codon adaptation index科雳,CAI)

對于某一個基因,CAI是指編碼該蛋白的所有密碼子相對于這條基因都使用最優(yōu)密碼子的情況下的適應(yīng)系數(shù)脓杉。計算該值需要先提供在對應(yīng)物種中高表達(dá)基因的最優(yōu)密碼子表作為參考糟秘,公式如下:


L表示基因中所使用的密碼子數(shù),CAI值介于0~1之間球散,該值越大表示適應(yīng)性越強尿赚,CAI值廣泛應(yīng)用于基因表達(dá)水平的評估中。

5. 最優(yōu)密碼子使用頻率(Frequency of optimal codons, FOP)

最優(yōu)密碼子是指在某物種高表達(dá)基因中使用頻率最高的密碼子,也有人將一個氨基酸的最優(yōu)密碼子定義為具有最大數(shù)量的帶有其反密碼子 tRNA 基因的密碼子凌净。該指標(biāo)是指最優(yōu)密碼子和其同義密碼子的比值悲龟,和CAI的計算一樣,需要已知高表達(dá)基因的最優(yōu)密碼子冰寻。FOP的取值范圍為0到1之間须教,1表示只有最優(yōu)密碼子被使用,0則表示沒有最優(yōu)密碼子被使用到斩芭。

6. 密碼子偏好性指數(shù)(Codon bias index, CBI)

它反應(yīng)了一個基因中高表達(dá)優(yōu)越密碼子的組分情況轻腺。對目的宿主自身的基因 , 該指數(shù)和 ENC 值有很好的相關(guān)性,但在實際工作中可以更明確地反映外源基因在目的宿主中可能的表達(dá)情況, 故而得到廣泛應(yīng)用秒旋。

7. GC含量及GC3

GC3指的是基因中所有密碼子的第3位的GC含量,即除了蛋氨酸诀拭、色氨酸和終止密碼子外迁筛,G和C出現(xiàn)在密碼子第三個位置的頻率。由于密碼子的使用偏性與密碼子第三位的GC含量有很大關(guān)系耕挨,基因的 G+C 含量以及GC3值也受到了很大關(guān)注细卧。

分析工具

針對密碼子使用分析的軟件也有很多,包括CodonW筒占,EMBOSS贪庙,GCUA等。其中翰苫,EMBOSS是一個強大的綜合工具止邮,它整合了100多個序列分析的程序,可以完成DNA和蛋白序列的各種分析奏窑,包括DNA翻譯导披,全局或者局部序列比對等功能。這里簡單介紹下怎么通過EMBOSS來計算密碼子偏性埃唯。
可以網(wǎng)頁中使用EMBOSS的功能撩匕,在線使用的地址如下:
http://www.bioinformatics.nl/emboss-explorer/
也可以下載到本地(Linux or MAC),方便批量對序列分析墨叛,下載地址如下:
http://emboss.sourceforge.net/download/

在線使用教程:


在網(wǎng)頁的左側(cè)找到“NUCLEIC CODON USAGE”止毕,可以看到有5個小工具,這里介紹其中3個:

1.cai:計算CAI值


填入或者上傳序列漠趁,再選擇高表達(dá)基因的最優(yōu)密碼子表(或者使用默認(rèn))扁凛,點擊Run cai,就可以得到結(jié)果了

2. chips:計算ENC值


提交序列闯传,選擇是否把所有序列當(dāng)成一條序列來計算ENC令漂,點擊Run chips

3. cusp:計算codon usage table(密碼子使用頻率表)


在這里輸入高表達(dá)基因的CDS序列,就可以得到高表達(dá)基因的密碼子使用頻率表。輸入基因組的所有CDS序列叠必,則可以得到這個基因組的密碼子使用頻率表荚孵。頻率表里面會包含密碼子第 1、2纬朝、3 位堿基的 GC 含量(分別為 GC1收叶、GC2、GC3)及 3 位堿基的 GC 平均含量(GCall)

Note:相對同義密碼子使用度共苛,即RSCU值判没,可以使用Codon W軟件計算得到。

歡迎關(guān)注公眾號:"生物信息學(xué)"

Ref:
Wu, X.M., Wu, S.F., Ren, D.M., Zhu, Y.P., and He, F.C. (2007). The analysis method and progress in the study of codon bias. Yi Chuan 29, 420–426.
López, J.L., Lozano, M.J., Lagares, A., Fabre, M.L., Draghi, W.O., Del Papa, M.F., Pistorio, M., Becker, A., Wibberg, D., Schlüter, A., et al. (2019). Codon Usage Heterogeneity in the Multipartite Prokaryote Genome: Selection-Based Coding Bias Associated with Gene Location, Expression Level, and Ancestry. MBio 10, 1–20.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末隅茎,一起剝皮案震驚了整個濱河市澄峰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌辟犀,老刑警劉巖俏竞,帶你破解...
    沈念sama閱讀 206,723評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異堂竟,居然都是意外死亡魂毁,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,485評論 2 382
  • 文/潘曉璐 我一進(jìn)店門出嘹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來席楚,“玉大人,你說我怎么就攤上這事税稼》持龋” “怎么了?”我有些...
    開封第一講書人閱讀 152,998評論 0 344
  • 文/不壞的土叔 我叫張陵郎仆,是天一觀的道長闻镶。 經(jīng)常有香客問我,道長丸升,這世上最難降的妖魔是什么铆农? 我笑而不...
    開封第一講書人閱讀 55,323評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮狡耻,結(jié)果婚禮上墩剖,老公的妹妹穿的比我還像新娘。我一直安慰自己夷狰,他們只是感情好岭皂,可當(dāng)我...
    茶點故事閱讀 64,355評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著沼头,像睡著了一般爷绘。 火紅的嫁衣襯著肌膚如雪书劝。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,079評論 1 285
  • 那天土至,我揣著相機與錄音购对,去河邊找鬼。 笑死陶因,一個胖子當(dāng)著我的面吹牛骡苞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播楷扬,決...
    沈念sama閱讀 38,389評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼解幽,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了烘苹?” 一聲冷哼從身側(cè)響起躲株,我...
    開封第一講書人閱讀 37,019評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎镣衡,沒想到半個月后霜定,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,519評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡捆探,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,971評論 2 325
  • 正文 我和宋清朗相戀三年然爆,在試婚紗的時候發(fā)現(xiàn)自己被綠了站粟。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片黍图。...
    茶點故事閱讀 38,100評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖奴烙,靈堂內(nèi)的尸體忽然破棺而出助被,到底是詐尸還是另有隱情,我是刑警寧澤切诀,帶...
    沈念sama閱讀 33,738評論 4 324
  • 正文 年R本政府宣布揩环,位于F島的核電站,受9級特大地震影響幅虑,放射性物質(zhì)發(fā)生泄漏丰滑。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,293評論 3 307
  • 文/蒙蒙 一倒庵、第九天 我趴在偏房一處隱蔽的房頂上張望褒墨。 院中可真熱鬧,春花似錦擎宝、人聲如沸郁妈。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,289評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽噩咪。三九已至顾彰,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間胃碾,已是汗流浹背涨享。 一陣腳步聲響...
    開封第一講書人閱讀 31,517評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留书在,地道東北人灰伟。 一個月前我還...
    沈念sama閱讀 45,547評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像儒旬,于是被迫代替她去往敵國和親栏账。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,834評論 2 345