基因選擇壓力分析 | Ka/Ks, Dn/Ds 大規(guī)模計(jì)算念颈,更快更準(zhǔn)泉粉!

寫在前面

來來去去,這個主題相關(guān)的榴芳,我已經(jīng)寫過很多個推文嗡靡,甚至還包括與Raindy(福建農(nóng)林高芳鑾老師)合作開發(fā)和發(fā)表了 EasyCodeML。只能說窟感,確實(shí)是一個相對常見但似乎也繁雜的分析讨彼。

功能開發(fā)

  • EasyCodeML 主要用于在進(jìn)化的context上分析選擇壓力,尤其是做正選擇位點(diǎn)分析柿祈,亦即哈误,關(guān)注到位點(diǎn)。
  • 簡單的基因?qū)a/Ks計(jì)算躏嚎,如 TBtools 的 Simple Ka Ks Calculator 則關(guān)注大規(guī)模的基因受選擇的情況蜜自,亦即,關(guān)注到基因卢佣。

正選擇位點(diǎn)分析起來不容易重荠,而大規(guī)模的基因?qū)a/Ks計(jì)算起來其實(shí)也不容易。常見的場景是有數(shù)萬虚茶,甚至十來萬個基因?qū)Ω曷常枰?jì)算KaKs尾膊。而做計(jì)算的步驟:

  1. 以密碼子為單位進(jìn)行序列比對
  2. 基于比對結(jié)果進(jìn)行KaKs計(jì)算

所以是兩部。絕大多數(shù)人會使用一些軟件荞彼,如muscle冈敛,mafft等做基因雙序列比對,因?yàn)樗麄冋{(diào)用起來放棄鸣皂,盡管這其實(shí)不太合適抓谴。因?yàn)檫@些軟件本身設(shè)計(jì)目標(biāo)是多序列比對。用于CodeML的計(jì)算應(yīng)該使用他們寞缝,但是用于兩條序列的兩兩比對癌压,缺并不合適。所以最好的方式基本只有:

  1. 調(diào)用Emboss的Needle程序
  2. 使用已有第三方實(shí)現(xiàn)
  3. 自行做代碼實(shí)現(xiàn)

其中第一種方法最準(zhǔn)但是最慢荆陆,第二種方法在Java滩届,python,perl等上面沒有良好實(shí)現(xiàn)被啼,一般不夠準(zhǔn)確帜消,甚至不如調(diào)用muscle等,第三種方法可以權(quán)衡浓体,畢竟是自己做代碼實(shí)現(xiàn)泡挺。
而現(xiàn)在,TBtools用的即第三種方法命浴,準(zhǔn)確度上跟Emboss Needle完全一致娄猫,但由于是原生代碼實(shí)現(xiàn),所以速度很快生闲,同時也支持多線程媳溺。

運(yùn)行速度

針對調(diào)用muscle的實(shí)現(xiàn),前述已經(jīng)提過碍讯,大體是一秒鐘一對序列悬蔽,多線程無法提速,甚至?xí)邓伲☉岩墒沁M(jìn)程開銷太大)冲茸,而針對TBtools的原生代碼實(shí)現(xiàn)(也就是說屯阀,我自己coding的)缅帘,那么單線程一秒鐘可以做到200對轴术,如果開四個線程,那么一秒鐘可以做到 600對(多線程開銷其實(shí)并不星瘴蕖)逗栽。
實(shí)測數(shù)據(jù),10000個基因?qū)κг荩琺uscle調(diào)用需要四個多小時彼宠。使用TBtools鳄虱,單線程只需要不到一分鐘。如果開四個線程凭峡,28秒拙已。
換句話說,常規(guī)電腦上去摧冀,1w個基因?qū)Φ挠?jì)算倍踪,一般不需要1分鐘。

使用方法

打開 TBtools索昂,跳轉(zhuǎn)到對應(yīng)功能



使用方式和以前一樣建车,就是記得調(diào)整使用的線程數(shù)。椒惨。缤至。


寫在最后

天下武功,唯快不破康谆。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末领斥,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子沃暗,更是在濱河造成了極大的恐慌戒突,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件描睦,死亡現(xiàn)場離奇詭異膊存,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)忱叭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進(jìn)店門隔崎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人韵丑,你說我怎么就攤上這事爵卒。” “怎么了撵彻?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵钓株,是天一觀的道長。 經(jīng)常有香客問我陌僵,道長轴合,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任碗短,我火速辦了婚禮受葛,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己总滩,他們只是感情好纲堵,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著闰渔,像睡著了一般席函。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上冈涧,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天向挖,我揣著相機(jī)與錄音,去河邊找鬼炕舵。 笑死何之,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的咽筋。 我是一名探鬼主播溶推,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼奸攻!你這毒婦竟也來了蒜危?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤睹耐,失蹤者是張志新(化名)和其女友劉穎辐赞,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體硝训,經(jīng)...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡响委,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了窖梁。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赘风。...
    茶點(diǎn)故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖纵刘,靈堂內(nèi)的尸體忽然破棺而出邀窃,到底是詐尸還是另有隱情,我是刑警寧澤假哎,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布瞬捕,位于F島的核電站,受9級特大地震影響舵抹,放射性物質(zhì)發(fā)生泄漏肪虎。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一掏父、第九天 我趴在偏房一處隱蔽的房頂上張望笋轨。 院中可真熱鬧,春花似錦赊淑、人聲如沸爵政。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽钾挟。三九已至,卻和暖如春饱岸,著一層夾襖步出監(jiān)牢的瞬間掺出,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工苫费, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留汤锨,地道東北人。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓百框,卻偏偏與公主長得像闲礼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子铐维,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內(nèi)容