今天和大家聊一聊共線性分析。
共線性
共線性研究的是同源基因或者序列的排布關(guān)系涕俗,比較常見的是組裝基因組文章中劝枣,通過同源性比較來評估基因組的組裝效果以及同源基因的保留和丟失的情況飞傀,用來研究材料的進化關(guān)系挤悉。
[圖1:https://doi.org/10.1007/978-1-4939-9074-0_4]
應(yīng)用上主要有兩個點,第一個是物種間基因組共線性分析煌抒,確認種間基因組同源性的程度;第二點是物種內(nèi)不同染色體的同源性分析厕倍,用來分析重復(fù)區(qū)或者多拷貝基因的分布情況寡壮,比如下面這個小麥ABD三套基因組的同源性分析。
[圖2:DOI: 10.1126/science.aba5435]
分析原理
整個共線性分析的原理其實就是確認同源基因的位置和方向讹弯。這一點可以通過很多軟件來分析况既,大家熟知的比對軟件blast可以,但是全基因組范圍內(nèi)所有基因的比對耗時會很長组民,而且資源占用比較多棒仍。MUMmer用的比較多,找的是唯一匹配結(jié)果臭胜,但是靈敏度比較低莫其。last軟件也可以分析全基因的共線性分析,優(yōu)勢是運行速度快耸三,資源消耗比較少乱陡,但是貌似不支持有g(shù)ap的比對(未確認,有興趣的話可以查證)仪壮。
上述圖1來源的文件介紹了全基因組比對的原理以及數(shù)十種比對軟件憨颠,有興趣可以看看或者測試一下。
分析軟件
有很多軟件都可以做整套的共線性分析
- MCScanX
軟件地址https://github.com/wyp1125/MCScanx积锅。支持共線性分析爽彤,事先需要使用blast進行比對,將比對結(jié)果作為輸入文件參與計算缚陷,輸出共線性結(jié)果适篙。不過最終的結(jié)果存在很大的優(yōu)化空間。
- MCScanX-python
軟件地址https://github.com/tanghaibao/jcvi/wiki/MCscan-(Python-version)箫爷。該軟件依賴的是last比對軟件匙瘪,分析速度很快,輸出圖形也很漂亮
很多文獻繪制共線性分布圖是這種格式的比較常見蝶缀,可能是比較直觀丹喻。該軟件貌似不支持圈圖的輸出。
- circos
軟件地址http://circos.ca/翁都,這是一款用的很多的軟件了碍论,便于展示各條目之間的相關(guān)關(guān)系,做出來的圖也很高大上
[參考:http://circos.ca/images/scientific_literature/]
做這個分析的軟件不在少數(shù)柄慰,可以挑自己喜歡的或者參考文獻里的軟件試著做一下鳍悠。