Genome varScant | 基因組結(jié)構(gòu)變異 | 基于TBtools

引言

今分享基因組結(jié)構(gòu)變異檢測的教程传透,大家常用的軟件基本是minimap2軟件耘沼,這個(gè)軟件也是出自李恒大佬之手,但是對(duì)于新手小白朱盐,或是沒有服務(wù)器的同學(xué)而言群嗤,直接在本地使用minimap2是不現(xiàn)實(shí)的。

然而托享,今天可以啦骚烧。

這個(gè)主要是歸功于CJ老師開發(fā)的TBtools軟件。非常厲害的一個(gè)生信化軟件闰围,TBtools問世以來真是造福了多少生信小白赃绊。用過以后,你會(huì)一直使用下去的羡榴。自己在19年開始了解TBtools碧查,一直到現(xiàn)在,中間換過多臺(tái)電腦校仑,但是首選安裝的軟件中一定會(huì)有它忠售。

我們前面做過基于TBtools做基因家族分析 | 生信部分,繪制Circos基因圈圖 | TBtools等幾個(gè)教程。

今天迄沫,我本想直接使用minimap2來跑一下稻扬,抱著TBtools可能會(huì)有的心情,就去搜索了一下教程羊瘩,結(jié)果真的有哦泰佳!

那么也就是記錄一下,這個(gè)分析過程尘吗,詳細(xì)的教程和參數(shù)CJ老師逝她,也在對(duì)應(yīng)教程推送過。我們也在推文中記錄一下睬捶,方便你我他!

參考:

  1. https://mp.weixin.qq.com/s/xEZFwx525RclUEwNPbdZoQ
  2. https://mp.weixin.qq.com/s/MHI0jAJdy-_cxpMih6dsQg

基因組結(jié)構(gòu)變異檢測

1. 打開TBtools黔宛,安裝Genome VarScan插件

2. 找到Sequence analysis文件夾

3. 找到P00560**

4. 點(diǎn)擊install

5. 打開插件

在這里,我們直接使用CJ老師教程內(nèi)容擒贸,介紹對(duì)應(yīng)參數(shù)臀晃。參考:TBtools | 基因組結(jié)構(gòu)變異檢測插件 Genome VarScan 參數(shù)說明

  1. 調(diào)用Minimap2進(jìn)行兩個(gè)基因組的比對(duì)觉渴,生成一個(gè)paf文件
  1. 基于paf文件,提取編譯积仗,其中包括SV和SNP疆拘,一般我們就關(guān)注SV

其中第一步?jīng)]有過多調(diào)整空間,第二步可以理解為 paftools.js 的 java 實(shí)現(xiàn)寂曹。所以整體參數(shù)和效果哎迄,跟 minimap2+paftools.js 鑒定結(jié)構(gòu)變異幾乎一樣。詳解如下:

  1. CPU:線程數(shù)隆圆,默認(rèn)是2 漱挚,進(jìn)行兩基因組全序列比對(duì)時(shí)可使用,注意到渺氧,越多線程會(huì)使用越多內(nèi)存旨涝,我測試大體水稻基因組的比對(duì),那么一個(gè)線程大概要4G 內(nèi)存侣背。其實(shí)具體跟后續(xù)BatchSize參數(shù)有關(guān)系白华;
  1. Diff:三個(gè)基因組序列分歧度標(biāo)準(zhǔn),如果似乎非常近源甚至是同個(gè)物種或品種贩耐,那么 OneInThousand弧腥,指代1000個(gè)堿基只有1個(gè)堿基不同;OneInHundred潮太,指代100個(gè)堿基會(huì)有1個(gè)堿基不同管搪。基本上铡买,這兩個(gè)可以處理絕大多數(shù)物種材料更鲁。當(dāng)然,對(duì)于比如一些園藝作物奇钞,多年生澡为,高雜合材料等等,不同材料的基因組差異可能會(huì)比較大景埃,比如 FiveInHundread媒至,指代100個(gè)堿基會(huì)有5個(gè)不同,這個(gè)已經(jīng)支持了跨物種的比對(duì)纠亚,比如甜橙比對(duì)到荔枝... 按照需要來調(diào)整,這個(gè)可以提高靈敏度和準(zhǔn)確性
  1. VarRange:共兩個(gè)參數(shù)筋夏,一般如果是做多態(tài)性引物開發(fā)蒂胞,30~200以及足夠,再長也不方便跑PCR電泳區(qū)分
  1. BatchSize:每次讀入內(nèi)存条篷,用于比對(duì)到數(shù)據(jù)塊大小骗随,會(huì)直接影響內(nèi)存占用蛤织,500Mb 每次默認(rèn)。如果發(fā)現(xiàn)基因組比較大鸿染,可以考慮降低指蚜,比如做到 200。
  1. Min Align Length for Cov Calc:如果一個(gè) Alignment 長度低于給定值涨椒,比如 10000 摊鸡,就不參與覆蓋度的計(jì)算。邏輯上對(duì)于兩個(gè)物種單倍型比對(duì)蚕冬,最好的比對(duì)結(jié)果 Cov 是 1 免猾。不然可能是假陽性比對(duì),對(duì)應(yīng)了假SV囤热。過濾長度猎提,避免比對(duì)碎片影響 Cov 計(jì)算。
  1. Min Align Length for Var Calling:如果一個(gè) Alignment 長度低于給定值旁蔼,比如 50000锨苏,就不進(jìn)行 SV 檢測。邏輯上棺聊,過短的比對(duì)伞租,也不適合做 SV 檢測。當(dāng)然躺屁,檢測了SV肯夏,那么也考慮Cov的問題。
  1. MaqQ:如果比對(duì)質(zhì)量低于給定值犀暑,那么不進(jìn)行變異檢測驯击。邏輯上,可以只用 MapQ 60 耐亏。畢竟這個(gè)對(duì)應(yīng)最高質(zhì)量徊都。需要注意的是,MapQ = 60 很容易達(dá)成广辰。從某個(gè)角度來說暇矫,比對(duì)質(zhì)量是基于 Query 來說的,查詢序列沒有更好或者相對(duì)較好的比對(duì)位置時(shí)择吊,那么就會(huì)有 MapQ60李根。所以對(duì)于Subject來說,同一個(gè)位置可以有多個(gè)MapQ 的比對(duì)几睛,但其中最好房轿,邏輯上只有一個(gè)。當(dāng)然那這個(gè)是展開。
  1. PrintSeq:結(jié)果文件中是否要包含SV相關(guān)序列囱持,注意到如果 INS 或 DEL 非常大夯接,那么這個(gè)序列會(huì)很長。

6. 比對(duì)
結(jié)合自己的需求將對(duì)應(yīng)的基因組fa文件拖進(jìn)去即可纷妆。比對(duì)還是很快的盔几,我這里使用15個(gè)CUP,基因組小一點(diǎn)掩幢,幾分鐘就可以完成逊拍。

7. 使用PAF Viz進(jìn)行可視化

直接在搜索框搜索PAF Viz即可。

將其輸出的PAF文件拖進(jìn)去即可進(jìn)行可視化粒蜈。

感嘆

時(shí)間飛逝顺献,我們可能一轉(zhuǎn)眼碩士,博士就畢業(yè)了枯怖,亦或是一轉(zhuǎn)眼畢業(yè)好多年注整。但是,回頭想一想度硝,我們在以往的時(shí)間中又留下了什么呢肿轨?難道真的如《再別康橋》中所說,輕輕的我走了蕊程,正如我輕輕的來椒袍,我輕輕的招手,作別西天的云彩藻茂。

自己做分享驹暑,亦或是自己的學(xué)習(xí)筆記,馬上3年辨赐。你問我优俘,這3年,你分享了什么呢掀序?若是帆焕,沒有推文,自己也很難回答不恭。但叶雹,回頭一看自己的文件夾,嗯换吧,還是有點(diǎn)痕跡的折晦。好比,TBtools沾瓦,就是一個(gè)生信軟件满着,但是你深挖一下打颤,給你的感覺就是:哇哦,很有干貨哦漓滔!不虧是CJ老師。(PS:這里并不是吹捧TBtools乖篷,只是自己使用后的感悟响驴。此外,這也不是我第一次推薦TBtools撕蔼。)

往期部分文章

1. 最全WGCNA教程(替換數(shù)據(jù)即可出全部結(jié)果與圖形)

推薦大家購買最新的教程豁鲤,若是已經(jīng)購買以前WGNCA教程的同學(xué),可以在對(duì)應(yīng)教程留言鲸沮,即可獲得最新的教程琳骡。(注:此教程也僅基于自己理解,不僅局限于此讼溺,難免有不恰當(dāng)?shù)胤介购牛埥Y(jié)合自己需求,進(jìn)行改動(dòng)怒坯。)


2. 精美圖形繪制教程

3. 轉(zhuǎn)錄組分析教程

4. 轉(zhuǎn)錄組下游分析

小杜的生信筆記 炫狱,主要發(fā)表或收錄生物信息學(xué)教程,以及基于R分析和可視化(包括數(shù)據(jù)分析剔猿,圖形繪制等)视译;分享感興趣的文獻(xiàn)和學(xué)習(xí)資料!!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市归敬,隨后出現(xiàn)的幾起案子酷含,更是在濱河造成了極大的恐慌,老刑警劉巖汪茧,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件椅亚,死亡現(xiàn)場離奇詭異,居然都是意外死亡陆爽,警方通過查閱死者的電腦和手機(jī)什往,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來慌闭,“玉大人别威,你說我怎么就攤上這事÷刻蓿” “怎么了省古?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長丧失。 經(jīng)常有香客問我豺妓,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任琳拭,我火速辦了婚禮训堆,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘白嘁。我一直安慰自己坑鱼,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布絮缅。 她就那樣靜靜地躺著鲁沥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪耕魄。 梳的紋絲不亂的頭發(fā)上画恰,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天,我揣著相機(jī)與錄音吸奴,去河邊找鬼允扇。 笑死,一個(gè)胖子當(dāng)著我的面吹牛则奥,可吹牛的內(nèi)容都是我干的蔼两。 我是一名探鬼主播,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼逞度,長吁一口氣:“原來是場噩夢啊……” “哼额划!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起档泽,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤俊戳,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后馆匿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體抑胎,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年渐北,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阿逃。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡赃蛛,死狀恐怖恃锉,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情呕臂,我是刑警寧澤破托,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站歧蒋,受9級(jí)特大地震影響土砂,放射性物質(zhì)發(fā)生泄漏州既。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一萝映、第九天 我趴在偏房一處隱蔽的房頂上張望吴叶。 院中可真熱鬧,春花似錦序臂、人聲如沸晤郑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至磕洪,卻和暖如春吭练,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背析显。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國打工鲫咽, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人谷异。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓分尸,卻偏偏與公主長得像,于是被迫代替她去往敵國和親歹嘹。 傳聞我的和親對(duì)象是個(gè)殘疾皇子箩绍,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345