寫在前面
是的,最后焦影,我選擇了「一條路走到黑」~ 咱們先不管一些人如何看车遂,東西先整出來。大體如下斯辰。
沒錯舶担。從「原始測序數(shù)據(jù)」到「SNP Calling」,也就是 從 .fastq 到 .vcf彬呻,一套聚齊了衣陶。其中涉及到三個目前最常用的軟件:
- bwa-mem2 -> 讀段回帖
- samtools -> 重復標記排序
- bcftools -> 變異檢測過濾
有了這三個插件柄瑰,所有的「TBtools」用戶,可以在 Windows 或者 MacOS 下祖搓,點點點狱意,分析自己想分析的數(shù)據(jù)。當然拯欧,時間成本前面有提到详囤,最好是按照至少一天跑一個樣品來算。做做 BSAseq 或者少數(shù)兩三個樣品還是可以的镐作。大的群體藏姐,那么就可能需要足夠好配置的機器....這個暫時不是咱們要考慮的事情。
前兩個插件都介紹過了该贾。今天介紹「BCFtools GUI Wrapper」羔杨,整體如下。
一次包括兩個功能杨蛋,變異檢測和變異過濾兜材。
使用「TBtools」進行「SNP Calling」
從界面來看,比較簡單逞力。只需要將 MarkDup.PositionSorted.bam 都拖拽放置進去就可以了曙寡。
邏輯上需要等一些時間,可以得到初步的 bcf 文件寇荧。
使用「TBtools」進行「SNP Filtering」
「SNP Calling」之后举庶,幾乎所有情況下,都會做下一步過濾揩抡。具體過濾參數(shù)會對后續(xù)分析產(chǎn)生一定的影響户侥。此處,默認給了一個相對嚴格的過濾參數(shù)峦嗤,盡量保留「真陽性」SNP蕊唐。具體使用方法如下。
簡單來說...就是把文件放進去寻仗,然后設(shè)置一下輸出目錄刃泌,最后點擊「Start」即可。
寫在最后
基本完事署尤。三個「玩具」戳表,歡迎「試玩」肯污。我覺得,BSAseq真的可以試試了。因為有了 VCF 之后止潘,剩下的其實就是一個 R包 的事兒奔脐。這個就用 R-Plugin 了躯舔。而如果你的 PC 真的強,你甚至還可以用搞 GWAS滞谢,因為有了 VCF,剩下的不就是除抛? R 包嗎狮杨?