拷貝數(shù)變化CNV分析神器:CNVpytor簡介

概要

  • 根據(jù)RD(Read Depth)來檢測CNV(copy number variations)和CNA(copy number alterations)
  • 是CNVnator的進(jìn)化版
  • 用SNPs信息里的BAF(B-allele frequency) likehood 作為驗證CNV和CNA的首要證據(jù)
  • Python內(nèi)核,所以該工具可以在Google Colab, Jupyter Notebook等平臺運行

介紹

CNV分析里比較常用到的一款工具是10年前開發(fā)的CNVnator久信。因為這款工具的高精度和高感度受到廣泛的歡迎和應(yīng)用碍沐。CNVpytor就是基于這款工具開發(fā)的熟妓,基于Python內(nèi)核,強化了CNVnator的可視化,模塊化谱煤,功能和計算能力彤悔。CNVpytor用到了RD和BAF信息嘉抓,可以更加準(zhǔn)確的計算CNV和CNA。

結(jié)果

RD信號分析

CNVpytor繼承了CNVnator的RD信號分析功能晕窑。這個步驟大概包含了一下幾步抑片。

  1. 讀取拼接數(shù)據(jù)(BAM,SAM,CRAM)的RD,合并RD (圖1.A)
  2. 根據(jù)GC含量進(jìn)行GC矯正(圖1.A & D)杨赤。該程序自帶人類基因組GRCh37, GRCh38的GC數(shù)據(jù)敞斋,如果需要分析的不是人類基因組的話需要另行計算。具體操作會另外寫一篇文章疾牲。
  3. 用mean-shift算法計算出CNV (圖1.A)
                                      圖.1 核心算法的步驟
  • A: 先以100bp為單位進(jìn)行數(shù)據(jù)處理和分析植捎,Binning步驟里的長度支持用戶指定。然后GC矯正阳柔,Mean-shift計算出CNVs

    B:根據(jù)SNPs, Indels計算出BAF來估計雜合度Heterozygous variants(HETs)焰枢。二倍體物種的話BAF的分布會已0.5位中心散開分布。

    C:根據(jù)計算出來的BAF我們可以看出符合高斯分布舌剂。

    D:一個GC矯正的例子济锄,GC含量越高,RD信號會越強霍转。

    E:這是一個分析的實例(NA12878)荐绝。上半部分是RD信號,下面是BAF比例分布谴忧。明顯看出中間的一段發(fā)生了倍數(shù)變化很泊。

再舉一個例子,如圖2所示沾谓,可以通過可視化CNVpytor結(jié)果來看出是Deletion委造,還是Duplation還是LOH

                                     圖.2 CNVpytor結(jié)果可視化

總結(jié)一下,整個分析流程可以參照圖.3均驶』枵祝可以理解成分成獨立的兩步,一步是圖3左邊,分析BAM數(shù)據(jù)里的RD,另外一步是圖3右邊, 分析VCF數(shù)據(jù)里的BAF妇穴。其實功能和另外一篇文章里R平臺的VcfR有點類似爬虱。但是功能更加強大隶债,是專業(yè)的CNVs分析工具。

                                      圖.3 分析流程圖

最后可以根據(jù)自己的格式需求導(dǎo)出數(shù)據(jù)跑筝,并同時得到可視化結(jié)果死讹。CNVpytor也可以被當(dāng)作Python的一個包在各種平臺上簡單安裝和操作。之后會專門花篇幅整理如何On Command或者On Python來操作這個工具曲梗。圖4是另外一個例子赞警,可以看出顏值很高。CNVpytor不僅支持分染色的分析虏两,也支持全局分析和可視化操作愧旦。

                                          圖.4 分析示例

流程和思路都理出來了,你以為可就以自己看著官方github一步一步操作了定罢?道理都懂笤虫,卻活不好這一生。首先安裝祖凫,環(huán)境構(gòu)建就成問題(大概率)琼蚯,這一點就繼承了CNVnator的缺點。然后非人類基因組得自己整合參考序列蝙场,自定義參考序列的話操作和官方說明會有不一樣凌停。不過,沒有關(guān)系售滤,Jason會在后續(xù)文章里給出完整的操作手冊罚拟。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市完箩,隨后出現(xiàn)的幾起案子赐俗,更是在濱河造成了極大的恐慌,老刑警劉巖弊知,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件阻逮,死亡現(xiàn)場離奇詭異,居然都是意外死亡秩彤,警方通過查閱死者的電腦和手機叔扼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來漫雷,“玉大人瓜富,你說我怎么就攤上這事〗淀铮” “怎么了与柑?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我价捧,道長丑念,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任结蟋,我火速辦了婚禮脯倚,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘椎眯。我一直安慰自己挠将,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布编整。 她就那樣靜靜地躺著,像睡著了一般乳丰。 火紅的嫁衣襯著肌膚如雪掌测。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天产园,我揣著相機與錄音汞斧,去河邊找鬼。 笑死什燕,一個胖子當(dāng)著我的面吹牛粘勒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播屎即,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼庙睡,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了技俐?” 一聲冷哼從身側(cè)響起乘陪,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎雕擂,沒想到半個月后啡邑,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡井赌,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年谤逼,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片仇穗。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡流部,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出仪缸,到底是詐尸還是另有隱情贵涵,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站宾茂,受9級特大地震影響瓷马,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜跨晴,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一欧聘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧端盆,春花似錦怀骤、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至焚鹊,卻和暖如春痕届,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背末患。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工研叫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人璧针。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓嚷炉,卻偏偏與公主長得像,于是被迫代替她去往敵國和親探橱。 傳聞我的和親對象是個殘疾皇子申屹,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容