溶瘤病毒基因組denovo組裝
? ? ? ?溶瘤病毒一直抗癌藥靶向和免疫療法外的另一個(gè)分支陨闹。一些病毒礼饱,如呼吸道病毒腸道病毒、新城疫病毒和流行性腮腺炎病毒猖毫,是天然的溶瘤病毒吮旅,而其它病毒征候,包括麻疹病毒寞酿、腺病毒和牛痘病毒匠襟,都可以通過(guò)調(diào)整或修飾钝侠,如基因編輯,使其在表達(dá)特定癌相關(guān)抗原(如EGFR或HER-2)的癌細(xì)胞中優(yōu)先進(jìn)行感染和復(fù)制酸舍,從而特異性的殺死癌細(xì)胞帅韧。?病毒在宿主細(xì)胞的傳代培養(yǎng)過(guò)程中基因組是否一直保持完整?修飾處理后后目的片段的插入/敲除位置是否準(zhǔn)確父腕?這些問(wèn)題都可以通過(guò)測(cè)序技術(shù)來(lái)回答弱匪。
? ? ? ? 目前業(yè)不少測(cè)序服務(wù)公司都可承接病毒denovo組裝業(yè)務(wù),但這些公司的流水線運(yùn)作模式要么要求送檢樣本經(jīng)過(guò)高度純化處理璧亮,要么出于其它考慮建議客戶(hù)直接做三代測(cè)序或者2+3混合組裝萧诫,但實(shí)際項(xiàng)目顯示----對(duì)傳統(tǒng)denovo組裝分析流程稍作修改后,送檢樣本不需要做復(fù)雜的純化處理枝嘶,廉價(jià)的二代測(cè)序往往也能組裝出高質(zhì)量的scaffold,同時(shí)結(jié)合經(jīng)典的一代Sanger測(cè)序?qū)Σ迦肫纹鹗季唧w位置進(jìn)行驗(yàn)證就能達(dá)到研究目的帘饶。雖然這部分業(yè)經(jīng)驗(yàn)務(wù)沒(méi)有腫瘤體細(xì)胞突變和RNA-seq(待更新后重新發(fā)布)多,但臨時(shí)決定還是把這部分內(nèi)容也總結(jié)分享一下:
一. 測(cè)序前--評(píng)估及預(yù)處理
1.1 病毒基因組GC比例要求
? ? ? 基于PCR擴(kuò)增原理的NGS技術(shù)不適用于物種基因組GC比例過(guò)高或者過(guò)低的情況群扶,?對(duì)于病毒denovo組裝及刻,待測(cè)病毒基因組GC含量在30%-70%之間,可采用NGS技術(shù)竞阐,否則需要考慮三代測(cè)序缴饭。
1.2 樣本預(yù)處理及測(cè)序深度等要求
? ? ? 顯而易見(jiàn),簡(jiǎn)單離心處理后的病毒樣本相較于未作任何處理的培養(yǎng)混合物有助于提高原始測(cè)序數(shù)據(jù)中來(lái)自病毒序列的比例(但噬菌體應(yīng)注意宿主中前噬菌體序列的影響)骆莹。鑒于Illumina X10平臺(tái)的測(cè)序數(shù)據(jù)市場(chǎng)價(jià)格已經(jīng)降到了60-70元/G左右颗搂,常見(jiàn)溶瘤病毒基因組只有幾十到幾百kb之間,直接測(cè)上10,000X幕垦,1G左右的原始下機(jī)數(shù)據(jù) ---保證混合物中病毒序列有足夠的覆蓋度丢氢;
二. 測(cè)序后--denovo組裝
2.1 分析流程(見(jiàn)圖1)
? ? ? ? 雖然這個(gè)流程圖有些丑陋,但也算簡(jiǎn)潔明了先改,各類(lèi)型的溶瘤病毒在NCBI上基本上都能找到參考基因組疚察,因此主要參考下圖中綠色線條所示流程即可;
2.2. 數(shù)據(jù)質(zhì)控/組裝結(jié)果評(píng)估
? ? ? ?下機(jī)數(shù)據(jù)是目的病毒仇奶、宿主甚至其它外源物種的混合物貌嫡,常規(guī)質(zhì)控指標(biāo)不再適用,其數(shù)據(jù)質(zhì)控可通過(guò)組裝效果來(lái)衡定--N50/N90;contig/scoffold數(shù)目及覆蓋度情況(數(shù)目越少衅枫、覆蓋度越高越好)嫁艇;與參考基因組GC比例的比較;map到參考基因組上的序列占比以及共線性分析等弦撩;
2.3. 目的插入/敲除序列分析
? ? ? ?通過(guò)本地BLAST等方法將目的片段與組裝得到的contig/scoffold進(jìn)行局部比對(duì)來(lái)對(duì)基因組上目的片段插入/敲除的具體位置進(jìn)行分析步咪,但對(duì)于插入序列,由于在排污步驟中可能將帶有外源插入片段的reads丟掉益楼,從經(jīng)濟(jì)的角度考慮可在排污處理后引入攜帶外源插入序列片段的reads后再進(jìn)行后續(xù)組裝猾漫,從精確的角度考慮則可以對(duì)插入?yún)^(qū)域額外做一代Sanger測(cè)序驗(yàn)證;
2.4. 組裝效果差的原因
? ? ? ?實(shí)際項(xiàng)目中上述方法對(duì)約1/10的病毒樣本沒(méi)有很好的組裝效果感凤,其原因可能是:1.?原始測(cè)序數(shù)據(jù)中目的病毒豐度較低悯周;2.?組裝方法有待改進(jìn);
? ?三.補(bǔ)充:
2020年初的新冠疫情陪竿,國(guó)家生物信息中心推出了面向新冠病毒的在線組裝及下游分析工具:上傳原始測(cè)序數(shù)據(jù)禽翼,直接輸出分析結(jié)果,其組裝方法同樣適用于其它病毒族跛。
修改與2021年1月5日