最近在搞一個(gè)PCR法病原微生物檢測(cè)產(chǎn)品的引物及探針設(shè)計(jì)項(xiàng)目杭跪,在進(jìn)行調(diào)研初步了解后,發(fā)現(xiàn)此項(xiàng)目重難點(diǎn)在于序列數(shù)據(jù)庫(kù)構(gòu)建及模板序列的挖掘。
? ? ? ? 序列數(shù)據(jù)庫(kù)構(gòu)建主要是因?yàn)閿?shù)據(jù)量太大,不好下載沈贝;而且一個(gè)菌種一般對(duì)應(yīng)多條參考序列,需要整理并選出代表性序列勋乾。數(shù)據(jù)下載上宋下,沒有好辦法,只能一點(diǎn)點(diǎn)下載辑莫。數(shù)據(jù)整理杨凑,去冗余可以考慮只保留完整參考序列,其他的contig都去掉摆昧。選代表性序列,可以考慮排列組合計(jì)算兩兩間的相似度蜒程,最終選取與其他序列的平均相似度最高的那個(gè)作為代表性序列(多序列比對(duì)绅你,考慮mummer軟件)伺帘。
? ? ? ? 模板序列要求要在菌種/屬內(nèi)保守,在菌種/屬間及宿主上特異忌锯。物種內(nèi)保守的區(qū)域獲任奔蕖:(1)文獻(xiàn)查找;(2)MEME預(yù)測(cè)motif偶垮;(3)滑動(dòng)窗口法分割代表性序列张咳,然后與物種內(nèi)進(jìn)行比對(duì),計(jì)算保守性似舵。三者任選其一脚猾,可以保證模板序列的保守性。除此之外砚哗,還需要考慮特異性:(1)設(shè)計(jì)出引物對(duì)后龙助,將其他物種序列作為參考基因組,利用MFEprimer評(píng)價(jià)是否能擴(kuò)出產(chǎn)物蛛芥;(2)將選出的模板序列與其他物種序列進(jìn)行比對(duì)提鸟,計(jì)算特異性,選取特異性好的模板序列仅淑。
????????預(yù)測(cè)比較耗時(shí)的是所有物種的代表性序列選取及其匯聚成的總序列文件的比對(duì)索引構(gòu)建称勋。
? ? ? ? 最后,模板序列對(duì)應(yīng)的引物及探針設(shè)計(jì)涯竟,利用primer3或者其他引物設(shè)計(jì)軟件設(shè)計(jì)即可赡鲜。多重引物及探針設(shè)計(jì)需要保證引物之間沒有二聚體,所有探針及其產(chǎn)物間的分子量差值越大越好昆禽。