疫情的爆發(fā)使得病毒基因組的研究呈現(xiàn)井噴式增長,其中有一部分研究是與進化相關的铃岔,病毒從何而來汪疮,病毒是否發(fā)生了進化等等一系列問題都被大家關注著。這里小Q介紹其中的一種分析--Network網(wǎng)絡圖分析毁习。
分析用途
目前小Q接觸Network分析智嚷,有以下幾種使用環(huán)境:
- 用在自然選擇分析研究中,一般在確定一段區(qū)域或基因受選擇后纺且,會想看下在單倍型上是否呈現(xiàn)同樣的增長趨勢盏道,這會作為選擇信號的一種展示,用圖形的方式展示單倍型層面的增長隆檀。
我的理解: 單倍型層面的增長是基因組區(qū)域受自然選擇的必要條件,而不是充分條件劫映。
可參考的文獻:
1)Loci associated with skin pigmentation identified in African populations
https://pubmed.ncbi.nlm.nih.gov/29025994/ - 構建mtDNA/Y 基因組的單倍型網(wǎng)絡呵哨,探討人群的起源
這塊小Q接觸較少,看到過一些文章为鳄,給2篇可參考的文獻:
1)2013-Invest Genet-Inferring human history in East Asia from Y Chr
https://investigativegenetics.biomedcentral.com/articles/10.1186/2041-2223-4-11
2)Phylogenetic Network for European mtDNA
https://www.sciencedirect.com/science/article/pii/S0002929707610581 - 病毒基因組序列的單倍型網(wǎng)絡,探索其起源與擴張
可參考文獻:
1)Decoding the evolution and transmissions of the novelpneumonia coronavirus (SARS-CoV-2 / HCoV-19)using whole genomic data
http://www.zoores.ac.cn/en/article/doi/10.24272/j.issn.2095-8137.2020.022
軟件介紹
- 小編較常用的軟件是Network(https://www.fluxus-engineering.com/sharenet.htm)腕让,這款軟件是免費開源的孤钦,可直接下載使用。它主要是計算單倍型之間的關系纯丸,并計算其在網(wǎng)絡中的位置偏形。
- 它還有一個收費的Network publisher,可以很方便的調整Node的顏色分區(qū)觉鼻,對于后面圖的展示幫助很大俊扭。這里不做介紹。
1)輸入文件
我較為常用的RDF(Roehl Data File)文件坠陈,以此為例:
示例: 2個單倍型萨惑,5個堿基長度
空格空格;1.0
1;2;3;4;5;
10;10;10;10;10;
\>H_1;1;;;;;;;;
CCTCG
\>H_2;1;;;;;;;;
CCTCG
講解:
1.1) 第1行
;1.0前面的2個空格必須要有,別問原因仇矾,問小Q也不知道庸蔼,就知道不加就出錯,哈哈
1.2)第2行
堿基(突變)位置贮匕,隨意數(shù)字都可以,建議用基因組上的真實位置姐仅,這樣后續(xù)分析可知道單倍型之間相差是哪些位置的堿基。
1.3)第3行
每個堿基的權重刻盐,一般這里我不做修改掏膏,默認都是10,關于如何修改這個值隙疚,感興趣的伙伴可以看下官方說明壤追。
1.4)第4行-第5行
第1個單倍型的名稱和堿基序列
- H_1;1;;;;;;;;
這里,H_1是單倍型名稱供屉,必須是獨特的 - 1:表示這個單倍型的頻數(shù)為1
后面每一個分號前面都表示這個單倍型的屬性行冰,比如:所屬物種,所屬國家伶丐,所屬時間等均可
1.5)第6行-第7行
第2個單倍型的名稱和堿基序列
怎么做
- 準備好RDF文件