DARwin6 can be directly downloaded from the web site http://darwin.cirad.fr/
應該是沒有發(fā)表正式文章
貌似可以以進行聚類分析為主,還可Principal Coordinate analysis预烙,引物從原始數據到聚類文件輸入文件-計算dissimilarities-得到樹文件
現在就是明白軟件的對于基因型SSR數據的輸入格式弟胀,軟件以.var
格式作為軟件的輸入格式尤揣,其格式具體內容如下:
1 2 3 行都是一些特定的描述疙筹,之后為你的數據
輸入文件 .VAR components`具體的數據格式包括:
Single data
: 顯性數據隔盛。單倍體數據呕臂,0/1格式數據
Sequence data
:序列數據
本實驗為帶有基因型的SSR數據,即是軟件中的
Allelic data
: 第一行需表明倍性查坪,第二行位點數和等位基因樹
最方便得到.var文件就是預先處理自己文件為一下這種文本格式,本次將999作為missing data
然后import這個文件即可寸宏,會輸出Var格式的文件作為標準的軟件輸入格式文件,可選擇什么作為missingdata偿曙。這種情況會清除DataMatrix里的對于樣本的命名氮凝,重新按順序從1開始進行命名,很不友好望忆,嘗試自己將DataMatrix更改為var格式罩阵,是可以的只要第一列即樣本列只是數字即可,后續(xù)進行轉換吧启摄。重命名后也會很迷惑稿壁,還是使用原文件DataMatrix用軟件轉換成var吧,之后的樹形文件中的標簽可以直接使用itol進行更改
輸入文件 .AFT 文件
計算PCA時的輸入文件歉备,不關注
中間文件 .DIS 文件
計算得到的dissimilarity matrix 可從其他軟件計算得到傅是,應該也可以從var文件中使用DARwin計算得到。
如何計算dissimilarity matrix
而對于missing data如何進行操作梳侨,可刪除整個樣本或整個位點,一般選擇第三個選項也是默認日丹。
然后設置bootstraps走哺,點擊右上save即可,得到dis文件
結果文件 .ARB
應該時對樹形文件的描述哲虾,看不懂
然后就可以使用itol等軟件進行編輯了束凑。