1.準(zhǔn)備文件
即要是1,2是一對(duì)串聯(lián)重復(fù)漆际,就將其放在一個(gè)文件內(nèi)。
在上一步獲得的文件夺饲,一對(duì)重復(fù)基因是一行奸汇,所以我們就將兩列一行轉(zhuǎn)為一列兩行,并以兩行為準(zhǔn)分割文件往声,最后利用生成的文件將序列提取出來擂找。
$for i in repeat_gene_id; do awk '{print $0}' $i |xargs -n1 >$i.bed; done
split -l2 $I.bed
$seqkit grep -f 分割出來的文件 cds_hits > 分割出來的文件.fa
2.計(jì)算Kaks值
計(jì)算kaks值之前需要將序列比對(duì)。kaks自帶了將aln文件改為axt文件烁挟。
## 轉(zhuǎn)換格式
$~biosoft/KAKS_Calculator/KaKs_Calculator2.0/src/AXTConvertor xaa.aln xaa.axt
報(bào)錯(cuò)
打開這個(gè)axt文件婴洼,文件末尾會(huì)發(fā)現(xiàn)gap和別的比對(duì)上了。把多余的A及gap刪掉撼嗓。
修改之后
再次運(yùn)行
結(jié)果文件