LTRfinder是一個用于識別和分析基因組中長末端重復序列(Long Terminal Repeat, LTR)的工具。LTR是一種在許多真核生物的基因組中普遍存在的轉(zhuǎn)座子(轉(zhuǎn)移)元件倔矾,特別是在植物和真菌中妄均。LTRfinder主要用于識別和定位這些LTR序列,并對其進行進一步的分析和注釋。
該程序首先通過基于后綴數(shù)組的算法構(gòu)建所有的精確匹配對丛晦,并將它們擴展為長且高度相似的對奕纫。然后,使用Smith-Waterman算法來調(diào)整LTR對候選序列的末端烫沙,以獲取對齊邊界匹层。這些邊界會根據(jù) TG..CA 盒子和 TSRs 的支持信息進行重新調(diào)整,并選擇可靠的 LTR锌蓄。接下來升筏,LTR_FINDER 嘗試通過內(nèi)置的對齊和計數(shù)模塊識別 LTR 對內(nèi)的 PBS、PPT 和 RT瘸爽。
使用說明:
ltr_finder? -D 15000? -d 1000? -L 7000 -l 100 -p 20 -C -M 0.9? ?XX.fa? ?>? ?xx.scn
參數(shù)說明:
-D NUM:5'和3'LTR之間的最大距離您访,默認為20000
-d NUM:5'和3'LTR之間的最小距離,默認為1000
-L NUM:5'和3'LTR的最大長度剪决,默認為3500
-l NUM:5'和3'LTR的最小長度灵汪,默認為100
-p NUM:完全匹配對的最小長度,默認為20
-C:檢測中心體柑潦,刪除高度重復的區(qū)域
-M NUM:LTR相似性的最小閾值享言,默認為0.00,范圍為[0,1]
-o NUM:缺口開啟懲罰渗鬼,默認為3
-t NUM:缺口延伸懲罰览露,默認為1
-e NUM:缺口結(jié)束懲罰,默認為1
-m NUM:匹配得分譬胎,默認為2
-u NUM:不匹配得分差牛,默認為-2
-g NUM:加入對之間的最大間隙,默認為50
-G NUM:RT亞域之間的最大間隙堰乔,默認為2
-T NUM:在RT域中找到的最小亞域數(shù)偏化,默認為4
-j NUM:加入新序列到現(xiàn)有對中的閾值,默認為0.70
-J NUM:將現(xiàn)有對拆分為兩部分的閾值浩考,默認為0.90
-S NUM:輸出得分限制夹孔,默認為6.00被盈,范圍為[0,10]
-r NUM:PBS檢測閾值析孽,最小的tRNA匹配長度:14,范圍為[1,18]
-w NUM:輸出格式:[0]-完整只怎,1-摘要袜瞬,2-表格,默認為0
-O NUM:輸出對齊長度(僅影響 -w0)身堡,默認為40
-P STR:SeqIDs邓尤,僅計算匹配的SeqID,支持POSIX風格的正則表達式
-f filename:用于繪制圖形的數(shù)據(jù)文件
-a ps_scan_dir:使用ps_scan預測蛋白質(zhì)結(jié)構(gòu)域
-E:LTR必須有邊緣信號(至少兩個PBS,PPT汞扎,TSR之一)
LTR_retriever 是一個用于從基因組中檢測和提取長末端重復序列(LTR)逆轉(zhuǎn)錄轉(zhuǎn)座子的工具季稳。LTR 逆轉(zhuǎn)錄轉(zhuǎn)座子是真核生物基因組中常見的一類轉(zhuǎn)座子,它們通過逆轉(zhuǎn)錄的方式在基因組中復制和插入澈魄,對基因組結(jié)構(gòu)和功能具有重要影響景鼠。
LTR_retriever的主要功能包括:
LTR檢測:通過對基因組序列進行分析,識別其中的長末端重復序列痹扇。這些重復序列往往是LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的標志铛漓。
LTR結(jié)構(gòu)和組織分析:對檢測到的LTR序列進行進一步分析,包括確定其起始和終止位置鲫构、長度浓恶、相對方向等。
LTR逆轉(zhuǎn)錄轉(zhuǎn)座子注釋:對檢測到的LTR逆轉(zhuǎn)錄轉(zhuǎn)座子進行注釋结笨,包括識別其中的重要特征和結(jié)構(gòu)域包晰,并提供相關信息。
LTR逆轉(zhuǎn)錄轉(zhuǎn)座子家族分類:根據(jù)檢測到的LTR序列的相似性和結(jié)構(gòu)特征炕吸,將其歸類為不同的家族或亞家族杜窄。
LTR逆轉(zhuǎn)錄轉(zhuǎn)座子的進化分析:通過比較不同LTR逆轉(zhuǎn)錄轉(zhuǎn)座子家族之間的相似性和差異性,揭示它們的進化關系和演化歷史算途。
使用說明:
LTR_retriever? ?-genome? xx.fa? ?-infinder? ??xx.scn