數(shù)據(jù)上傳
- from local computer
- from server:
curl -T [my_data_filename] -k -v -u [username] ftps://repeatexplorer-elixir.cerit-sc.cz/
需輸入登錄密碼
數(shù)據(jù)下載
filezilla軟件下載地址
主機:ftps://repeatexplorer-elixir.cerit-sc.cz
用戶名:yanglook
密碼:xxx
數(shù)據(jù)處理
從公司拿到原數(shù)據(jù)(此處只針對NGS的雙端測序數(shù)據(jù))后掌逛,先用Trimmomatic進行去接頭等處理掰邢,后可以用FastUniq去除duplicate reads菠隆。之后再將數(shù)據(jù)上傳到Galaxy平臺上的RepeatExplorer上靡砌。
思路
先用Input或參考基因組數(shù)據(jù)做Cluster處理,search出整個物種含有哪些repeat琢锋,其次用Cluster中的contig為database次和,計算ChIP/Input ratio包各,找出候選的centromere,最后進行FISH驗證跃惫。
流程
- FASTQ-Groomer---Filter by quality---FASTQ Interlacer---
FASTQ to FASTA---Rename sequence---Clustering---下載Archive文件
參數(shù):均使用默認叮叹,在clustering時,用目標物種的自定義的repeat數(shù)據(jù)庫進行注釋爆存。 - 以contigs為database, Input和ChIP為query, 分別用blastn計算各自reads map到每個cluster上的豐富度蛉顽。參數(shù):“-evalue 1e-8 -num_alignment 1 -wordsizes 9 -dust no -gapopen 5 -gapextend 2 -penalty -3 -reward 2"
- 選擇ChIP/Input 或ChIP/WGS>2的cluster,以cluster
的monomer為著絲粒候選探針先较,通過FISH驗證携冤。