QIIME基礎應用(一)

一、數(shù)據(jù)準備

1、Mapping文件

Mapping文件為描述測序樣本信息的文件星立,“數(shù)據(jù)的數(shù)據(jù)”,文件格式為.txt葬凳,需手動建立绰垂,其基本格式如下:


其中前三列與最后一列為必備列,分別為樣品名火焰,Barcode序列劲装,引物序列,以及樣品描述信息荐健,其余列可自行添加用于樣品分組酱畅。

準備好的Mapping文件需使用validate_mapping_file.py檢驗其正確性:

validate_mapping_file.py -m Fasting_Map.txt -o validate_mapping_file_output

2、測序結(jié)果文件

一般情況下江场,我們得到的是測序公司提供的已分割好的數(shù)據(jù)纺酸,測序公司會提供已拼接完成的.fastq格式文件,每個樣品單獨一個文件址否。

將測序文件單獨放在某一文件夾下餐蔬,進行初步的質(zhì)控、文件合并以及格式整理以用作下一步分析佑附,該步驟通過multiple_split_libraries_fastq.py命令實現(xiàn)樊诺。

multiple_split_libraries_fastq.py -i input_files -o output_folder --demultiplexing_method sampleid_by_file --read_indicator _R1_ --sampleid_indicator _

其中--read_indicator參數(shù)為序列文件名中代表性的特征字符,用于區(qū)分該文件夾下其他文件音同;--sampleid_indicator參數(shù)為序列文件名中某一字符词爬,其用途為該字符前面的字符將作為后續(xù)分析的樣品ID,例如sample1_L001_R1_001.fastq.gz权均,_R1_為表征該文件為序列文件的特征字符顿膨, _之前的sample1作為該文件對應樣品的樣品ID。

該步驟運行結(jié)果可得到一個.fasta格式文件叽赊,包含所有樣品所有序列恋沃,其序列名基本格式為

><sample_id>_<unique_seq_id>

二、OTU劃分

可以利用上步得到的.fasta格式文件直接劃分OTU必指,可使用pick_de_novo_otus.py命令:

pick_de_novo_otus.py -i $PWD/seqs.fna -o $PWD/uclust_otus/

該命令為一workflow囊咏,具體包含以下7條命令:

1、pick_otus.py

pick_otus.py -i seqs.fasta -o picked_otus_defaul

第一步為OTU劃分塔橡,-m參數(shù)設置劃分方法梅割,默認采用uclust方法,-s設置相似度閾值谱邪,默認值為0.97炮捧。該步驟所得結(jié)果文件為:seqs_otus.txt與seqs_otus.log文件。seqs_otus.log為日志文件惦银,記錄相關(guān)參數(shù)咆课,seqs_otus.txt文件每行包含OTU_ID以及該OTU下包含的序列名,基本格式如下:

2扯俱、pick_rep_set.py

pick_rep_set.py -i seqs_otus.txt -f seqs.fasta -o rep_set1.fasta

第二步為挑選出每個OTU的代表序列书蚪,所有OTU均有一條代表序列,合并為一個文件迅栅,序列名為>OTU_ID sequence_ID文件基本形式如下:

3殊校、align_seqs.py

align_seqs.py -i $PWD/unaligned.fna -t $PWD/core_set_aligned.fasta.imputed -o $PWD/pynast_aligned_defaults/

第三步是對上一步得到的代表序列進行對齊操作(Alignment),得到一個已對齊的.fasta文件读存,-m參數(shù)設置方法为流,默認方法為PyNAST呕屎。

4、assign_taxonomy.py

assign_taxonomy.py -i repr_set_seqs.fasta -r ref_seq_set.fna -t id_to_taxonomy.txt

第四步是進化分類敬察,根據(jù)上步得到的代表序列秀睛,確定每個OTU的進化分類,-m參數(shù)設置方法莲祸,默認采用uclust consensus taxonomy assigner 蹂安,也可以設置采用RDP方法進行分類。該步可得到一log文件和Assignment文件锐帜,其形式如下:

5田盈、filter_alignment.py

filter_alignment.py -i seqs_rep_set_aligned.fasta -o filtered_alignment/

第五步是對第三步得到的Alignment文件進行剪切,去掉alignment序列中的空格(Gaps)缴阎,用于下一步構(gòu)建進化樹允瞧。

6、make_phylogeny.py

make_phylogeny.py -i $PWD/aligned.fasta -o $PWD/rep_phylo.tre

利用上步得到的文件構(gòu)建進化樹蛮拔,-m參數(shù)設置建樹方法瓷式,默認采用fasttree。

7语泽、make_otu_table.py

make_otu_table.py -i otu_map.txt -t tax_assignments.txt -o otu_table.biom

最后一步是生成.biom格式的OTU table贸典,OTU table每一列為一樣品,每一行為一OTU以及該OTU在各樣品中出現(xiàn)的次數(shù)踱卵。輸入文件為第一步得到的文件廊驼。

由于在下一步驟中還需進行質(zhì)量控制,所以主要用于下游統(tǒng)計分析的第5惋砂、6兩步可以暫時跳過妒挎。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市西饵,隨后出現(xiàn)的幾起案子酝掩,更是在濱河造成了極大的恐慌,老刑警劉巖眷柔,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件期虾,死亡現(xiàn)場離奇詭異,居然都是意外死亡驯嘱,警方通過查閱死者的電腦和手機镶苞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鞠评,“玉大人茂蚓,你說我怎么就攤上這事。” “怎么了聋涨?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵晾浴,是天一觀的道長。 經(jīng)常有香客問我牍白,道長怠肋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任淹朋,我火速辦了婚禮,結(jié)果婚禮上钉答,老公的妹妹穿的比我還像新娘础芍。我一直安慰自己,他們只是感情好数尿,可當我...
    茶點故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布仑性。 她就那樣靜靜地躺著,像睡著了一般右蹦。 火紅的嫁衣襯著肌膚如雪诊杆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天何陆,我揣著相機與錄音晨汹,去河邊找鬼。 笑死贷盲,一個胖子當著我的面吹牛淘这,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播巩剖,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼铝穷,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了佳魔?” 一聲冷哼從身側(cè)響起曙聂,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎鞠鲜,沒想到半個月后宁脊,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡贤姆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年朦佩,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片庐氮。...
    茶點故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡语稠,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情仙畦,我是刑警寧澤输涕,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站慨畸,受9級特大地震影響莱坎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜寸士,卻給世界環(huán)境...
    茶點故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一檐什、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧弱卡,春花似錦乃正、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至凡人,卻和暖如春名党,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背挠轴。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工传睹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人岸晦。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓蒋歌,卻偏偏與公主長得像,于是被迫代替她去往敵國和親委煤。 傳聞我的和親對象是個殘疾皇子堂油,可洞房花燭夜當晚...
    茶點故事閱讀 45,092評論 2 355

推薦閱讀更多精彩內(nèi)容