最后一天在豆豆花花的引導(dǎo)下成長
教程的知識總結(jié)特別好
是我一直接觸又疑惑的部分
喜歡這樣的系統(tǒng)歸納
真誠致謝
學(xué)習(xí)內(nèi)容
怎么區(qū)分一二三代測序
二代測序大體流程
NGS組學(xué)都包括哪些分類
測序過程和原理
- 原理介紹視頻:https://share.weiyun.com/5qojuBY 密碼: 密碼:bxsry4
- 文章《測序的世界》:http://www.reibang.com/p/101c14c3a1d2
Fastq & Fasta
Fastq格式:一種基于文本的,保存生物序列(通常是核酸序列)和其測序質(zhì)量信息的標(biāo)準(zhǔn)格式,一般都包含有4行脚线。
第一行:由‘@’開始搁胆,后面跟著序列ID和可選的描述,序列ID是唯一的邮绿;
第二行:堿基序列渠旁;
第三行:由‘+’開始,后面是序列的描述信息船逮;
第四行:第二行序列的質(zhì)量評價(quality value)顾腊。
Fasta格式:
1:以“>”為開頭,fasta格式標(biāo)志挖胃。
2:序列ID號杂靶,gi號梆惯,NCBI數(shù)據(jù)庫的標(biāo)識符,具有唯一性吗垮。
格式為:gi|gi號|來源標(biāo)志|序列標(biāo)志(接收號垛吗、名稱等),若某項缺失可以留空烁登,“|”保留怯屉。
3:序列描述。
4:堿基序列饵沧,序列中允許空格锨络、換行、空行狼牺,一般一行60個羡儿。
Fastq文件→Fasta文件
Linux命令
法1:sed '/^@/!d;s//>/;N' your.fastq > your.fasta
法2:seqtk seq -A input.fastq > output.fasta
FASTX-Toolkit
一款用于處理Short-Reads FASTA/FASTQ文件的程序,里面包含了豐富的Fasta/Fastq文件格式轉(zhuǎn)換是钥、統(tǒng)計等命令失受。
http://hannonlab.cshl.edu/fastx_toolkit/