名詞解釋
flowcell (流動池)
flwocell是帶有流通槽的玻璃滑塊帚称,是測序反應(yīng)的載體惊窖,里面有8條lane街氢。
lane(流通槽)
lane是測序反應(yīng)的平行泳道狈定,是試劑添加、洗脫等過程的發(fā)生位置瓜富。
tile
每一個lane里最小的單位叫做一個tile鳍咱,每個tile會種下不同的cluster,每個tile在一次循環(huán)中會拍照4次(每個堿基一次)与柑。
reads
測序的結(jié)果就叫做一個reads流炕,對雙端測序來說澎现,5'端reads叫reads1仅胞,3'端reads叫reads2每辟。
illumina測序的工作流程
https://www.bilibili.com/video/av13107081
一.sample prep(樣本準(zhǔn)備)
樣品準(zhǔn)備就是在DNA fragments(片段)的末端添加adaptors(接頭)。超聲波將DNA分子打斷成300-800bp長序列片段(人類基因組打成300-500bp)干旧,用酶補(bǔ)平為平末端渠欺,然后3‘端加一個A堿基(因為接頭的3‘端有一個突出的T),再在兩端加上互補(bǔ)配對的adapter椎眯,再通過PCR擴(kuò)增達(dá)到一定濃度挠将,構(gòu)成單鏈DNA文庫。
二.cluster generation(簇形成)
每一個lane固定了兩種不同的oligos(寡聚核苷酸引物)(垂直于lane)编整,測序時舔稀,兩種oligos中的一種和fragment上的adaptor互補(bǔ)結(jié)合,如下圖所示:
再之后雙鏈分子變性掌测,原始模板(左)被洗去内贮,右邊鏈通過bridge PCR進(jìn)行擴(kuò)增。隨后不斷擴(kuò)增汞斧,生成數(shù)百萬個cluster夜郁,如下圖:
之后所有的reverse strands(反向鏈)被切斷洗去,只留下forward strands(正向鏈)粘勒。正向鏈的3'端會封鎖竞端,防止特異性結(jié)合。
三.sequencing(測序)
測序從第一個測序引物primer的延伸開始庙睡,生成第一個read(讀段)事富。每一個核苷酸都帶有熒光標(biāo)記。四種核苷酸帶有四個不同的熒光標(biāo)記乘陪,發(fā)射出特征性的熒光信號统台,這個專有過程叫sequencing-by-synthesis.循環(huán)結(jié)束后,生成的read product被沖掉暂刘,在生成下一個read饺谬。整個過程生成數(shù)百萬個reads,代表所有的fragment谣拣。
https://www.bilibili.com/video/av9273946
這個視頻的21分有講雙端測序的過程募寨,自己寫的過程里沒提到第二條鏈怎么生成的。
四.data analysis(數(shù)據(jù)分析)
測序后生成的文件為fastq格式森缠,每4行為一個read拔鹰,read第1行:空格左邊(從紅色的1開始)為ID信息,DJG8....為測序儀信息,后邊數(shù)字代表是測序儀運(yùn)行的第272次礁击。空格右邊為barcode信息生兆,用于區(qū)分樣品瓷马。第2行為測序結(jié)果序列信息拴还。第4行為堿基質(zhì)量值。