三钾虐、建庫測序相關(guān):
library construction:文庫構(gòu)建噪窘,高通量測序前準備步驟。針對不同的研究目的建庫方法不同效扫。通常包括核酸樣品檢測倔监、片段化、(擴增)菌仁、加接頭浩习、片段選擇、純化济丘、濃度檢測等步驟谱秽。
insert size:插入片段大小,決定測序的長度摹迷。
adaptor:接頭疟赊,用于上機測序。建庫時引入的接頭序列與測序芯片(flow cell)上固定的接頭相互識別峡碉。
strand specific:鏈特異性近哟。鏈特異性建庫,可以確定轉(zhuǎn)錄本來自正鏈還是負鏈鲫寄。以便更加準確的獲得基因的結(jié)構(gòu)以及基因表達信息吉执。并且可以更好的發(fā)現(xiàn)新的基因。(研究表明:很多基因組區(qū)域具有正負鏈的轉(zhuǎn)錄本地来,反義轉(zhuǎn)錄是真核基因的一個特征戳玫,是一種重要的調(diào)控方式。對于原核以及低等真核生物的基因組未斑,常常具有重疊基因咕宿。)
SE:Single End 單端。測序策略的一種颂碧。
PE:Paired End 雙端荠列。測序策略的一種。
index:測序的標簽载城,用于測定混合樣本肌似,通過每個樣本添加的不同標簽進行數(shù)據(jù)區(qū)分,鑒別測序樣品诉瓦。
Run:一臺測序儀運行一個完整周期所產(chǎn)生的所有數(shù)據(jù)量川队。
flow cell:一種含有接頭的芯片力细,測序儀中使用的器材,通常一臺測序儀可放 1-2 張固额;測序時將樣品眠蚂、試劑等注入 flow cell 的通道中,發(fā)送測序反應斗躏,并可以通過拍照等手段從中捕獲測序信號逝慧。
lane:flow cel 中的通道;通常 Hiseq2500 flow cell 中有 2 個通道啄糙,可產(chǎn)生數(shù)據(jù)約 150M/lane笛臣,Hiseq2000 flow cell 中有 8 個通道,可產(chǎn)生數(shù)據(jù)約 180M/lane隧饼;每個通道中只限制數(shù)據(jù)量沈堡,不限制樣品數(shù)目。
fragment:實驗中樣品 total RNA/DNA 隨機打斷后產(chǎn)生的片段燕雁。 sequencing depth:測序深度诞丽。測序得到的總堿基數(shù)與待測基因組大小的比值。假設(shè)一個基因大小為 2M拐格,測序深度為 10X僧免,那么獲得的總數(shù)據(jù)量為 20M。
Illumina/HiSeq MiSeq:Illumina 二代測序儀頂級提供商,Hiseq 與Miseq 為其兩款測序儀禁荒。Miseq 相比于 Hiseq 每個 run 測序速度更快猬膨,序列更長,但數(shù)據(jù)量較少呛伴。