1.文庫:DNA文庫嚴(yán)格來講應(yīng)稱作cDNA文庫,中文名稱是基因文庫,是指某生物基因組中所有可表達(dá)的基因片段草姻,經(jīng)mRNA反轉(zhuǎn)錄后獲得相應(yīng)的cDNA的集合,將這些cDNA的集合經(jīng)轉(zhuǎn)入和克隆后貯存于受體細(xì)胞群落中,這個受體細(xì)胞群落即構(gòu)成該生物的cDNA文庫玷氏。教科書定義:某種生物的基因組轉(zhuǎn)錄的所有mRNA經(jīng)反轉(zhuǎn)錄產(chǎn)生的各種cDNA片段分別與克隆載體重組姥卢,貯存在一種受體菌克隆子群體之中,這樣群體稱為cDNA文庫扶平。途徑:1.將某種生物的基因組的轉(zhuǎn)錄部分帆离,通過mRNA反轉(zhuǎn)錄,產(chǎn)生大量相應(yīng)的cDNA片段结澄。2.將這些不同的cDNA片段與載體結(jié)合形成各種相應(yīng)DNA重組體哥谷。3.將DNA重組體導(dǎo)入宿主細(xì)胞。注意:因為轉(zhuǎn)入過程是隨機(jī)的麻献,因此宿主細(xì)胞要有一定的數(shù)量们妥,以確保能夠獲得所有類型的DNA重組體。4.經(jīng)克隆后勉吻,這些cDNA片段就貯存在一個受體細(xì)胞的群落中监婶,其中每個受體細(xì)胞都含有一種或幾種cDNA,而整個群落則含有這個生物全部的cDNA齿桃,這個群落就構(gòu)成了這種生物的cDNA文庫惑惶。用途:由于cDNA文庫包含了該生物所有的可表達(dá)基因片段,因此可隨時篩選出需要的目的基因片段短纵。不必再通過PCR制備带污,可以節(jié)省時間和成本,提高效率踩娘。cDNA文庫與基因組文庫的區(qū)別:途徑不同:cDNA文庫是經(jīng)mRNA反轉(zhuǎn)錄cDNA獲得的刮刑;基因組文庫是將完整的DNA經(jīng)限制性內(nèi)切酶切割得到的。內(nèi)容不同:cDNA文庫只含有部分基因組信息养渴,即可編碼能轉(zhuǎn)錄的那部分基因片段雷绢;基因組文庫包含了基因組內(nèi)所有的基因片段。
2.基因芯片(genechip)(又稱DNA芯片理卑、生物芯片)的原型是80年代中期提出的翘紊。基因芯片的測序原理是雜交測序方法藐唠,即通過與一組已知序列的核酸探針雜交進(jìn)行核酸序列測定的方法帆疟,在一塊基片表面固定了序列已知的靶核苷酸的探針。當(dāng)溶液中帶有熒光標(biāo)記的核酸序列TATGCAATCTAG宇立,與基因芯片上對應(yīng)位置的核酸探針產(chǎn)生互補(bǔ)匹配時踪宠,通過確定熒光強(qiáng)度最強(qiáng)的探針位置,獲得一組序列完全互補(bǔ)的探針序列妈嘹。據(jù)此可重組出靶核酸的序列柳琢。
名詞解釋:
Read depth?Read深度:一個樣本測序得到的reads數(shù);容易和基因組測序的覆蓋度 (多少基因組區(qū)域被測到了)和測序深度混淆 (單個核苷酸被測到的次數(shù)或所有核苷酸被測到的平均深度)。
Short-read?短讀長:測序得到的長度最大是500 bp的reads柬脸,常見的測序片段長度為100-300 bp他去;本文中的短讀長測序片段代表測到的mRNA片段和降解了的mRNA。
Long-read?長讀長:測序得到的超過1000 bp的reads倒堕,本文中代表全長或近乎全長的mRNA灾测。
Direct RNA sequencing?(dRNA-seq): 直接測序RNA而非cDNA的測序技術(shù),通常用于測序全長或近全長的mRNA 垦巴。
Multi-mapped reads?多重比對的reads:從轉(zhuǎn)錄組同源區(qū)域測序得到的reads媳搪,不能精確確認(rèn)其轉(zhuǎn)錄本或基因組的來源。
Synthetic long reads?合成long reads:通過組裝多個短讀長得到長讀長的方法骤宣。
唯一分子標(biāo)識符(UMIs):在擴(kuò)增前蛾号,構(gòu)建RNA-seq文庫的時候加入的短序列或barcodes,理想情況下每條轉(zhuǎn)錄本結(jié)合一個唯一的標(biāo)識符涯雅,含有此標(biāo)識符的reads都來源于此轉(zhuǎn)錄本,定量時只計算一次展运』钅妫可以用來降低RNA-seq的定量偏好性,在RNA起始量低的單細(xì)胞實驗中尤為適用拗胜。
Read length?讀長:單個測序reads的長度蔗候,short-read RNA測序得到的長度通常是50-150 bp。
Sensitivity?敏感性:樣本中多大比例的轉(zhuǎn)錄本會被測到埂软,敏感性越高锈遥,這一比例越高。它受樣本處理勘畔、文庫制備所灸、測序和計算偏好性的影響。
Specificity?特異性:度量差異表達(dá)轉(zhuǎn)錄本被正確鑒定出的比例的方法炫七,它受樣本處理爬立,文庫制備,測序和計算偏好性的影響万哪。
Duplication rates?重復(fù)Reads比率:比對到轉(zhuǎn)錄組相同位置的的測序reads的比例侠驯。在RNA-seq文庫中,一些轉(zhuǎn)錄本可能有高的重復(fù)率奕巍,因為它們在樣本中表達(dá)水平高吟策。高表達(dá)的基因的重復(fù)率很高,而低表達(dá)基因的或許有著最小的重復(fù)率的止。由此RNA-seq面臨著一個挑戰(zhàn)檩坚,該技術(shù)中大部分重復(fù)可能是高表達(dá)轉(zhuǎn)錄本帶來的真實信號,而另一些則是由于擴(kuò)增和測序偏好性造成的。
Single-end sequencing?單端測序 (SE):只測序cDNA片段的一端效床,因其費用低睹酌,常用于只關(guān)注差異基因表達(dá)的項目中。(NGS基礎(chǔ) - 高通量測序原理)
Paired-end sequencing?雙端測序 (PE):cDNA片段兩端分別測序剩檀,可以測序到cDNA的更多堿基憋沿,更好的識別剪接位點,常于差異基因表達(dá)分析項目沪猴。
生物學(xué)重復(fù):對生物來源不同的樣本的多次檢測辐啄,比如來自三個個體的組織,用于捕獲生物個體自身的變化运嗜;這個變化要么是待研究的對象壶辜,要么是噪音。相較之下担租,技術(shù)重復(fù)是對同樣的樣本做重復(fù)的操作—比如砸民,對一個組織做三次處理。
Expression matrix?表達(dá)矩陣:差異表達(dá)RNA-seq項目的核心數(shù)據(jù)文件奋救。每一行代表一個RNA岭参,比如基因或者轉(zhuǎn)錄本。每一列是一個測序的樣本尝艘。矩陣中的數(shù)值是每個RNA的reads數(shù)演侯。這些可能是對轉(zhuǎn)錄異構(gòu)體的計數(shù)估計,并通常在后續(xù)的分析前先進(jìn)行標(biāo)準(zhǔn)化轉(zhuǎn)化背亥。
Spike-in control?內(nèi)參:按特定濃度添加到樣品中的外源核酸庫秒际。它們通常是預(yù)先合成的不同濃度的RNA,用于監(jiān)測反應(yīng)效率和技術(shù)方法的偏差和假陰性結(jié)果狡汉。
Spatialomics?空間轉(zhuǎn)錄組學(xué):能保留給定樣本(通常是組織切片)中每個轉(zhuǎn)錄本的空間信息的轉(zhuǎn)錄組分析方法娄徊。
Nascent RNA?新生RNA:剛剛轉(zhuǎn)錄出來的RNA,與已經(jīng)加工并運輸?shù)郊?xì)胞質(zhì)的RNA相對應(yīng)盾戴。
Translatome?翻譯組:細(xì)胞嵌莉、組織或生物體中正在翻譯成蛋白質(zhì)的mRNA集合。
Structurome?結(jié)構(gòu)組:細(xì)胞捻脖、組織或生物體中RNA的二級和三級結(jié)構(gòu)集合锐峭。
Interactome?互作組:細(xì)胞、組織和生物體中分子相互作用的集合可婶,包括有RNA-RNA或者RNA-蛋白質(zhì)的相互作用沿癞。
Differential gene expression (DGE)?差異基因:兩個實驗組中表達(dá)顯著變化的基因。