隨著測序成本的不斷下降,轉(zhuǎn)錄組測序分析已然成為生物學及醫(yī)學研究不可或缺的技術手段沽讹。
但是般卑,對于大多數(shù)初學者來說,會遇到各種各樣的問題爽雄。這里蝠检,小編就給大家重點介紹一下轉(zhuǎn)錄組測序分析的相關知識。
Question and Answer
1挚瘟、什么是轉(zhuǎn)錄組測序叹谁?
轉(zhuǎn)錄組廣義上指在某一生理條件下,細胞內(nèi)所有轉(zhuǎn)錄組產(chǎn)物的集合乘盖,包括:mRNA焰檩、ncRNA、rRNA等订框;狹義上指所有mRNA的集合析苫。
轉(zhuǎn)錄組測序的研究對象為特定細胞在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,主要包括mRNA和ncRNA穿扳。
轉(zhuǎn)錄組具有時間特異性衩侥、組織特異性、空間特異性等特點矛物。
2茫死、無參轉(zhuǎn)錄組和有參轉(zhuǎn)錄組的區(qū)別?
如果所研究的物種有組裝注釋質(zhì)量較好基因組序列履羞,且和該基因組序列比對效率較高峦萎,那么可以采用有參轉(zhuǎn)錄組的分析策略,直接進行分析吧雹。反之,則需要按照無參轉(zhuǎn)錄組的分析策略進行轉(zhuǎn)錄本組裝涂身,構(gòu)建unigene庫雄卷,然后進行后續(xù)分析。
3蛤售、普通轉(zhuǎn)錄組測序適用于哪些情況丁鹉?
普通轉(zhuǎn)錄組測序主要適用于兩大類:一是不同的生長階段或者發(fā)育過程;二是不同的環(huán)境悴能、藥物揣钦、病原菌等逆境脅迫處理。
4漠酿、轉(zhuǎn)錄組測序推薦的測序數(shù)據(jù)量冯凹?
轉(zhuǎn)錄組測序所需數(shù)據(jù)量與所研究物種的基因組大小有關,基因組越大炒嘲,則所需數(shù)據(jù)量越大宇姚。按照我們的經(jīng)驗來說:
常規(guī)物種一般建議6G數(shù)據(jù)即可匈庭;
基因組較大的物種推薦8G以上數(shù)據(jù),比如:小麥建議10G數(shù)據(jù)起浑劳,甘蔗阱持、甘薯建議至少8G數(shù)據(jù)。
5魔熏、轉(zhuǎn)錄組測序的取樣建議衷咽?
取樣要遵守三個原則:代表性和一致性原則、迅速性原則蒜绽、低溫原則镶骗。具體可以參考小編之前發(fā)的一篇推文《高通量測序及蛋白組學相關樣品準備須知》藍字為鏈接可點擊。
6滓窍、轉(zhuǎn)錄組測序必須做生物學重復么卖词?需要幾個重復?
生物學重復是生物實驗所必須的吏夯,轉(zhuǎn)錄組測序也不例外此蜈,至少3 次生物學重復。
準備生物重復樣品時噪生,通過對實驗的預先設計和控制裆赵,盡可能將與實驗處理無關的背景條件控制在同一水平,減少批次效應對結(jié)果的影響跺嗽。
7战授、轉(zhuǎn)錄組測序可以同時測到mRNA、lncRNA桨嫁、micRNA以及circRNA么植兰?
我們通常所講的轉(zhuǎn)錄組測序只能測到mRNA。但是全轉(zhuǎn)錄組測序通過構(gòu)建兩個測序文庫(一是小RNA測序文庫璃吧、二是lncRNA測序文庫)是可以測到以上4種RNA的楣导。
8、有參轉(zhuǎn)錄組測序分析中畜挨,與參考基因組的比對效率多高才能夠滿足后續(xù)分析筒繁?
與參考基因組的比對效率與多個因素有關,包括基因組組裝質(zhì)量巴元、測序質(zhì)量毡咏、有無污染等;一般來說逮刨,與參考基因組的比對效率在70%以上時呕缭,該基因組可以滿足后續(xù)的分析需求。當比對效率低于60%時,需要考慮換參考基因組或者按照無參轉(zhuǎn)錄組分析策略進行分析臊旭。
9落恼、所研究物種有參考基因組時,必須按照有參的來分析么离熏?
按照有參或者無參進行轉(zhuǎn)錄組分析佳谦,取決于基因組的質(zhì)量、所研究物種與參考基因組的比對效率滋戳。具體如下:
若參考基因組質(zhì)量較差钻蔑,則可以選擇按照無參轉(zhuǎn)錄組分析策略進行分析;
若所研究物種與參考基因組比對效率比較低奸鸯,則需要按照無參轉(zhuǎn)錄組分析策略進行分析咪笑。
10、做完轉(zhuǎn)錄組之后一定要進行Q-PCR驗證么娄涩?一般驗證多少個差異基因合適窗怒?
目前來說,Q-PCR驗證是轉(zhuǎn)錄組測序分析必不可少的補充驗證實驗蓄拣,發(fā)文章必須扬虚。一般驗證15-20個差異基因比較合適。
11球恤、Q-PCR與轉(zhuǎn)錄組測序結(jié)果的吻合度一般多高是合適的辜昵?為什么會出現(xiàn)不吻合的現(xiàn)象?
Q-PCR與有參轉(zhuǎn)錄組分析結(jié)果的吻合度在80%以上咽斧;Q-PCR與無參轉(zhuǎn)錄組分析結(jié)果的吻合度在70%以上堪置。
出現(xiàn)結(jié)果不吻合現(xiàn)象的原因如下:實驗所用樣本弄混;沒有使用與轉(zhuǎn)錄組測序同一批的樣本進行Q-PCR驗證张惹;挑選的基因表達量較低或差異不顯著舀锨。
12、轉(zhuǎn)錄組測序的后續(xù)補充分析有哪些宛逗?
做完轉(zhuǎn)錄組測序可以考慮以下分析內(nèi)容做為補充坎匿,用于提高文章檔次和深度。
可變剪接的深入分析(對生信基礎要求較高)
基因家族分析(基因家族分析發(fā)SCI-多拧额、快碑诉、好彪腔、式慕酢!)藍字為鏈接可點擊
WGCNA分析(你距離SCI文章只差一個WGCNA分析)藍字為鏈接可點擊
其他分析(參考其他人的高分文章德挣,整理自己的個性化分析思路)
13恭垦、有參轉(zhuǎn)錄組測序分析的結(jié)果文件中有全部基因的cds序列么?在哪個文件中?
一般來說結(jié)果文件中有全部基因的cds序列番挺。我公司有參轉(zhuǎn)錄組分析結(jié)果中的基因cds序列信息位于Gene_Func_Anno文件夾下面的NewGene中的All.longest_transcript.fa文件里唠帝。
14、轉(zhuǎn)錄組測序分析常用的數(shù)據(jù)庫有哪些玄柏?重點關注哪些注釋信息襟衰?
Nr:NCBI非冗余蛋白數(shù)據(jù)庫,包含的信息很全面,?注釋到的基因較多粪摘。
COG?:中文釋義即“同源蛋白簇”瀑晒。COG?分為兩類,一類是原核生物的徘意,另一類是真核生物苔悦。原核生物的一般稱為?COG?數(shù)據(jù)庫;真核生物的一般稱為?KOG?數(shù)據(jù)庫椎咧。
SWISS-PROT:經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫玖详,數(shù)據(jù)庫中的蛋白質(zhì)的功能經(jīng)過了試驗驗證,注釋是精確的勤讽;
TrEMBL:數(shù)據(jù)庫全稱“Translation of EMBL”蟋座,是從EMBL中的cDNA序列翻譯得到的,其中TrEMBL收錄的是未經(jīng)人工注釋的編碼DNA序列翻譯數(shù)據(jù)地技;
KEGG:翻譯成中文是京都基因與基因組百科全書蜈七,是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫莫矗,旨在揭示生命現(xiàn)象的遺傳與化學藍圖飒硅。它是由人工創(chuàng)建的一個知識庫,KEGG數(shù)據(jù)庫最優(yōu)的地方在于擁有描繪已知通路的代謝通路圖作谚。另外KEGG中有一個“專有名詞”KO(KEGG Orthology)三娩,它是蛋白質(zhì)(酶)的一個分類體系,序列高度相似妹懒,并且在同一條通路上有相似功能的蛋白質(zhì)被歸為一組雀监,然后打上KO(或K)標簽,一般用字母K后面加5個數(shù)字表示眨唬。KEGG_ID?是pathway的ID会前,表示方法是2-4個字母,后面跟上5個數(shù)字匾竿;
GO(gene ontology):是基因本體聯(lián)合會(Gene Onotology Consortium)所建立的數(shù)據(jù)庫瓦宜,旨在建立一個適用于各種物種的,對基因和蛋白質(zhì)功能進行限定和描述的數(shù)據(jù)庫岭妖。按照三大類別BP(生物學過程)临庇、 MF((分子功能)反璃、CC(細胞組分)對基因的產(chǎn)物-蛋白質(zhì)進行了分類,并能隨著研究不斷深入而更新的語言詞匯標準假夺。在GO數(shù)據(jù)庫中淮蜈,本質(zhì)上是一個有向無環(huán)圖的數(shù)據(jù)結(jié)構(gòu),在三大類別之下已卷,又有小的分類層級梧田,一層一層的分類下去。對于某個具體的GO號來說侧蘸,代表一組同源蛋白柿扣,擁有相似的結(jié)構(gòu)和功能;
Pfam:是一個被廣泛使用的蛋白家族數(shù)據(jù)庫闺魏,它有兩個數(shù)據(jù)庫未状,高質(zhì)量,手工確定的Pfam-A析桥,自動注釋的Pfam-B數(shù)據(jù)庫司草。
15、差異分析的篩選標準默認是多少泡仗?是固定不變的么埋虹?
差異分析的篩選標準默認為:Fold Change≥2且FDR<0.01。篩選條件要靈活娩怎,要根據(jù)情況進行參數(shù)調(diào)整搔课,數(shù)據(jù)是死的,人是活的截亦,要靈活變通爬泥。
16、unigene和轉(zhuǎn)錄本的區(qū)別崩瓤?
unigene是轉(zhuǎn)錄本的子集袍啡。首先通過triniy組裝出來的視為轉(zhuǎn)錄本,然后挑選最長的一條轉(zhuǎn)錄本作為unigene却桶。
17境输、差異基因太多,注釋信息太雜亂颖系,怎么挑選目標基因嗅剖?
可以根據(jù)KEGG和GO富集分析結(jié)果,挑選富集程度較高的代謝通路和GO terms嘁扼,進而查看相關的差異基因信粮;
對不同的差異組合進行維恩圖分析,挑選共有或者特有的差異基因作為后續(xù)的研究對象偷拔;
根據(jù)前人的文獻報道蒋院,挑選相關差異基因,不要局限在自己研究的物種上莲绰。
18欺旧、為什么原核物種只能做有參轉(zhuǎn)錄組分析?
由于原核生物的基因組中存在大量基因重疊區(qū)域蛤签、操縱子及多順反子辞友,如果按照無參轉(zhuǎn)錄組分析策略進行組裝的話,難度較大震肮,組裝結(jié)果存在較大風險称龙。
19、差異基因數(shù)目多少比較合理戳晌?
不同的處理鲫尊,不同的研究目標,差異基因的數(shù)目是不同的沦偎,從幾十個到幾千個都有可能疫向。但是如果差異基因數(shù)目是個位數(shù)或者上萬,那么就需要和分析人員溝通一下豪嚎,查一查是否有問題搔驼。
20、組學生物的轉(zhuǎn)錄組分析結(jié)果與其他公司的區(qū)別在哪里侈询?
我們的標準分析在不斷更新舌涨,盡量做到國內(nèi)做全;
后期個性化分析速度快扔字,質(zhì)量好囊嘉,沒有大公司的拖延癥;
針對初學者革为,我們精心制作了配套的轉(zhuǎn)錄組分析結(jié)果解讀教程(藍字為鏈接可點擊)哗伯,確保您能看懂分析結(jié)果。
您可以掃描下方二維碼篷角,關注我們組學大講堂公眾號焊刹,然后公眾號對話框內(nèi)發(fā)送“轉(zhuǎn)錄組報告”獲取有參轉(zhuǎn)錄組測序分析結(jié)題報告。
更多生物信息課程:
1.?文章越來越難發(fā)恳蹲?是你沒發(fā)現(xiàn)新思路虐块,基因家族分析發(fā)2-4分文章簡單快速,學習鏈接:基因家族分析實操課程嘉蕾、基因家族文獻思路解讀
2.?轉(zhuǎn)錄組數(shù)據(jù)理解不深入贺奠?圖表看不懂?點擊鏈接學習深入解讀數(shù)據(jù)結(jié)果文件错忱,學習鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀儡率;轉(zhuǎn)錄組(無參)結(jié)果解讀
3.?轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA挂据,提升你的文章檔次,學習鏈接:WGCNA-加權基因共表達網(wǎng)絡分析
4.?轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘儿普?學習鏈接:轉(zhuǎn)錄組標準分析后的數(shù)據(jù)挖掘崎逃、轉(zhuǎn)錄組文獻解讀
5.?微生物16S/ITS/18S分析原理及結(jié)果解讀、OTU網(wǎng)絡圖繪制眉孩、cytoscape與網(wǎng)絡圖繪制課程
6.?生物信息入門到精通必修基礎課个绍,學習鏈接:linux系統(tǒng)使用、perl入門到精通浪汪、perl語言高級巴柿、R語言畫圖
7.?醫(yī)學相關數(shù)據(jù)挖掘課程,不用做實驗也能發(fā)文章死遭,學習鏈接:TCGA-差異基因分析广恢、GEO芯片數(shù)據(jù)挖掘、GSEA富集分析課程呀潭、TCGA臨床數(shù)據(jù)生存分析袁波、TCGA-轉(zhuǎn)錄因子分析、TCGA-ceRNA調(diào)控網(wǎng)絡分析
8.其他課程鏈接:二代測序轉(zhuǎn)錄組數(shù)據(jù)自主分析蜗侈、NCBI數(shù)據(jù)上傳篷牌、二代測序數(shù)據(jù)解讀。