20個轉(zhuǎn)錄組知識點-你必須知道!

隨著測序成本的不斷下降,轉(zhuǎn)錄組測序分析已然成為生物學及醫(yī)學研究不可或缺的技術手段沽讹。

但是般卑,對于大多數(shù)初學者來說,會遇到各種各樣的問題爽雄。這里蝠检,小編就給大家重點介紹一下轉(zhuǎn)錄組測序分析的相關知識。

Question and Answer

1挚瘟、什么是轉(zhuǎn)錄組測序叹谁?

轉(zhuǎn)錄組廣義上指在某一生理條件下,細胞內(nèi)所有轉(zhuǎn)錄組產(chǎn)物的集合乘盖,包括:mRNA焰檩、ncRNA、rRNA等订框;狹義上指所有mRNA的集合析苫。

轉(zhuǎn)錄組測序的研究對象為特定細胞在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA的總和,主要包括mRNA和ncRNA穿扳。

轉(zhuǎn)錄組具有時間特異性衩侥、組織特異性、空間特異性等特點矛物。

2茫死、無參轉(zhuǎn)錄組和有參轉(zhuǎn)錄組的區(qū)別?

如果所研究的物種有組裝注釋質(zhì)量較好基因組序列履羞,且和該基因組序列比對效率較高峦萎,那么可以采用有參轉(zhuǎn)錄組的分析策略,直接進行分析吧雹。反之,則需要按照無參轉(zhuǎn)錄組的分析策略進行轉(zhuǎn)錄本組裝涂身,構(gòu)建unigene庫雄卷,然后進行后續(xù)分析。

3蛤售、普通轉(zhuǎn)錄組測序適用于哪些情況丁鹉?

普通轉(zhuǎn)錄組測序主要適用于兩大類:一是不同的生長階段或者發(fā)育過程;二是不同的環(huán)境悴能、藥物揣钦、病原菌等逆境脅迫處理。

4漠酿、轉(zhuǎn)錄組測序推薦的測序數(shù)據(jù)量冯凹?

轉(zhuǎn)錄組測序所需數(shù)據(jù)量與所研究物種的基因組大小有關,基因組越大炒嘲,則所需數(shù)據(jù)量越大宇姚。按照我們的經(jīng)驗來說:

常規(guī)物種一般建議6G數(shù)據(jù)即可匈庭;

基因組較大的物種推薦8G以上數(shù)據(jù),比如:小麥建議10G數(shù)據(jù)起浑劳,甘蔗阱持、甘薯建議至少8G數(shù)據(jù)。

5魔熏、轉(zhuǎn)錄組測序的取樣建議衷咽?

取樣要遵守三個原則:代表性和一致性原則、迅速性原則蒜绽、低溫原則镶骗。具體可以參考小編之前發(fā)的一篇推文《高通量測序及蛋白組學相關樣品準備須知》藍字為鏈接可點擊。

6滓窍、轉(zhuǎn)錄組測序必須做生物學重復么卖词?需要幾個重復?

生物學重復是生物實驗所必須的吏夯,轉(zhuǎn)錄組測序也不例外此蜈,至少3 次生物學重復。

準備生物重復樣品時噪生,通過對實驗的預先設計和控制裆赵,盡可能將與實驗處理無關的背景條件控制在同一水平,減少批次效應對結(jié)果的影響跺嗽。

7战授、轉(zhuǎn)錄組測序可以同時測到mRNA、lncRNA桨嫁、micRNA以及circRNA么植兰?

我們通常所講的轉(zhuǎn)錄組測序只能測到mRNA。但是全轉(zhuǎn)錄組測序通過構(gòu)建兩個測序文庫(一是小RNA測序文庫璃吧、二是lncRNA測序文庫)是可以測到以上4種RNA的楣导。

8、有參轉(zhuǎn)錄組測序分析中畜挨,與參考基因組的比對效率多高才能夠滿足后續(xù)分析筒繁?

與參考基因組的比對效率與多個因素有關,包括基因組組裝質(zhì)量巴元、測序質(zhì)量毡咏、有無污染等;一般來說逮刨,與參考基因組的比對效率在70%以上時呕缭,該基因組可以滿足后續(xù)的分析需求。當比對效率低于60%時,需要考慮換參考基因組或者按照無參轉(zhuǎn)錄組分析策略進行分析臊旭。

9落恼、所研究物種有參考基因組時,必須按照有參的來分析么离熏?

按照有參或者無參進行轉(zhuǎn)錄組分析佳谦,取決于基因組的質(zhì)量、所研究物種與參考基因組的比對效率滋戳。具體如下:

若參考基因組質(zhì)量較差钻蔑,則可以選擇按照無參轉(zhuǎn)錄組分析策略進行分析;

若所研究物種與參考基因組比對效率比較低奸鸯,則需要按照無參轉(zhuǎn)錄組分析策略進行分析咪笑。

10、做完轉(zhuǎn)錄組之后一定要進行Q-PCR驗證么娄涩?一般驗證多少個差異基因合適窗怒?

目前來說,Q-PCR驗證是轉(zhuǎn)錄組測序分析必不可少的補充驗證實驗蓄拣,發(fā)文章必須扬虚。一般驗證15-20個差異基因比較合適。

11球恤、Q-PCR與轉(zhuǎn)錄組測序結(jié)果的吻合度一般多高是合適的辜昵?為什么會出現(xiàn)不吻合的現(xiàn)象?

Q-PCR與有參轉(zhuǎn)錄組分析結(jié)果的吻合度在80%以上咽斧;Q-PCR與無參轉(zhuǎn)錄組分析結(jié)果的吻合度在70%以上堪置。

出現(xiàn)結(jié)果不吻合現(xiàn)象的原因如下:實驗所用樣本弄混;沒有使用與轉(zhuǎn)錄組測序同一批的樣本進行Q-PCR驗證张惹;挑選的基因表達量較低或差異不顯著舀锨。

12、轉(zhuǎn)錄組測序的后續(xù)補充分析有哪些宛逗?

做完轉(zhuǎn)錄組測序可以考慮以下分析內(nèi)容做為補充坎匿,用于提高文章檔次和深度。

可變剪接的深入分析(對生信基礎要求較高)

基因家族分析(基因家族分析發(fā)SCI-多拧额、快碑诉、好彪腔、式慕酢!)藍字為鏈接可點擊

WGCNA分析(你距離SCI文章只差一個WGCNA分析)藍字為鏈接可點擊

其他分析(參考其他人的高分文章德挣,整理自己的個性化分析思路)

13恭垦、有參轉(zhuǎn)錄組測序分析的結(jié)果文件中有全部基因的cds序列么?在哪個文件中?

一般來說結(jié)果文件中有全部基因的cds序列番挺。我公司有參轉(zhuǎn)錄組分析結(jié)果中的基因cds序列信息位于Gene_Func_Anno文件夾下面的NewGene中的All.longest_transcript.fa文件里唠帝。

14、轉(zhuǎn)錄組測序分析常用的數(shù)據(jù)庫有哪些玄柏?重點關注哪些注釋信息襟衰?

Nr:NCBI非冗余蛋白數(shù)據(jù)庫,包含的信息很全面,?注釋到的基因較多粪摘。

COG?:中文釋義即“同源蛋白簇”瀑晒。COG?分為兩類,一類是原核生物的徘意,另一類是真核生物苔悦。原核生物的一般稱為?COG?數(shù)據(jù)庫;真核生物的一般稱為?KOG?數(shù)據(jù)庫椎咧。

SWISS-PROT:經(jīng)過注釋的蛋白質(zhì)序列數(shù)據(jù)庫玖详,數(shù)據(jù)庫中的蛋白質(zhì)的功能經(jīng)過了試驗驗證,注釋是精確的勤讽;

TrEMBL:數(shù)據(jù)庫全稱“Translation of EMBL”蟋座,是從EMBL中的cDNA序列翻譯得到的,其中TrEMBL收錄的是未經(jīng)人工注釋的編碼DNA序列翻譯數(shù)據(jù)地技;

KEGG:翻譯成中文是京都基因與基因組百科全書蜈七,是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫莫矗,旨在揭示生命現(xiàn)象的遺傳與化學藍圖飒硅。它是由人工創(chuàng)建的一個知識庫,KEGG數(shù)據(jù)庫最優(yōu)的地方在于擁有描繪已知通路的代謝通路圖作谚。另外KEGG中有一個“專有名詞”KO(KEGG Orthology)三娩,它是蛋白質(zhì)(酶)的一個分類體系,序列高度相似妹懒,并且在同一條通路上有相似功能的蛋白質(zhì)被歸為一組雀监,然后打上KO(或K)標簽,一般用字母K后面加5個數(shù)字表示眨唬。KEGG_ID?是pathway的ID会前,表示方法是2-4個字母,后面跟上5個數(shù)字匾竿;

GO(gene ontology):是基因本體聯(lián)合會(Gene Onotology Consortium)所建立的數(shù)據(jù)庫瓦宜,旨在建立一個適用于各種物種的,對基因和蛋白質(zhì)功能進行限定和描述的數(shù)據(jù)庫岭妖。按照三大類別BP(生物學過程)临庇、 MF((分子功能)反璃、CC(細胞組分)對基因的產(chǎn)物-蛋白質(zhì)進行了分類,并能隨著研究不斷深入而更新的語言詞匯標準假夺。在GO數(shù)據(jù)庫中淮蜈,本質(zhì)上是一個有向無環(huán)圖的數(shù)據(jù)結(jié)構(gòu),在三大類別之下已卷,又有小的分類層級梧田,一層一層的分類下去。對于某個具體的GO號來說侧蘸,代表一組同源蛋白柿扣,擁有相似的結(jié)構(gòu)和功能;

Pfam:是一個被廣泛使用的蛋白家族數(shù)據(jù)庫闺魏,它有兩個數(shù)據(jù)庫未状,高質(zhì)量,手工確定的Pfam-A析桥,自動注釋的Pfam-B數(shù)據(jù)庫司草。

15、差異分析的篩選標準默認是多少泡仗?是固定不變的么埋虹?

差異分析的篩選標準默認為:Fold Change≥2且FDR<0.01。篩選條件要靈活娩怎,要根據(jù)情況進行參數(shù)調(diào)整搔课,數(shù)據(jù)是死的,人是活的截亦,要靈活變通爬泥。

16、unigene和轉(zhuǎn)錄本的區(qū)別崩瓤?

unigene是轉(zhuǎn)錄本的子集袍啡。首先通過triniy組裝出來的視為轉(zhuǎn)錄本,然后挑選最長的一條轉(zhuǎn)錄本作為unigene却桶。

17境输、差異基因太多,注釋信息太雜亂颖系,怎么挑選目標基因嗅剖?

可以根據(jù)KEGG和GO富集分析結(jié)果,挑選富集程度較高的代謝通路和GO terms嘁扼,進而查看相關的差異基因信粮;

對不同的差異組合進行維恩圖分析,挑選共有或者特有的差異基因作為后續(xù)的研究對象偷拔;

根據(jù)前人的文獻報道蒋院,挑選相關差異基因,不要局限在自己研究的物種上莲绰。

18欺旧、為什么原核物種只能做有參轉(zhuǎn)錄組分析?

由于原核生物的基因組中存在大量基因重疊區(qū)域蛤签、操縱子及多順反子辞友,如果按照無參轉(zhuǎn)錄組分析策略進行組裝的話,難度較大震肮,組裝結(jié)果存在較大風險称龙。

19、差異基因數(shù)目多少比較合理戳晌?

不同的處理鲫尊,不同的研究目標,差異基因的數(shù)目是不同的沦偎,從幾十個到幾千個都有可能疫向。但是如果差異基因數(shù)目是個位數(shù)或者上萬,那么就需要和分析人員溝通一下豪嚎,查一查是否有問題搔驼。

20、組學生物的轉(zhuǎn)錄組分析結(jié)果與其他公司的區(qū)別在哪里侈询?

我們的標準分析在不斷更新舌涨,盡量做到國內(nèi)做全;

后期個性化分析速度快扔字,質(zhì)量好囊嘉,沒有大公司的拖延癥;

針對初學者革为,我們精心制作了配套的轉(zhuǎn)錄組分析結(jié)果解讀教程(藍字為鏈接可點擊)哗伯,確保您能看懂分析結(jié)果。

您可以掃描下方二維碼篷角,關注我們組學大講堂公眾號焊刹,然后公眾號對話框內(nèi)發(fā)送“轉(zhuǎn)錄組報告”獲取有參轉(zhuǎn)錄組測序分析結(jié)題報告

更多生物信息課程:

1.?文章越來越難發(fā)恳蹲?是你沒發(fā)現(xiàn)新思路虐块,基因家族分析發(fā)2-4分文章簡單快速,學習鏈接:基因家族分析實操課程嘉蕾、基因家族文獻思路解讀

2.?轉(zhuǎn)錄組數(shù)據(jù)理解不深入贺奠?圖表看不懂?點擊鏈接學習深入解讀數(shù)據(jù)結(jié)果文件错忱,學習鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀儡率;轉(zhuǎn)錄組(無參)結(jié)果解讀

3.?轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA挂据,提升你的文章檔次,學習鏈接:WGCNA-加權基因共表達網(wǎng)絡分析

4.?轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘儿普?學習鏈接:轉(zhuǎn)錄組標準分析后的數(shù)據(jù)挖掘崎逃、轉(zhuǎn)錄組文獻解讀

5.?微生物16S/ITS/18S分析原理及結(jié)果解讀OTU網(wǎng)絡圖繪制眉孩、cytoscape與網(wǎng)絡圖繪制課程

6.?生物信息入門到精通必修基礎課个绍,學習鏈接:linux系統(tǒng)使用perl入門到精通浪汪、perl語言高級巴柿、R語言畫圖

7.?醫(yī)學相關數(shù)據(jù)挖掘課程,不用做實驗也能發(fā)文章死遭,學習鏈接:TCGA-差異基因分析广恢、GEO芯片數(shù)據(jù)挖掘GSEA富集分析課程呀潭、TCGA臨床數(shù)據(jù)生存分析袁波、TCGA-轉(zhuǎn)錄因子分析TCGA-ceRNA調(diào)控網(wǎng)絡分析

8.其他課程鏈接:二代測序轉(zhuǎn)錄組數(shù)據(jù)自主分析蜗侈、NCBI數(shù)據(jù)上傳篷牌、二代測序數(shù)據(jù)解讀

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末踏幻,一起剝皮案震驚了整個濱河市枷颊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌该面,老刑警劉巖夭苗,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異隔缀,居然都是意外死亡题造,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門猾瘸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來界赔,“玉大人,你說我怎么就攤上這事牵触』吹浚” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵揽思,是天一觀的道長袜腥。 經(jīng)常有香客問我,道長钉汗,這世上最難降的妖魔是什么羹令? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任鲤屡,我火速辦了婚禮,結(jié)果婚禮上福侈,老公的妹妹穿的比我還像新娘酒来。我一直安慰自己,他們只是感情好癌刽,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著尝丐,像睡著了一般显拜。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上爹袁,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天远荠,我揣著相機與錄音,去河邊找鬼失息。 笑死譬淳,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的盹兢。 我是一名探鬼主播邻梆,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼绎秒!你這毒婦竟也來了浦妄?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤见芹,失蹤者是張志新(化名)和其女友劉穎剂娄,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體玄呛,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡阅懦,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了徘铝。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片耳胎。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖惕它,靈堂內(nèi)的尸體忽然破棺而出场晶,到底是詐尸還是另有隱情,我是刑警寧澤怠缸,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布诗轻,位于F島的核電站,受9級特大地震影響揭北,放射性物質(zhì)發(fā)生泄漏扳炬。R本人自食惡果不足惜吏颖,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望恨樟。 院中可真熱鬧半醉,春花似錦、人聲如沸劝术。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽养晋。三九已至衬吆,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間绳泉,已是汗流浹背逊抡。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留零酪,地道東北人冒嫡。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像四苇,于是被迫代替她去往敵國和親孝凌。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容