在對動植物雜交種(或F1子代)的基因組和轉(zhuǎn)錄組的關(guān)聯(lián)研究中脯颜,要回答這么一個問題:基因組變異到底與基因表達(dá)有什么關(guān)系苟蹈?
這個問題很難避乏,因?yàn)樯婕坝绊懟虮磉_(dá)調(diào)控的因素可太多了探橱!多少科研人員圍繞著這個問題研究畢生捂齐。
但不可避免的要做等位基因特異性表達(dá)(allele-specific expression, ASE)和基因表達(dá)順反式調(diào)控的相關(guān)研究蛮放。
我因?yàn)槭状谓佑|這類分析,很窩火奠宜。查閱了一些資料包颁,理解了一些概念,模仿了一些方法压真。記錄整理下要點(diǎn)備忘娩嚼,更希望后來者不要繞路。
1. 主要參考文獻(xiàn)
1) 綜述
中文進(jìn)展:等位基因特異性表達(dá)形成機(jī)制及其應(yīng)用的研究進(jìn)展
Cis/trans:The evolution of gene expression in cis and trans
轉(zhuǎn)錄調(diào)控在雜種優(yōu)勢中的作用:The Role of Transcriptional Regulation in Hybrid Vigor
變異與表達(dá):Molecular and evolutionary processes generating variation in gene expression滴肿;解讀版:【NRG綜述】分子和演化過程在基因表達(dá)中引發(fā)的變異
看完這些岳悟,基本了解了概念。
2)研究和方法
水稻PNAS——張啟發(fā)泼差、刑鋒
無代碼贵少,自創(chuàng)的方法(SNP歸并到gene level),較難復(fù)制堆缘。只研究了ASE滔灶,未研究cis/trans。
解讀版:等位基因不平衡表達(dá)與水稻雜種優(yōu)勢宽气;華中農(nóng)業(yè)大學(xué)在雜種優(yōu)勢機(jī)理研究取得新進(jìn)展
后續(xù)相同方法研究了甲基化對ASE的影響:
棉花NC——胡冠菁、包穎
有代碼潜沦,較為友好。cis/trans分類費(fèi)解绪氛,有點(diǎn)繞唆鸡,要好好閱讀理解后就好了。
Unraveling cis and trans regulatory evolution during cotton domestication枣察;
解讀版:Nature Commun. | 曲阜師范大學(xué)包穎團(tuán)隊(duì)揭示陸地棉馴化過程中的調(diào)控進(jìn)化争占;
YouTube GCMonline:CGM 第131期 棉屬多倍化與馴化歷程中的順反式表達(dá)調(diào)控進(jìn)化;
CGM 第 23 期 Polyploidy and duplicated gene regulation, stories of cotton 棉花進(jìn)化那些事兒
Gihub:https://github.com/Wendellab/CisTransRegulation
玉米MP——周鵬序目、Nathan M. Springer
有代碼臂痕,不太好復(fù)制,也有點(diǎn)費(fèi)解猿涨。同時分析了cis/trans和ASE
Dynamic Patterns of Gene Expression Additivity and Regulatory Variation throughout Maize Development
Github:https://github.com/maizeumn/atlas
Gitee:https://gitee.com/orionzhou/demo
玉米順式元件預(yù)測脅迫反應(yīng)PC(有代碼)握童,同一方法新作:
解讀版:【Plant Cell】機(jī)器學(xué)習(xí)叛赚!應(yīng)用順式調(diào)控元件大數(shù)據(jù)預(yù)測玉米的冷熱應(yīng)激反應(yīng)
Github:https://github.com/orionzhou/stress
水生植物蓮Plant Mol Biol——武漢植物園
無代碼澡绩,較簡單稽揭,只研究了ASE,基本參考了棉花文章肥卡。
解讀版:武漢植物園在熱帶蓮和溫帶蓮雜交品種F1組織中的偏向等位基因表達(dá)研究中獲進(jìn)展
土豆JIPB——黃三文
無代碼,只研究了ASE步鉴,分析簡單揪胃,參考了水稻方法。
The multi-omics basis of potato heterosis
看完這些氛琢,你就知道近幾年別人是怎么研究這些東西的喊递。當(dāng)然其他動植物中也有研究的,但要么方法老舊和分析不嚴(yán)謹(jǐn)艺沼,要么發(fā)表的影響力不夠册舞。
個人建議參考以上棉花或玉米的分析方法,發(fā)表有依據(jù)障般,較權(quán)威调鲸。作者友好,有代碼挽荡,不懂可問藐石。
2. 分析要點(diǎn)
1)工具
沒有統(tǒng)一的分析方法,網(wǎng)上有一些工具定拟,但比較舊也不夠權(quán)威于微,再沒有理解的情況下不敢亂用。
https://github.com/pjx1990/as_analysis
https://github.com/Jiaxin-Fan/ASEP
https://github.com/liangjiaoxue/ASEtrans
https://github.com/TheFraserLab/ASEr
https://github.com/bmvdgeijn/WASP
https://github.com/evodify/allele-specific-expression
https://github.com/haojingshao/ASE-pipeline
https://github.com/dorolin/PybridASE
https://github.com/sanderslhc/Allele-Specific-Expression
https://github.com/edsgard/geneiase
其實(shí)得到轉(zhuǎn)錄組的vcf文件后青自,利用bcftools提取每個樣本的兩個等位基因的reads count(AD屬性)株依,或者GATK的 ASEReadCounter也可得到SNP水平的等位基因reads矩陣。
但經(jīng)測試延窜,bcftools提取出的reads和gatk做的結(jié)果還是有所不同恋腕,沒有去找具體的原因和差異大小。最好還是用gatk來做逆瑞。
SNP的reads count最終要?dú)w并到gene level荠藤,一般取和(或均值),再進(jìn)行檢驗(yàn)获高,可用DESeq2或卡方檢驗(yàn)哈肖。張啟發(fā)水稻的文章是分gene內(nèi)的SNP來做的,這樣不太方便跟cis/trans以及遺傳模式等比較念秧。
現(xiàn)在的ASE或者cis/trans沒有比較規(guī)范的流程淤井,大家都用自己創(chuàng)立的理論和方法。對于對本領(lǐng)域不熟悉的研究者建議還是借鑒別人權(quán)威發(fā)表的方法。
2)概念理解
ASE和順反式調(diào)控的關(guān)系庄吼?
ASE詞本身指代F1中的表達(dá)缎除,但是現(xiàn)在ASE一般指順反式研究的分析方法(另外一種是eQTL),是需要同時考慮親本間差異和F1中等位基因差異总寻,將二者進(jìn)行比較區(qū)分順反類別器罐。早期的文章很多只考慮F1但不看親本(即認(rèn)為ase只是順式調(diào)控的結(jié)果),可以提cis但是不夠精細(xì)嚴(yán)謹(jǐn)渐行,最近的工作應(yīng)該比較少見了轰坊。個人覺得,如果做了更為具體的cis/trans分析祟印,ase就沒必要提了肴沫。
ASE或Cis/trans與雜種優(yōu)勢的關(guān)系?
等位基因特異性表達(dá) (ASE)與起源效應(yīng)的親本密切相關(guān)蕴忆,并受cis/trans復(fù)雜相互作用的調(diào)節(jié)颤芬,通常被認(rèn)為在解釋雜種和親本之間的差異方面起著關(guān)鍵作用。具體要根據(jù)數(shù)據(jù)做卡方和Fisher檢驗(yàn)(如棉花的做法)套鹅。
致謝:特別感謝中國農(nóng)科院深圳基因組研究所得胡冠菁老師站蝠!