眾所周知谍婉,全基因組關聯(lián)分析(GWAS)發(fā)現(xiàn)的很多變異位點基本為非編碼稚字,這些變異位點1)要么調控基因表達(eQTL); 2)要么影響增強子活性; 3)要么影響轉錄因子(TF)結合特異性; 4)要么啥也不是圾浅。
針對以上四種情況:
1)是否調控基因表達(eQTL)可通過GTEx(https://gtexportal.org/home/)查詢臭笆。
2)是否影響增強子活性可通過之前的推文查詢:感興趣的SNP/區(qū)域上是否有增強子/轉錄因子材诽?增強子/轉錄因子調控哪個靶基因键闺?(EnhancerDB)
3)是否影響轉錄因子(TF)結合特異性則可通過今天介紹的數(shù)據(jù)庫進行查詢:GVATdb(http://renlab.sdsc.edu/GVATdb/search.html)
上周Nature發(fā)了一篇文獻Systematic analysis of binding of transcription factors to noncoding variants
渤昌。
該文獻針對95,886個常見變異位點(SNPs,歐洲和亞洲人群的MAF> 1%)與270個轉錄因子的結合特異性進行了大量的SNP-SELEX實驗虽抄,并以此構建了GVATdb數(shù)據(jù)庫。
下圖是針對轉錄因子或者SNP位點進行檢索的實驗結果圖:
每列的釋義如下:
oligo_auc:轉錄因子與40bp DNA 序列的結合得分, 用AUC(Area under Curve)值表示独柑;
oligo_pval:對OBS進行25,000次蒙特卡洛隨機化后得到的p值迈窟。p<0.05表示TF與基因組片段的特異性“結合”;
Alt:SNP(hg19)的替代等位基因忌栅;
Ref:SNP(hg19)的參考等位基因车酣;
ref_auc:ref 與 TF 的結合得分曲稼;
alt_auc:alt 與 TF 的結合得分;
pbs:結合傾向性得分湖员,公式為:Ref 等位基因得分減去 Alt 等位基因得分贫悄,負值表示轉錄因子更傾向于結合 Alt 等位基因;
p-value:對 PBS 進行25,000次蒙特卡洛隨機化后得到的 p 值娘摔。 p<0.01 表示 TF 與 Ref 等位基因和 Alt 等位基因結合“存在差異”窄坦。
此外,對于沒有納入 SNP-SELEX 實驗的 SNP 位點凳寺,作者還建立了 deltaSVM 模型鸭津,用于預測未納入的 SNP 位點與 TF 的結合特異性,如下圖所示:
參考文獻:Yan J, Qiu Y, Dos Santos A M R, et al. Systematic analysis of binding of transcription factors to noncoding variants[J]. Nature, 2021: 1-5.
由于這個網(wǎng)站相當簡單易懂肠缨,本次推文就不多介紹啦逆趋,祝各位周末愉快~