周二了笛求,新的一周廊移,雖然內(nèi)心一直想躺平糕簿,一直想回家,但是最終還是屈服狡孔,坐起來好好工作懂诗,不知道30歲一事無成算不算就是失敗的人生,人是不是總是在矛盾中前進(jìn)苗膝,也不知道前面有什么殃恒,或許更差,或許有機(jī)遇辱揭。
今天要分享一個(gè)新的內(nèi)容芋类,文章在Single-cell eQTL mapping identifies cell type–specific genetic control of autoimmune disease,2022年4月8日發(fā)表在Science期刊,其中有一些新的內(nèi)容界阁,表達(dá)數(shù)量性狀位點(diǎn)(eQTL),單細(xì)胞和eQTL的聯(lián)合分析胖喳,非常值得一讀和分享泡躯。
首先我們要先了解一下eQTL是什么
表達(dá)數(shù)量性狀位點(diǎn)(expression quantitative trait locus, eQTL)是一類能夠影響基因表達(dá)量的遺傳位點(diǎn)(大部分都是單核苷酸多態(tài)性,SNP)丽焊,具有一定的生物學(xué)意義较剃。迄今為止最全的eQTL數(shù)據(jù)庫是GTEx(https://www.gtexportal.org/home/),如今已更新到第八版了技健。
一般而言写穴,eQTL主要分為兩類:(1)順式eQTL(cis-eQTL):它主要是指與所調(diào)控基因相距較近的eQTL,一般多位于所調(diào)控基因的上下游1Mb區(qū)域雌贱;(2)反式eQTL(trans-eQTL):與cis-eQTL恰恰相反啊送,反式是指距離所調(diào)控基因位置比較遠(yuǎn)的eQTL,有時(shí)候距離甚至超過5Mb欣孤。因此馋没,對于eQTL分析而言,我們通常需要考慮兩點(diǎn)降传,SNP和基因表達(dá)水平的關(guān)聯(lián)度以及SNP與基因的距離篷朵。
還有一個(gè)概念,連鎖不平衡
連鎖不平衡 (linkage disequilibrium)是指分屬兩個(gè)或兩個(gè)以上基因座位的等位基因同時(shí)出現(xiàn)在一條染色體上的幾率婆排,高于隨機(jī)出現(xiàn)的頻率声旺。HLA 不同基因座位的各等位基因在人群中以一定的頻率出現(xiàn)。簡單地說段只,只要兩個(gè)基因不是完全獨(dú)立地遺傳腮猖,就會(huì)表現(xiàn)出某種程度的連鎖。這種情況就叫連鎖不平衡赞枕。連鎖不平衡可以是同一條染色體上的不同區(qū)域缚够,也可以是不同染色體上的幔妨。
在這個(gè)基礎(chǔ)上,我們要開始內(nèi)容的解析了谍椅。
INTRODUCTION
人類的免疫系統(tǒng)已經(jīng)進(jìn)化到通過調(diào)節(jié)專門的細(xì)胞群體來維持組織穩(wěn)態(tài)和靶向外源性病原體误堡。它在不同個(gè)體之間顯示出巨大的差異,決定了人們對疾病易感性和對病原體或癌癥的反應(yīng)是如何不同雏吭。
在單細(xì)胞分辨率的數(shù)據(jù)生成過程中锁施,科學(xué)家們對遺傳差異如何在細(xì)胞水平上促進(jìn)免疫變異的認(rèn)識(shí)受到兩個(gè)主要挑戰(zhàn)的限制。其中的一個(gè)挑戰(zhàn)是對許多人進(jìn)行測序杖们,另一個(gè)挑戰(zhàn)是對每個(gè)人的大量細(xì)胞進(jìn)行測序悉抵。解決這些挑戰(zhàn)對于剖析常見異質(zhì)性疾病的遺傳和分子基礎(chǔ)是必要的。
RATIONALE
對遺傳差異如何導(dǎo)致細(xì)胞水平的免疫變異的了解受到單細(xì)胞分辨率數(shù)據(jù)生成中的兩個(gè)主要挑戰(zhàn)的限制摘完。 這些挑戰(zhàn)之一是對許多個(gè)體進(jìn)行測序姥饰,另一個(gè)是對來自每個(gè)個(gè)體的a large number of cells進(jìn)行測序。 解決這些挑戰(zhàn)對于剖析常見的異質(zhì)性疾病的遺傳和分子基礎(chǔ)是必要的孝治。
RESULTS(雜志SCIENCE的排版還是很不一樣的)
分析了 OneK1K 隊(duì)列列粪,該隊(duì)列由來自 982 名供體的 127 萬個(gè)外周血mononuclear cells (PMBC) 的單細(xì)胞 RNA 測序 (scRNAseq) 數(shù)據(jù)組成。作者開發(fā)了一個(gè)細(xì)胞分類框架谈飒,并通過結(jié)合scRNA-seq數(shù)據(jù)和基因型數(shù)據(jù)岂座,繪制了14種免疫細(xì)胞類型中每種類型的基因表達(dá)的遺傳效應(yīng),并確定了26597個(gè)獨(dú)立的順式表達(dá)數(shù)量性狀基因座(eQTL)杭措。發(fā)現(xiàn)其中的大多數(shù)eQTL對基因表達(dá)的等位基因效應(yīng)是細(xì)胞類型特異的费什。結(jié)果在兩個(gè)獨(dú)立的隊(duì)列中得到了重現(xiàn),其中的一個(gè)隊(duì)列由與他們的發(fā)現(xiàn)隊(duì)列不同血統(tǒng)的個(gè)體組成手素。在所有的基因座上鸳址,發(fā)現(xiàn)隊(duì)列和重現(xiàn)隊(duì)列在不同免疫細(xì)胞類型中的等位基因方向的一致性在72.2至98.1%之間。
在主要組織相容性復(fù)合體 (MHC) 區(qū)域外的每個(gè)基因座上使用top相關(guān)的 eQTL 單核苷酸多態(tài)性 (eSNP)泉懦,確定了 990 種反式作用效應(yīng)氯质,其中大多數(shù) (63.6%) 是細(xì)胞類型特異性的。分析展示了 eQTL 如何在 B 細(xì)胞中具有動(dòng)態(tài)等位基因效應(yīng)祠斧,這些 B 細(xì)胞正在從幼稚狀態(tài)過渡到記憶狀態(tài)闻察。總體而言琢锋,確定了一組 1988 個(gè) eSNP-eGene(具有 eQTL 的基因)對在 B 細(xì)胞成熟環(huán)境中表達(dá)辕漂,其中 333 個(gè)在 B 細(xì)胞分化時(shí)的等位基因效應(yīng)具有統(tǒng)計(jì)學(xué)意義的變化。其中吴超,66% 僅通過動(dòng)態(tài) eQTL 分析確定钉嘹,并且在獨(dú)立測試細(xì)胞類型的影響時(shí)未觀察到,這突出了研究作為免疫細(xì)胞功能基礎(chǔ)的細(xì)胞狀態(tài)特異性影響的重要性鲸阻。這里研究了 eQTLs 如何影響特定細(xì)胞類型中必需免疫基因的表達(dá)變化跋涣,并為復(fù)雜自身免疫疾病中細(xì)胞機(jī)制的既定假設(shè)提供實(shí)驗(yàn)支持缨睡。
最后,整合了七種常見自身免疫性疾病的遺傳關(guān)聯(lián)數(shù)據(jù)陈辱,并確定了以細(xì)胞類型特異性方式運(yùn)作的遺傳效應(yīng)的顯著富集奖年。 通過單細(xì)胞 eQTL 和全基因組關(guān)聯(lián)研究 (GWAS) 基因座的共定位,發(fā)現(xiàn) 19% 的 cis-eQTLs 與 GWAS 風(fēng)險(xiǎn)關(guān)聯(lián)具有相同的因果基因座沛贪。 使用孟德爾隨機(jī)化方法陋守,揭示了 305 個(gè)基因座通過特定細(xì)胞類型和亞群中基因表達(dá)的變化導(dǎo)致自身免疫性疾病的因果途徑。 在共享的因果位點(diǎn)中利赋,38.4% 位于 MHC 區(qū)域之外水评,并表現(xiàn)出高度的細(xì)胞特異性效應(yīng)。 突出多發(fā)性硬化癥媚送,確定了 57 個(gè)風(fēng)險(xiǎn)位點(diǎn)的因果途徑中燥。 例如,分析表明 3q12 的基因座通過 EAF2 表達(dá)的變化起作用塘偎,但僅在未成熟和幼稚 B (BIN) 和記憶 B (BMem) 細(xì)胞中起作用疗涉,盡管該基因在數(shù)據(jù)中的所有細(xì)胞類型中普遍表達(dá)。
CONCLUSION
這項(xiàng)工作匯集了群體遺傳學(xué)和 scRNA-seq 數(shù)據(jù)式塌,以揭示免疫系統(tǒng)個(gè)體間變異的驅(qū)動(dòng)因素。 研究結(jié)果表明友浸,分離的遺傳變異如何影響以細(xì)胞類型特異性方式編碼參與關(guān)鍵免疫調(diào)節(jié)和信號通路的蛋白質(zhì)的基因的表達(dá)峰尝。 了解免疫系統(tǒng)調(diào)節(jié)的遺傳基礎(chǔ)將對自身免疫性疾病和感染、移植和癌癥的治療產(chǎn)生廣泛影響收恢。
Introduction
免疫細(xì)胞中基因的表達(dá)在個(gè)體之間存在很大差異武学,這種差異既是免疫相關(guān)疾病易感性差異的原因也是結(jié)果。 對免疫調(diào)節(jié)和疾病發(fā)展的潛在遺傳貢獻(xiàn)的調(diào)查發(fā)現(xiàn)了許多相關(guān)的變異伦意。 然而火窒,循環(huán)免疫群體的復(fù)雜性使其作用機(jī)制難以剖析。
將轉(zhuǎn)錄譜與遺傳變異結(jié)合可以直接識(shí)別基因表達(dá)的基因組調(diào)節(jié)因子驮肉。這很重要熏矿,因?yàn)橥ㄟ^全基因組關(guān)聯(lián)研究 (GWAS) 確定的疾病相關(guān)遺傳風(fēng)險(xiǎn)變異,包括與常見免疫介導(dǎo)疾病相關(guān)的變異离钝,通常被映射到基因組的調(diào)控區(qū)域票编。實(shí)證結(jié)果和理論模型都提供了證據(jù),表明大多數(shù)常見的疾病相關(guān)變異通過基因表達(dá)的變化而不是直接影響蛋白質(zhì)結(jié)構(gòu)或功能起作用卵渴。通過將遺傳信息與bulk RNA 測序 (RNA-seq) 相結(jié)合慧域,疾病相關(guān)遺傳風(fēng)險(xiǎn)因素的下游影響與表達(dá)數(shù)量性狀基因座 (eQTL) 相關(guān)聯(lián)。 GTEx浪读、eQTL-Gen昔榴、CAGE 和 ImmVar 等努力已經(jīng)在各種細(xì)胞類型和組織中鑒定了 eQTL辛藻,但使用了bulk RNAseq 方法,其中基因表達(dá)水平代表bulk細(xì)胞的平均信號互订。這些集合分析的數(shù)據(jù)是有效的吱肌,但單個(gè)細(xì)胞之間的基因表達(dá)異質(zhì)性在很大程度上仍未被探索。
一個(gè)重要的步驟是定義疾病風(fēng)險(xiǎn)單核苷酸多態(tài)性 (SNP) 影響基因表達(dá)水平的細(xì)胞和環(huán)境背景屁奏。這將有助于確定疾病發(fā)展的分子和細(xì)胞機(jī)制岩榆,并為治療策略提供信息。除了注釋個(gè)體疾病關(guān)聯(lián)的能力外坟瓢,細(xì)胞類型特異性 eQTL 還豐富了復(fù)雜性狀的heritability勇边。這很重要,因?yàn)樵S多 eQTL 效應(yīng)是組織特異性的折联,并且熒光激活細(xì)胞分選 (FACS) 和bulk樣本中細(xì)胞類型的計(jì)算去卷積都證明了細(xì)胞類型特異性 eQTL粒褒。盡管這些研究有助于證明遺傳基因座在細(xì)胞亞群中的作用存在差異,但挑戰(zhàn)依然存在诚镰。例如奕坟,F(xiàn)ACS 細(xì)胞群的bulk RNA-seq 偏向于由一組有限的標(biāo)記基因定義的已知細(xì)胞類型。它沒有捕捉到分類群體中的異質(zhì)性清笨。同樣月杉,將bulk信號解卷積為細(xì)胞類型的計(jì)算方法難以識(shí)別不太豐富的細(xì)胞類型并依靠近似值來估計(jì)細(xì)胞比例。相比之下抠艾,單細(xì)胞 RNA 測序 (scRNA-seq) 能夠同時(shí)苛萎、無偏見地確定細(xì)胞組成和細(xì)胞類型特異性基因表達(dá),從而捕獲個(gè)體細(xì)胞內(nèi)的異質(zhì)性检号。
Results
The OneK1K cohort
分析表征了一個(gè)大型隊(duì)列(OneK1K)的循環(huán)免疫細(xì)胞的轉(zhuǎn)錄變異腌歉,以探索等位基因變異如何以細(xì)胞類型特異性方式與基因表達(dá)變化相關(guān)聯(lián)。 OneK1K 隊(duì)列由 982 名北歐血統(tǒng)的個(gè)體組成齐苛,他們在樣本收集時(shí)報(bào)告沒有活動(dòng)性感染翘盖。 研究生成了 759,993 個(gè) SNP 的基因型數(shù)據(jù),并根據(jù) Haplotype Reference Consortium 小組估算了 SNP凹蜂。 質(zhì)量控制后馍驯,保留了 5,328,917 個(gè) SNP,次要等位基因頻率大于 0.05玛痊。 分析使用pooled multiplexing strategy.生成了 1,449,385 個(gè)外周血細(xì)胞 (PBMC) 的 scRNA-seq 數(shù)據(jù)泥彤。 在demultiplexing、去除雙細(xì)胞和質(zhì)量控制后卿啡,保留了 1,267,758 個(gè)細(xì)胞用于進(jìn)一步分析吟吝。
Classification of individual cells
作者開發(fā)了一個(gè)框架,根據(jù)它們的轉(zhuǎn)錄譜將每個(gè)細(xì)胞獨(dú)立地分類為跨越骨髓和淋巴譜系的 14 種不同免疫細(xì)胞類型之一颈娜。這個(gè)框架在 scPred 中實(shí)現(xiàn)剑逃,使用分層監(jiān)督和非監(jiān)督分類方法的組合浙宜,使用 FACS 排序的 PBMC scRNA-seq 數(shù)據(jù)作為參考。細(xì)胞組成范圍從 0.7% 的樹突狀細(xì)胞 (DC) 到 36.6% 的 CD4+ 幼稚和中央記憶 T (CD4NC) 細(xì)胞蛹磺,其平均比例和比例范圍與其他地方報(bào)道的相匹配粟瞬。使用統(tǒng)一流形近似和投影 (UMAP) 對細(xì)胞類型進(jìn)行可視化反映了這些細(xì)胞類型之間的層次關(guān)系,前兩個(gè)主要成分的細(xì)胞坐標(biāo)也支持這種關(guān)系萤捆。使用其完整的轉(zhuǎn)錄譜對細(xì)胞進(jìn)行分類裙品。盡管如此,為了幫助對其他研究進(jìn)行解釋俗或,我們與典型標(biāo)記和其他單細(xì)胞測序研究的表達(dá)模式保持一致市怎。
批次校正后,沒有發(fā)現(xiàn)capture pools中細(xì)胞身份辛慰、轉(zhuǎn)錄特征或細(xì)胞比例發(fā)生變化的證據(jù)区匠。 對每個(gè)供體平均測序了 1291 個(gè)細(xì)胞。 盡管大多數(shù)個(gè)體擁有所有 14 種細(xì)胞類型的 scRNA-seq 數(shù)據(jù)帅腌,但由于抽樣差異驰弄,一些細(xì)胞類型 [主要是表達(dá) SOX4 的 CD4+ T 細(xì)胞(CD4SOX4 細(xì)胞)、漿細(xì)胞和非經(jīng)典單核細(xì)胞(MonoNC)] 在一些個(gè)體中沒有被檢測到速客。 因此戚篙,對于后續(xù)分析,eQTL 分析的樣本量因細(xì)胞類型而異溺职,盡管 14 個(gè)群體中有 12 個(gè)的 n>930岔擂。
Single-cell eQTL analysis reveals cell-type specificity of transcriptional changes that occur because of common variants
為了了解個(gè)體之間的遺傳變異如何以特定于細(xì)胞類型的方式影響基因表達(dá),在 14 種細(xì)胞類型中的每一種中測試了基因任一端的 1-Mb 順式區(qū)域內(nèi) SNP 基因型(包括基因體)與基因表達(dá)之間的關(guān)聯(lián)辅愿。 這種方法可以識(shí)別每種細(xì)胞類型中的 eQTL智亮,能夠評估基因表達(dá)的遺傳效應(yīng)在 PBMC 之間共享的程度忆某。 由于連鎖不平衡誘導(dǎo)的基因型與與基因表達(dá)水平相關(guān)的眾多獨(dú)立基因座之間的相關(guān)性点待,順式區(qū)域內(nèi)的多個(gè)SNP可能與基因表達(dá)相關(guān)。 為了區(qū)分這些scenarios弃舒,對每個(gè)已識(shí)別的 eQTL 進(jìn)行了條件分析癞埠,將識(shí)別的 eQTL SNP(s) [eSNP(s)] 擬合為隨后幾輪分析中的條件協(xié)變量。
總的來說聋呢,為 39.7% 的測試基因確定了 26,597 個(gè) eQTL苗踪,其中 16,597 個(gè)(eSNP1)在第一輪分析中,另外 10,000 個(gè)(eSNP2 到 eSNP5)來自四輪條件測試削锰。 independent eQTL 的數(shù)量因細(xì)胞類型而異通铲,在 CD4NC 細(xì)胞中鑒定出 6473 個(gè),在漿細(xì)胞中鑒定出 399 個(gè)器贩。 每種細(xì)胞類型確定的 eQTL 數(shù)量的這種變化可能是統(tǒng)計(jì)功效的函數(shù)颅夺。 細(xì)胞比例與具有可識(shí)別細(xì)胞的個(gè)體數(shù)量之間存在密切關(guān)系朋截。 conditional eQTL 分析確定了 8.1% 至 19.2% 的基因中影響表達(dá)的次要位點(diǎn),其中 10.6% 至 40.6% 的基因具有初始 eQTL 和三個(gè)以上獨(dú)立的 eQTL吧黄。
這些條件性 eQTL 識(shí)別出順式區(qū)域內(nèi)存在多個(gè)獨(dú)立基因座的實(shí)例部服,其基因型與基因的表達(dá)水平相關(guān)。例如拗慨,在 CD4NC 細(xì)胞中廓八,確定了 PADI4 的主要 eQTL。該基因編碼一種酶赵抢,該酶負(fù)責(zé)將精氨酸殘基轉(zhuǎn)化為瓜氨酸殘基剧蹂,從而調(diào)節(jié)組蛋白 H1 的活性,從而維持干細(xì)胞的維持昌讲。 PADI4 在遺傳和細(xì)胞水平上都與類風(fēng)濕性關(guān)節(jié)炎 (RA) 的發(fā)病機(jī)制有關(guān)国夜。該 eQTL 的top eSNP1 是 rs10788663,其中每個(gè) T 等位基因拷貝導(dǎo)致每個(gè)細(xì)胞平均減少 0.28 個(gè) mRNA 轉(zhuǎn)錄分子短绸。在隨后的一輪條件分析中车吹,將 rs10788663 擬合為協(xié)變量,并再次測試了跨 cis 區(qū)域的關(guān)聯(lián)醋闭,確定了由top eSNP2 rs1612843 標(biāo)記的次要獨(dú)立 eQTL窄驹。平均而言,攜帶 rs1612843 的 C 等位基因的每個(gè)拷貝的個(gè)體每個(gè)細(xì)胞減少 0.24 個(gè) mRNA 轉(zhuǎn)錄分子证逻。 rs10788663 位于第一個(gè)內(nèi)含子乐埠,而 rs1612843 位于 PADI4 外顯子 15 和 16 之間的內(nèi)含子,這表明獨(dú)立的轉(zhuǎn)錄因子可能調(diào)節(jié)多個(gè)獨(dú)立的位點(diǎn)囚企,并且是調(diào)節(jié) PADI4 表達(dá)所必需的丈咐。在 OneK1K 隊(duì)列中,rs10788663 和 rs1612843 之間的連鎖不平衡為 0.0678龙宏,進(jìn)一步證明多個(gè)獨(dú)立的 eQTL 影響 CD4NC 細(xì)胞中 PADI4 的表達(dá)棵逊。
基因位點(diǎn)對基因表達(dá)的等位基因效應(yīng)可能對特定細(xì)胞類型是獨(dú)特的,而在其他細(xì)胞類型中不存在——我們將這種關(guān)系定義為“細(xì)胞類型特異性”银酗。通過調(diào)查其他細(xì)胞類型中 cis-eQTLs 的零分布的測試統(tǒng)計(jì)偏差來探索其普遍性辆影,這些細(xì)胞類型最初不符合研究范圍的意義。在一種細(xì)胞類型中鑒定的 cis-eQTLs 在另一種細(xì)胞類型中顯示其測試統(tǒng)計(jì)數(shù)據(jù)膨脹的平均比例為 Π1 = 0.53(0.19 至 0.96)黍特。證據(jù)表明蛙讥,隨著樣本量的增加,目前在單個(gè)細(xì)胞類型中鑒定的 cis-eQTL 應(yīng)該在一種或多種其他細(xì)胞類型中達(dá)到研究范圍的意義灭衷。然而次慢,它們的等位基因效應(yīng)的大小可能因細(xì)胞類型而異。對于僅在單個(gè)細(xì)胞類型中鑒定的具有 eQTL (eGenes) 的 3060 個(gè)基因,沒有發(fā)現(xiàn)其他細(xì)胞類型中等位基因效應(yīng)的任何證據(jù)迫像,這表明這些確實(shí)是細(xì)胞類型特異性的拭抬。對細(xì)胞類型特異性 eQTL 的觀察有多種可能的解釋:該基因可能僅在一種細(xì)胞類型中可檢測到表達(dá),在多種細(xì)胞類型中檢測 eQTL 的統(tǒng)計(jì)能力可能較低侵蒙,或者跨細(xì)胞類型存在真正的調(diào)控異質(zhì)性造虎。
為了評估這些不同的情況,對具有至少一個(gè) eQTL (eGene n = 6469) 的每個(gè)基因進(jìn)行了一系列分析纷闺。這些 eGene 中只有 43 個(gè) (0.7%) 以單一細(xì)胞類型表達(dá)算凿。剩下的 6426 個(gè)在多種細(xì)胞類型中表達(dá),這些基因在平均 11 種細(xì)胞類型中表達(dá)犁功,除了具有顯著 eQTL 的一種氓轰。事實(shí)上,當(dāng)測試這 6426 個(gè) eGene 中每一個(gè)的表達(dá)水平在一對細(xì)胞類型之間的相關(guān)性時(shí)浸卦,發(fā)現(xiàn)共表達(dá)的總體一致性很高署鸡。幾種細(xì)胞類型之間eGene表達(dá)水平的平均相關(guān)模式遵循造血譜系關(guān)系。例如限嫌,在僅在 CD4NC 細(xì)胞中發(fā)現(xiàn)的具有 eQTL 的 6473 個(gè) eGene 中靴庆,1392 個(gè)在 CD8+ 幼稚和中央記憶 T (CD8NC) 細(xì)胞中表達(dá),細(xì)胞之間基因表達(dá)的平均相關(guān)性為 0.97怒医。相比之下炉抒,在經(jīng)典單核細(xì)胞 (MonoC) 中,只有 168 個(gè)漿細(xì)胞 eGene 被表達(dá)稚叹,但表達(dá)與漿細(xì)胞的平均相關(guān)性為 0.79焰薄。從這些結(jié)果中,可以得出結(jié)論扒袖,在大多數(shù)情況下塞茅,僅在一種細(xì)胞類型中鑒定出的大多數(shù)具有 eQTL 的 eGene 不是由于 eGene 的細(xì)胞類型特異性表達(dá),而是可能是由于調(diào)節(jié)因子的細(xì)胞類型特異性表達(dá)季率。
對于剩余的 4102 個(gè) eGene野瘦,在兩種或多種細(xì)胞類型中總共鑒定了 14,230 個(gè) eQTL,盡管對于其中的 1386 個(gè) eGene蚀同,觀察到細(xì)胞類型之間存在不同的前導(dǎo) eSNP缅刽。在這種情況下啊掏,一個(gè)假設(shè)是相同的variant是多種細(xì)胞類型中 eQTL 的基礎(chǔ)蠢络,而top eSNP 的差異是由于基因表達(dá)模式的變化。另一種假設(shè)是迟蜜,eQTLs 是由影響不同細(xì)胞類型表達(dá)的獨(dú)立variant產(chǎn)生的刹孔。為了在這些假設(shè)之間進(jìn)行測試,執(zhí)行了回歸策略來評估在從另一種細(xì)胞類型中回歸 eSNP 的影響后 eSNP 的測試統(tǒng)計(jì)量的變化。在此策略下髓霞,如果 eSNP 標(biāo)記了該基因的相同因果變異或彼此處于連鎖不平衡狀態(tài)卦睹,則原始 eSNP 的等位基因效應(yīng)大小將在條件分析中減小。同樣方库,如果他們標(biāo)記獨(dú)立variant结序,等位基因效應(yīng)將保持相對不變。對 eQTL 的每個(gè)成對組合執(zhí)行了這種策略纵潦,其中在不同的細(xì)胞類型中鑒定了不同的top eSNP徐鹤。
測試了每個(gè) eGene 是否被兩個(gè)不同的variant標(biāo)記,方法是針對每對細(xì)胞類型(182 對)將來自第一種細(xì)胞類型的前導(dǎo) eSNP 調(diào)節(jié)到來自第二種細(xì)胞類型的前導(dǎo) eSNP 上邀层。 來自共享 eGene 預(yù)處理和后處理的顯著獨(dú)立 eSNP 的相關(guān)系數(shù)如下圖D 所示返敬。 雖然大多數(shù)淋巴免疫細(xì)胞eQTL在調(diào)節(jié)后相關(guān)系數(shù)有相當(dāng)大的變化,但在骨髓免疫細(xì)胞中寥院,eQTL相關(guān)系數(shù)保持相似劲赠。 這一發(fā)現(xiàn)表明,淋巴樣細(xì)胞類型更有可能
與骨髓細(xì)胞相比秸谢,共享細(xì)胞類型之間基因表達(dá)的遺傳控制凛澎。
Evidence suggests that cell type–specific chromatin accessibility underlies a proportion of cell type–specific cis-eQTLs
為了探索 cis-eQTLs 的功能調(diào)控,測試了從 8876 個(gè)細(xì)胞的轉(zhuǎn)座酶可及染色質(zhì)測序 (scATACseq) 數(shù)據(jù)的單細(xì)胞測定中產(chǎn)生的 eSNP 位置和開放染色質(zhì)區(qū)域的重疊估蹄。細(xì)胞被分為 14 種細(xì)胞類型中的每一種预厌,對于具有超過 5 個(gè)分類細(xì)胞的每種細(xì)胞類型,都調(diào)用開放染色質(zhì)峰元媚。這種過濾保留了 11 種細(xì)胞類型轧叽,包括最豐富的細(xì)胞群 [除了具有效應(yīng)記憶或中央記憶表型 (CD4ET) 的 CD4+T 細(xì)胞、CD4SOX4 和漿細(xì)胞]刊棕。平均而言炭晒,確定了每種細(xì)胞類型的 52,048 個(gè)峰,eSNP 與最近峰之間的平均距離范圍為 7485 到 31,383 個(gè)堿基對甥角。為了確定 cis-eQTLs 的位置是否顯著接近開放染色質(zhì)區(qū)域网严,比較了 cis-eQTLs 之間的距離。我們隨機(jī)抽樣了 SNPs嗤无,這些 SNPs 是根據(jù)從轉(zhuǎn)錄物到每種細(xì)胞類型最近峰的相同距離分布選擇的bootstrapping technique震束。觀察到除 CD4SOX4 細(xì)胞以外的所有細(xì)胞類型的 cis-eQTL 距離之間存在顯著差異[錯(cuò)誤發(fā)現(xiàn)率 (FDR) < 0.05]。從這些結(jié)果中得出結(jié)論当犯,細(xì)胞類型特異性染色質(zhì)可及性可能導(dǎo)致等位基因?qū)?xì)胞類型之間基因表達(dá)的影響的變化垢村。
Single-cell eQTLs replicate in multiethnic cohorts and bulk eQTL studies
為了驗(yàn)證細(xì)胞特異性 eQTL 發(fā)現(xiàn),我們在隊(duì)列中復(fù)現(xiàn)了主要 eSNP 結(jié)果嚎卫。 在 16,597 個(gè) eSNP1-eGene 對中嘉栓,有 10,071 個(gè)在兩個(gè)隊(duì)列中的次要等位基因頻率均大于 0.05。Of these, 3198 (26%) in the European cohort and 2243 (22%) in the Asian cohort replicated at the FDR threshold of 5%, which is encouraging given the differences between the sample sizes of these cohorts and the sample size of the OneK1K discovery cohort。
事實(shí)上侵佃,在發(fā)現(xiàn)隊(duì)列和復(fù)現(xiàn)隊(duì)列中樣本量相等的假設(shè)下糾正 FDR 分布導(dǎo)致歐洲和亞洲隊(duì)列中的復(fù)現(xiàn)率分別為 87% 和 78%麻昼。同樣,所有測試基因座的等位基因方向的一致性在歐洲隊(duì)列中為 76.0% 至 98.1%馋辈,在亞洲隊(duì)列中為 72.2% 至 95.4%抚芦。對于以 FDR 小于 0.05 復(fù)現(xiàn)的 eQTL,這種一致性分別增加到 99.3 到 100% 和 96.9 到 99.8%迈螟。群組之間復(fù)現(xiàn)率的差異可能反映了人群之間 eSNP 等位基因頻率的差異燕垃。然而,結(jié)果表明井联,細(xì)胞類型特異性 eQTL 很可能在人群中廣泛共享卜壕。 OneK1K eQTLs 的發(fā)現(xiàn)在復(fù)現(xiàn)隊(duì)列中的所有細(xì)胞類型中進(jìn)行了復(fù)現(xiàn)測試。在 FDR 小于 0.05 時(shí)烙常,復(fù)現(xiàn)的 eQTL 和 eGene 主要在單一細(xì)胞類型中鑒定轴捎,為基因座對 PBMC 中基因表達(dá)的細(xì)胞類型特異性影響提供了進(jìn)一步的證據(jù)。對于歐洲和亞洲樣本蚕脏,OneK1K 和復(fù)現(xiàn)隊(duì)列之間的相關(guān)系數(shù)的一致性如下圖 E 所示侦副。能夠復(fù)現(xiàn)來自 eQTL-Gen 聯(lián)盟和 GTEx 聯(lián)盟的血液樣本的bulk RNA-seq 研究中鑒定的 62.5% 和 40.4% 的 ciseQTL。
Identification of dynamic eQTL allelic effects across the B cell landscape
研究了 eQTL 在未成熟和幼稚 B (BIN) 細(xì)胞到記憶 B (BMem) 細(xì)胞的偽時(shí)間landscope中的動(dòng)態(tài)影響驼鞭。 根據(jù)它們在偽時(shí)間曲線上的相對位置秦驯,將細(xì)胞分為六個(gè)quantiles(Q1 到 Q6)。 疊加經(jīng)典標(biāo)記的表達(dá)揭示了從 BIN (Q1) 到 BMem細(xì)胞 (Q6) 的衍生軌跡的分級變化挣棕。 例如译隘,TCL1A 和 IL4R 在幼稚 B 細(xì)胞中高度表達(dá)朽合,并且被發(fā)現(xiàn)在向 BMem 細(xì)胞的過渡過程中被下調(diào)旗闽。 相反黍瞧,CD27(一種典型的 BMem 細(xì)胞標(biāo)記物)的表達(dá)隨著細(xì)胞轉(zhuǎn)變?yōu)橛洃洜顟B(tài)而增加匾嘱。 IgJ 表達(dá)是免疫球蛋白 M (IgM) 和 IgA 產(chǎn)生的標(biāo)志物,在較高的分位數(shù)中上調(diào)闯捎,表明它們含有準(zhǔn)備成為漿細(xì)胞的細(xì)胞妖碉。
分析試圖確定 eQTL 等位基因效應(yīng)在幼稚到記憶 B 細(xì)胞轉(zhuǎn)變的軌跡上表現(xiàn)出線性或非線性變化的實(shí)例忽肛。動(dòng)態(tài) B 細(xì)胞 eQTL 是通過使用線性和二次模型測試基因型和分位數(shù)等級之間的相互作用來確定的法严。 在 BIN 和 BMem 細(xì)胞中鑒定的 3074 個(gè) cis-eQTLs 中损敷,1988 個(gè)在至少三個(gè)偽時(shí)間分位數(shù)中表達(dá)并測試了動(dòng)態(tài)效應(yīng)。 其中深啤,確定了其中 333 個(gè)軌跡的等位基因效應(yīng)發(fā)生了顯著變化(FDR < 0.05)
許多具有動(dòng)態(tài) eQTL 效應(yīng)的基因在微調(diào) B 細(xì)胞遷移拗馒、激活、存活或功能方面發(fā)揮作用墓塌。例如瘟忱,SELL 參與整合素介導(dǎo)的組織遷移。生發(fā)中心內(nèi) B 細(xì)胞的遷移和組織是產(chǎn)生適當(dāng)?shù)挠洃浐腕w液輸出的關(guān)鍵組成部分苫幢。內(nèi)含子variant rs4987360-G 對 SELL 表達(dá)的等位基因效應(yīng)在未成熟細(xì)胞中最大访诱,在隨后的每個(gè)分位數(shù)上都降低。對于影響 Src 家族酪氨酸激酶 B 淋巴細(xì)胞激酶 (BLK) 表達(dá)的 SNP韩肝,發(fā)現(xiàn)了相反的趨勢触菜,該基因負(fù)責(zé)調(diào)節(jié) B 細(xì)胞受體下游信號傳導(dǎo)的幅度。 rs2736336 和 rs2409780 在 Q5 和 Q6 中顯示出最大的等位基因效應(yīng)哀峻。有趣的是涡相,rs2736336 是 BLK 啟動(dòng)子的一個(gè)variant,與系統(tǒng)性紅斑狼瘡 (SLE) 相關(guān)剩蟀,而 rs2409780 是一種內(nèi)含子variant催蝗,與 SLE 和 RA 相關(guān)的變異體處于高度連鎖不平衡[決定系數(shù) (R2) = 0.99 , 和連鎖不平衡系數(shù) (D') = 0.99]。另一個(gè)負(fù)責(zé)解釋 B 細(xì)胞表面受體下游信號傳導(dǎo)并影響后續(xù) B 細(xì)胞增殖和存活的基因是 c-Rel育特,由轉(zhuǎn)錄因子 REL 編碼丙号。 rs12989427 與與 SLE 相關(guān)的variant處于高度連鎖不平衡狀態(tài)(R2 = 0.88 和 D' = 0.98),并且等位基因效應(yīng)遵循非線性關(guān)系缰冤,在 B 細(xì)胞軌跡的中點(diǎn)處達(dá)到峰值犬缨。 ORMDL3 通過抑制細(xì)胞凋亡和促進(jìn)自噬來促進(jìn)成熟 B 細(xì)胞的存活。 rs7359623 和 rs8067378 處于高度連鎖不平衡狀態(tài)棉浸,風(fēng)險(xiǎn)變異(R2 > 0.8 和 D' > 0.9)與一系列自身免疫性疾病有關(guān)怀薛,并且在整個(gè)軌跡上對 B 細(xì)胞中的 ORMDL3 具有動(dòng)態(tài) eQTL 效應(yīng)。
Genetic variation controls transcriptional regulation in a cell type–specific manner to regulate immune pathways
盡管普遍認(rèn)為免疫調(diào)節(jié)在個(gè)體之間存在差異迷郑,但對導(dǎo)致這種差異的因素知之甚少枝恋。 通過選擇文獻(xiàn)中描述的影響免疫調(diào)節(jié)的基因,展示了遺傳基因座如何以細(xì)胞類型特異性方式促成免疫調(diào)節(jié)基因表達(dá)的變化.
血液和淋巴結(jié)之間的白細(xì)胞再循環(huán)是免疫系統(tǒng)的基本特性嗡害。 它依賴于由 SELL 基因編碼的淋巴結(jié)歸巢受體 CD62L(L-選擇素)鼓择。 分析觀察到在 rs4987360 的影響下,先天免疫系統(tǒng)和適應(yīng)性免疫系統(tǒng)之間 SELL mRNA 的相反調(diào)節(jié)就漾,這是與單核細(xì)胞血細(xì)胞計(jì)數(shù)相關(guān)的與 rs4987353(R2 = 1 和 D' = 1)連鎖不平衡中的常見多態(tài)性呐能。 rs4987360-G 等位基因降低了 MonoC 中的 SELL mRNA,但增加了 BIN 細(xì)胞中的 SELL mRNA抑堡,說明了單個(gè)遺傳等位基因如何通過不同的細(xì)胞類型發(fā)揮作用來影響基因表達(dá)摆出。 動(dòng)態(tài) eQTL 分析確定 rs4987360 的等位基因效應(yīng)在 B 細(xì)胞狀態(tài)環(huán)境中有所不同。 rs4987360 關(guān)聯(lián)在來自 eQTL-Gen 和 GTEx 的bulk RNA-seq eQTL 數(shù)據(jù)中復(fù)現(xiàn)首妖,并且在bulk B 細(xì)胞和單核細(xì)胞中具有相反方向的等位基因效應(yīng)(給定 rs2223286偎漫,R2 = 1 和 D' =1)。
CTLA4 是 T 細(xì)胞上一種基因劑量敏感的必需抑制性受體有缆。 與 SELL 的例子相比象踊,CTLA4 下游的 rs3087243-G 等位基因與對 1 型糖尿病 (T1DM) 和 RA 的易感性相關(guān)温亲,通過在四個(gè)細(xì)胞中降低 CTLA4 mRNA 表達(dá)以相同等位基因方向作用于多種細(xì)胞類型 T 細(xì)胞亞群。 多態(tài)性 rs231770 距離 rs3087243 不到 10 kb杯矩,但處于連鎖平衡(R2 = 0.5)栈虚。 rs231770-T 與 CD8+ T 細(xì)胞中 CTLA4 mRNA 表達(dá)降低與 S100B (CD8S100B) T 細(xì)胞表達(dá)相似,并且與自身免疫性疾病重癥肌無力相關(guān).
通過將等位基因效應(yīng)與已知與自身免疫性疾病有關(guān)的基因表達(dá)變化聯(lián)系起來史隆,可以支持已建立的假設(shè)魂务,并確定以前未表征的細(xì)胞機(jī)制的例子,這些細(xì)胞機(jī)制是疾病和控制免疫調(diào)節(jié)的基礎(chǔ)泌射。通過關(guān)注與自身免疫性疾病相關(guān)的基因粘姜,評估等位基因效應(yīng)在不同細(xì)胞類型中的差異,突出編碼膜熔酷、核孤紧、細(xì)胞質(zhì)或內(nèi)質(zhì)網(wǎng) (ER) 蛋白的基因。一個(gè)例子是 BACH2拒秘,一種參與區(qū)分記憶 B 和 T 細(xì)胞的重要轉(zhuǎn)錄因子坛芽。分析鑒定了 rs10944479,它以前與甲狀腺過氧化物酶抗體陽性和甲狀腺功能亢進(jìn)有關(guān)翼抠,并且對 CD8NC 細(xì)胞中的 BACH2 具有 eQTL 作用咙轩。確定了 CD4NC、CD8NC 和 BMem細(xì)胞中 BACH2 的 eQTL阴颖,盡管每種細(xì)胞類型中控制表達(dá)的基因座相互獨(dú)立活喊。分析證明 rs60849819-T 與 BMem 細(xì)胞中 T 等位基因純合的個(gè)體中 BACH2 的顯著下調(diào)相關(guān),并且 rs207253-A 在 CD4NC 細(xì)胞中具有類似的作用
另一個(gè)深入了解自身免疫性疾病的例子是 BLK量愧。五個(gè) eSNP 被確定為與 CD4NC钾菊、具有效應(yīng)記憶表型 (CD8ET) 的 CD8+ T 細(xì)胞、CD8NC偎肃、BMem 和 BIN 細(xì)胞中的 BLK 表達(dá)相關(guān)煞烫,并且與 RA、SLE累颂、干燥綜合征和系統(tǒng)性硬皮病相關(guān)滞详。這些基因座之一,rs2736336紊馏,導(dǎo)致 BLK 在 BMem 細(xì)胞中的差異表達(dá)料饥。動(dòng)態(tài) eQTL 分析表明,等位基因效應(yīng)在 B 細(xì)胞譜系中存在顯著差異朱监,在記憶 B 細(xì)胞的分位數(shù)中觀察到最大的遺傳效應(yīng)岸啡。 rs2736336 與 SLE 相關(guān),攜帶自身免疫風(fēng)險(xiǎn)等位基因的拷貝與 B 細(xì)胞的過度活化有關(guān)赫编,具有增強(qiáng)的 T 細(xì)胞共刺激能力巡蘸。這些結(jié)果表明奋隶,rs2736336 處的等位基因變異有助于維持 B 淋巴細(xì)胞耐受性的個(gè)體間變異。 Src 家族酪氨酸激酶悦荒,如 BLK唯欣,是信號通路的關(guān)鍵組成部分,作用于抗原受體的下游逾冬,并決定細(xì)胞因抗原參與而接收到的信號強(qiáng)度黍聂。
最后躺苦,試圖評估 eQTL 對 OneK1K 隊(duì)列中細(xì)胞組成的影響身腻。 對于每個(gè) eSNP1,測試了個(gè)體基因型和細(xì)胞類型比例之間的關(guān)聯(lián)匹厘。 在研究范圍的顯著性閾值(p < 3.0 × 10-6)下嘀趟,確定了五個(gè)關(guān)聯(lián),所有這些關(guān)聯(lián)都會(huì)影響 CD8S100B 細(xì)胞的比例愈诚。 eGene——LSS她按、S100B、PRMT2炕柔、DIP2A——和 PCNT 都位于染色體 21q22 上的 1-Mb 區(qū)域內(nèi)酌泰,并且 SNP 彼此之間存在適度到高度連鎖不平衡(R2 = 0.31 到 0.97),表明單個(gè)variant影響 CD8S100B 細(xì)胞的比例匕累。
Identification of cell type–specific trans-eQTLs suggests that distal genome regulation is highly cell type–specific
進(jìn)行了 trans-eQTL 分析陵刹,針對所有其他基因的基因表達(dá)水平測試每個(gè) cis-eQTL 的 top eSNP,不包括 cis-eGene 和主要組織相容性復(fù)合體 (MHC) 基因座的 ±2 Mb 范圍內(nèi)的那些欢嘿。 在 0.01 的研究范圍內(nèi)衰琐,確定了 990 個(gè)反式 eQTL(每個(gè) cis-eSNP 的中位數(shù))。 在每種細(xì)胞類型中鑒定出的 trans-eGenes 的數(shù)量與 cis-eQTLs 的總數(shù)弱相關(guān)(Spearman 的 r = 0.37)炼蹦。 與 cis-eGenes 相比羡宙,大多數(shù) trans-eGenes 對一種細(xì)胞類型具有特異性,并且沒有一種在細(xì)胞類型中普遍存在掐隐。
共鑒定了 630 種細(xì)胞類型特異性 trans-eQTL 效應(yīng)狗热。例如,rs2077041 對 CD8ET 細(xì)胞中的 ERN1 表達(dá)具有順式作用虑省,C 等位基因降低表達(dá)斗搞。該基因座在七個(gè)反式基因中具有相同的等位基因作用方向。 ERN1 是一種未折疊的蛋白質(zhì)反應(yīng)應(yīng)激傳感器慷妙,具有蛋白激酶和核糖核酸酶的雙重作用僻焚,可以以不依賴剪接體的方式催化 XBP1 的剪接。未折疊蛋白質(zhì)反應(yīng)的主要轉(zhuǎn)錄調(diào)節(jié)因子 XBP1 的上調(diào)可促進(jìn)蛋白質(zhì)成熟膝擂。攜帶 rs2077041 的 C 等位基因拷貝的個(gè)體具有 XBP1 和 SEC61G虑啤、SEC61B 和 SEC11C 的下調(diào)隙弛,它們參與跨 ER 膜的蛋白質(zhì)易位、信號肽去除和整合狞山。有趣的是全闷,發(fā)現(xiàn) rs74787440 對自然殺傷 (NK) 細(xì)胞中的 ERN1 表達(dá)也具有顯著的順式作用。然而萍启,這個(gè)相同的variant對 SEC61G 和 SEC61B 有反式效應(yīng)总珠,但對與 rs2077041 相關(guān)的其他基因沒有反式效應(yīng)。
當(dāng)檢查染色體 21q22 上包含與細(xì)胞組成相關(guān)的 eQTL 的基因座時(shí)勘纯,在該區(qū)域發(fā)現(xiàn)了許多反式 eQTL局服,并發(fā)現(xiàn)整個(gè)基因組中 118 個(gè)基因的表達(dá)水平與這些 eSNP 相關(guān)。 遺傳變異影響CD8S100B頻率的途徑尚不清楚驳遵,沒有發(fā)現(xiàn)反式eGenes的功能途徑富集的證據(jù)淫奔。 在整個(gè)測試中,觀察到基因組膨脹因子 (l) 為 1.05堤结,表明單細(xì)胞 eQTL 對細(xì)胞組成的影響有限唆迁,盡管更大的樣本量會(huì)發(fā)現(xiàn)其他重要的關(guān)聯(lián)。
在已建立的自身免疫風(fēng)險(xiǎn)基因座上鑒定了反式 eQTL竞穷,包括 rs7918084-T唐责,這是 NK 細(xì)胞中 HHEX 的順式 eQTL,與特應(yīng)性哮喘和外周血中的嗜酸性粒細(xì)胞計(jì)數(shù)有關(guān)瘾带。 HHEX 結(jié)合并抑制促凋亡因子 BIM (70)鼠哥,增加 NK 細(xì)胞的數(shù)量。 在 NK 細(xì)胞中月弛,rs7918084-T 在四個(gè)染色體上產(chǎn)生 transeQTL 效應(yīng)肴盏,降低 CD160、CMC1帽衙、SORBS2菜皂、TMEM123 和 C1orf162 的表達(dá)。 CD160 是一種刺激性受體厉萝,對促進(jìn) NK 細(xì)胞干擾素-g (IFN-g) 的產(chǎn)生很重要恍飘,NK 細(xì)胞募集在哮喘動(dòng)物模型中典型氣道嗜酸性粒細(xì)胞增多的發(fā)展中起關(guān)鍵作用,而哮喘動(dòng)物模型中 NK 細(xì)胞分泌的 IFN-g 與氣道炎癥減少有關(guān).
氣道炎癥模型中 IFN-γ 的產(chǎn)生在調(diào)節(jié)炎癥中起著復(fù)雜的作用谴垫,并且已經(jīng)表明章母,作用于氣道上皮的 IFN-γ 會(huì)限制炎癥,因此較低的 IFN-γ 水平可能導(dǎo)致更多與哮喘相關(guān)的氣道炎癥 和阻礙翩剪。 從機(jī)制上講乳怎,哮喘的 rs7918084-T 風(fēng)險(xiǎn)等位基因可能結(jié)合了 HHEX 依賴性順式作用機(jī)制中 NK 細(xì)胞增殖的抑制與 NK 細(xì)胞通過 CD160 下調(diào)產(chǎn)生的 IFN-g 減少,從而產(chǎn)生哮喘的hallmarks前弯。
Colocalization of genetic risk variants and single-cell cis-eQTLs identified cell type–specific mechanisms for autoimmune diseases
應(yīng)用了一種綜合方法來確定細(xì)胞類型特異性 eQTL 與七種常見自身免疫性疾病的遺傳風(fēng)險(xiǎn)位點(diǎn)之間的關(guān)系蚪缀。使用共定位和孟德爾方法測試了每種細(xì)胞類型的 cis-eQTL(使用 eSNP1)在下圖 C 和 D 中選擇用于 cis-QTL 探索的七種自身免疫疾病的 2335 個(gè)性狀相關(guān) SNP 的富集程度隨機(jī)化方法秫逝。共定位發(fā)現(xiàn) 19% 的 cis-eQTL 與 GWAS 風(fēng)險(xiǎn)變異具有相同的因果位點(diǎn)。 eQTL 與 GWAS 基因座的重疊顯示出所有疾惭丁(Bonferroni 調(diào)整后的 p < 5.1 × 10-4)和所有細(xì)胞類型的顯著富集违帆。 CD4NC 和 NK 細(xì)胞的重疊最高。同樣金蜀,在 NK 募集 (NKR) 細(xì)胞中刷后,炎癥性腸病 (IBD)、RA渊抄、強(qiáng)直性脊柱炎 (AS) 和克羅恩病 (CD) 的重疊高度富集尝胆,而多發(fā)性硬化癥 (MS)、SLE 的重疊度較低和 T1DM抒线。這些結(jié)果突出了這些常見自身免疫性疾病的遺傳風(fēng)險(xiǎn)的多遺傳效應(yīng)在細(xì)胞水平上的復(fù)雜性班巩。
以 MS 為例渣慕,確定了 108 個(gè)風(fēng)險(xiǎn)基因的重疊 cis-eQTL嘶炭。 共定位通過 eQTL 確定了 530 個(gè)具有共同因果效應(yīng)的基因-細(xì)胞類型對。 MS 疾病風(fēng)險(xiǎn)位點(diǎn)的 eQTL 重疊具有高度細(xì)胞類型特異性:在 108 個(gè)基因中逊桦,69 個(gè)僅在單個(gè)細(xì)胞類型中顯示 eQTL 重疊眨猎。 另外還有 20 個(gè)基因在兩種細(xì)胞類型中鑒定出 eQTL,其中 10 個(gè)在三種細(xì)胞類型中具有 eQTL强经,在四種細(xì)胞類型中有 5 個(gè)具有 eQTL睡陪。 例如,對于在所有 PBMC 類型中表達(dá)的基因 RMI2匿情,僅在 CD4NC 細(xì)胞中識(shí)別出重疊的 eQTL 和 MS 關(guān)聯(lián)兰迫。
相比之下,對于 METTL21B炬称,在 CD4NC汁果、CD4ET 和 CD8NC 細(xì)胞中觀察到重疊的 eQTL。 These results are concordant with our observations of cell type–specific eQTLs and provide further evidence for the genetic risk of common autoimmune diseases acting in a highly cell type–specific manner, where each locus contributes through changes to the function of a limited number of cell types玲躯。 盡管如此据德,總的來說,遺傳風(fēng)險(xiǎn)是通過免疫系統(tǒng)賦予的跷车。
盡管重疊的 GWAS SNP 和 eQTL 暗示基因表達(dá)的改變與疾病發(fā)病機(jī)制有關(guān)棘利,但有兩種替代假設(shè)。一是GWAS基因座和eQTL具有相同的因果變異朽缴,但對這兩種表型的影響是獨(dú)立的——即多效性善玫。第二種解釋是有兩個(gè)獨(dú)立的因果位點(diǎn),一個(gè)用于 GWAS 關(guān)聯(lián)密强,另一個(gè)用于 eQTL茅郎。盡管如此裹唆,它們之間仍處于連鎖不平衡狀態(tài)。為了區(qū)分這兩個(gè)假設(shè)只洒,實(shí)施了孟德爾隨機(jī)化方法來確定自身免疫性疾病風(fēng)險(xiǎn)位點(diǎn)起作用的因果關(guān)系方向的證據(jù)许帐。使用來自先前介紹的七種自身免疫性疾病的 GWAS 數(shù)據(jù)測試了 14 種細(xì)胞類型中所有疾病相關(guān)variant (p < 1 × 10-8) 和 OneK1K eQTL 之間的因果關(guān)系”锨矗總共確定了 305 個(gè)基因座(研究范圍的 FDR < 0.05)成畦,其中相關(guān)的風(fēng)險(xiǎn)基因座通過一種或多種細(xì)胞類型中特定基因表達(dá)的變化被確定為具有疾病風(fēng)險(xiǎn)的因果效應(yīng),范圍從 4 個(gè)( T1DM) 至 47 (IBD)涝开。在 305 個(gè)基因座中循帐,有 188 個(gè)位于 MHC 區(qū)域,其中因果效應(yīng)在細(xì)胞類型中表現(xiàn)出普遍存在的效應(yīng)舀武。其余 117 個(gè)位點(diǎn)顯示出高度細(xì)胞類型特異性因果效應(yīng)的模式拄养,其中 76 個(gè)位點(diǎn)被確定為僅在一種細(xì)胞類型中具有因果效應(yīng).
同樣,以 MS 為例银舱,評估了 90 個(gè)風(fēng)險(xiǎn)位點(diǎn)的致病基因和它們作用的細(xì)胞類型瘪匿。其中,能夠根據(jù) OneK1K 數(shù)據(jù)中一種或多種細(xì)胞類型中 eQTL 的重疊來測試 57 個(gè)風(fēng)險(xiǎn)位點(diǎn)的因果方向寻馏。分析確定了 39 個(gè)基因的顯著(研究范圍的 FDR < 0.05)效應(yīng)棋弥。在 MHC 區(qū)域,確定了 73 個(gè)基因座诚欠,其對 MS 風(fēng)險(xiǎn)的因果影響主要通過多種細(xì)胞類型中基因表達(dá)的變化來起作用顽染。例如,rs9264579 被確定為通過所有 14 種細(xì)胞類型中人淋巴細(xì)胞抗原 B 類 (HLA-B) 表達(dá)的變化起作用轰绵,而 rs9501393 僅通過改變 CD4NC 細(xì)胞中 SKIV2L 的表達(dá)水平而具有因果關(guān)系粉寞。在 MHC 區(qū)域之外,確定了另外 17 個(gè)具有因果效應(yīng)的基因座左腔,它們以更多細(xì)胞類型特異性方式起作用唧垦。例如,1q23 區(qū)域中的 SNP 先前已被確定為與 MS 相關(guān)翔悠,F(xiàn)CRL3 由位于啟動(dòng)子元件內(nèi)的 rs7528684 (p = 8.9 × 10-9) 標(biāo)記业崖。分析將位于近端的 FCRL3 確定為 CD8ET (p = 5.0 × 10-7) 和 BIN (p = 6.6 × 10-7) 細(xì)胞中 MS 風(fēng)險(xiǎn)的因果基因.
另一個(gè)例子是 3q12 的 MS 風(fēng)險(xiǎn)基因座,它由前導(dǎo) SNP rs9882971 (p = 6.5 × 10-9) 標(biāo)記蓄愁,其中孟德爾隨機(jī)化分析將 EAF2 確定為 BIN (p = 1.7 × 10-8) 和 BMem ( p = 2.8×10-8) 個(gè)細(xì)胞双炕。 因?yàn)?EAF2 是普遍表達(dá)的,我們的結(jié)果提供了一個(gè)明確的例子撮抓,說明了識(shí)別細(xì)胞類型遺傳對基因表達(dá)的影響并確定遺傳風(fēng)險(xiǎn)因素起作用的細(xì)胞的能力妇斤。 最后一個(gè)例子是 19p13 的風(fēng)險(xiǎn)位點(diǎn),它由位于 PIK3R2 內(nèi)含子區(qū)域的頂部 SNP rs12984330 (p = 2.8 × 10-9) 標(biāo)記。 我分析將因果基因確定為 CD8ET 和 NK 細(xì)胞中的 MAST3站超,其位于距先導(dǎo) SNP 約 65 kb 處荸恕。 MAST3 也普遍表達(dá),盡管有已知證據(jù)表明風(fēng)險(xiǎn)位點(diǎn)與監(jiān)管元素重疊死相,這為進(jìn)一步探索提供了一個(gè)有趣的案例融求。
Discussion
這項(xiàng)研究揭示了循環(huán)免疫細(xì)胞中細(xì)胞類型特異性 eQTL 的等位基因結(jié)構(gòu)。繪制了 14 種細(xì)胞類型對基因表達(dá)的遺傳影響算撮,并在 MHC 基因座外鑒定了 26,000 多個(gè)獨(dú)立的順式作用 eQTL 和 990 個(gè)反式 eQTL生宛。表明這些 eQTLs 中的大多數(shù)對基因表達(dá)具有等位基因影響,這主要是細(xì)胞類型特異性的肮柜,但可以復(fù)現(xiàn)在兩個(gè)獨(dú)立的隊(duì)列中陷舅。確定了遺傳基因座如何促成關(guān)鍵免疫功能途徑的例子。應(yīng)用于 B 細(xì)胞的譜系動(dòng)態(tài)分析表明 B 細(xì)胞成熟標(biāo)志物的預(yù)期變化审洞。它們促進(jìn)了動(dòng)態(tài) eQTL 的識(shí)別莱睁,其中許多尚未通過我們的主要 cis-eQTL 分析識(shí)別。通過將 scRNA-seq eQTL 數(shù)據(jù)與通過 GWAS 鑒定的自身免疫風(fēng)險(xiǎn)位點(diǎn)整合芒澜,我們發(fā)現(xiàn)了這些位點(diǎn)的致病基因仰剿,并解析了這些基因發(fā)揮致病作用的細(xì)胞。對我們的 eQTL 和疾病相關(guān) SNP 進(jìn)行了孟德爾隨機(jī)化和共定位分析撰糠,為 eQTL 和疾病風(fēng)險(xiǎn)位點(diǎn)之間的關(guān)系提供了補(bǔ)充見解酥馍。共定位分析提供了 eQTL 和 GWAS 風(fēng)險(xiǎn)位點(diǎn)之間共享相同因果位點(diǎn)的證據(jù)辩昆。這種觀察可以用因果效應(yīng)或多效性來解釋阅酪。孟德爾隨機(jī)化更進(jìn)一步,解決了這些替代假設(shè)汁针,以提供因果效應(yīng)方向的證據(jù)(即 DNA 到 RNA 到疾彩醴)。
與用于繪制轉(zhuǎn)錄調(diào)控等位基因結(jié)構(gòu)的替代方法相比施无,單細(xì)胞 eQTL 分析具有多個(gè)優(yōu)勢辉词,例如來自bulk RNA-seq 數(shù)據(jù)的細(xì)胞去卷積。 例如猾骡,基于 scRNA-seq 的方法可以識(shí)別以前未表征和稀有的細(xì)胞類型瑞躺,這些細(xì)胞類型很難使用反卷積方法檢測。 scRNA-seq 還可以準(zhǔn)確量化轉(zhuǎn)錄豐度兴想,因?yàn)榭梢允褂梦ㄒ环肿訕?biāo)識(shí)符 (UMI) 條形碼將擴(kuò)增的文庫折疊回單個(gè)轉(zhuǎn)錄分子的水平幢哨。 盡管如此,仍需要在單細(xì)胞分辨率下研究反式作用variant和基因環(huán)境相互作用嫂便,特別是在免疫系統(tǒng)中捞镰,其中暴露于抗原或細(xì)胞因子會(huì)引發(fā)細(xì)胞轉(zhuǎn)錄譜的變化。
This work brings together genetic epidemiology with scRNA-seq to uncover drivers of interindividual variation in the immune system. Our results demonstrate how segregating genetic variation influences the expression of genes that encode proteins involved in critical immune regulatory and signaling pathways in a cell type–specific manner. Understanding the genetic underpinnings of immune system regulation will have broad implications in the treatment of autoimmune diseases and infections, transplantation, and cancer.
生活很好,有你更好