本周最新文獻(xiàn)速遞20211031
一聪蘸、精細(xì)解讀文獻(xiàn) 一
文獻(xiàn)題目: An open approach to systematically prioritize causal variants and genes at all published human GWAS trait-associated loci
不想看英文題目: 在所有已發(fā)表的人類(lèi) GWAS 性狀相關(guān)位點(diǎn)上系統(tǒng)性?xún)?yōu)先排序因果變異位點(diǎn)和基因
雜志和影響因子: Nat Genet (IF: 38.33; Q1)
研究意義: 全基因組關(guān)聯(lián)研究 (GWAS) 發(fā)現(xiàn)了許多與復(fù)雜性狀相關(guān)的變異位點(diǎn),但確定因果基因仍是一項(xiàng)重大挑戰(zhàn)蔫耽。本研究提供了一個(gè)開(kāi)放性資源撩炊,可在 133,441 個(gè)已發(fā)表的人類(lèi) GWAS 基因座中提供系統(tǒng)的精細(xì)定位和基因優(yōu)先排序結(jié)果外永。
結(jié)論:
- 作者從 GWAS Catalog 和 the UK Biobank 總共收集了 3,621 個(gè) GWAS 數(shù)據(jù)集,133,441 個(gè)表型相關(guān)位點(diǎn)拧咳;
- 133,441 個(gè)表型相關(guān)位點(diǎn)中伯顶,53% 的位點(diǎn)在一種以上的表型間共享;
- 對(duì) 133,441 個(gè)表型相關(guān)位點(diǎn)構(gòu)建 95% 置信度數(shù)據(jù)集骆膝, 12,500 (9%) 的 95% 置信度數(shù)據(jù)集只有一個(gè)因果位點(diǎn)祭衩,21,279 (16%) 的 95% 置信度數(shù)據(jù)集有 2-5 個(gè)因果位點(diǎn)。因果變異位點(diǎn)數(shù)量越少的 95% 置信度數(shù)據(jù)集阅签,通常頻率也越低掐暮;
- VEP注釋結(jié)果表明,與擁有多個(gè)變異位點(diǎn)的 95% 置信度數(shù)據(jù)集相比政钟,只有單個(gè)變異位點(diǎn)的 95% 置信度數(shù)據(jù)集路克,變異位點(diǎn)對(duì)轉(zhuǎn)錄本的影響更大 (odds ratio (OR)?=?8.51, P <?2.2?×?10 -16 , Fisher’s exact test);
- 保留 95% 置信度數(shù)據(jù)集中具有中/高影響的 2,284 個(gè)編碼變異位點(diǎn)(VEP注釋?zhuān)┭唬c之相關(guān)的編碼基因和表型有 378 和 303 個(gè)精算。其中有幾個(gè)疾病相關(guān)的編碼基因已被批準(zhǔn)為治療靶點(diǎn),以 PHLDA3 上的 rs35383942 位點(diǎn)為例碎连, rs35383942 為乳腺癌相關(guān)的位點(diǎn)殖妇,PHLDA3是 TP53 的直接靶標(biāo);
- 保留 95% 置信度數(shù)據(jù)集中具有中/高影響的 2,284 個(gè)編碼變異位點(diǎn)(VEP注釋?zhuān)┢苹ǎc之相關(guān)的編碼基因和表型有 378 和 303 個(gè)谦趣。其中有幾個(gè)疾病相關(guān)的編碼基因已被批準(zhǔn)為藥物治療靶點(diǎn),以 PHLDA3 上的 rs35383942 位點(diǎn)為例座每, rs35383942 與乳腺癌相關(guān)前鹅,而 PHLDA3 被報(bào)道為 TP53 的直接靶標(biāo),其通過(guò)抑制 AKT1 產(chǎn)生抗腫瘤作用峭梳;
- 對(duì) 70,364 個(gè)基因座與表達(dá)相關(guān)變異位點(diǎn)(eQTL)舰绘、蛋白質(zhì)水平相關(guān)變異位點(diǎn)(pQTL)進(jìn)行共定位, 發(fā)現(xiàn) 49.4% 的基因座沒(méi)有共定位基因( H4 >0.8)葱椭,25.5% 有一個(gè)共定位基因捂寿,25.2% 超過(guò)一個(gè)共定位基因;
- 對(duì) 3,621 個(gè) GWAS 數(shù)據(jù)集進(jìn)行了跨性狀共定位孵运,以識(shí)別潛在的受相同分子調(diào)控的性狀秦陋,跨性狀共定位揭示 6 號(hào)染色體上的一個(gè)基因座與哮喘 (6_90220794_T_C) 和克羅恩病 (6_90263440_C_A) 共定位,表明這兩種疾病可能在該基因座具有相同的遺傳風(fēng)險(xiǎn)治笨;
- 隨后作者將精細(xì)定位與功能基因組學(xué)特征相結(jié)合驳概,開(kāi)發(fā)了“基因座-基因”( locus to gene赤嚼,L2G)模型。在該模型中手動(dòng)納入 445 個(gè)基因作為金標(biāo)準(zhǔn)(GSP)顺又,利用多個(gè)功能基因組學(xué)特征(比如藥物靶點(diǎn)-疾病信息更卒、共定位表觀遺傳標(biāo)記、報(bào)告基因檢測(cè)等)進(jìn)行訓(xùn)練稚照,通過(guò)預(yù)測(cè) 445 個(gè)基因是否為因果基因評(píng)估模型的表現(xiàn)性能蹂空。利用 L2G 模型對(duì)所有 GWAS 中的因果基因進(jìn)行優(yōu)先排序,發(fā)現(xiàn) L2G 模型鑒定的因果基因被大多數(shù)文獻(xiàn)支持且富集了更多的藥物靶點(diǎn)果录;
- 最后腌闯,作者將所有的結(jié)果整合在 Open Targets Genetics 網(wǎng)站中;
亮點(diǎn):
- 開(kāi)發(fā)了 L2G 模型雕憔,提高因果基因的檢測(cè)性能;
- 開(kāi)發(fā)了 Open Targets Genetics 網(wǎng)站糖声,收錄了歐洲和非歐洲的多個(gè) GWAS 數(shù)據(jù)集以及 92 個(gè)組織/細(xì)胞類(lèi)型特定 molQTL 匯總統(tǒng)計(jì)數(shù)據(jù)共定位結(jié)果斤彼;
文章鏈接:
https://www.nature.com/articles/s41588-021-00945-5
公開(kāi)的資料:
- Open Targets Genetics:http://genetics.opentargets.org/
- GWAS 黃金標(biāo)準(zhǔn)基因:github.com/opentargets/genetics-gold-standards
- 代碼:https://github.com/opentargets/genetics-sumstat-data; https://github.com/opentargets/genetics-finemapping蘸泻;https://github.com/opentargets/genetics-colocalisation琉苇;https://github.com/opentargets/genetics-v2d-data;https://github.com/opentargets/genetics-v2g-data悦施;https://github.com/opentargets/genetics-l2g-scoring并扇;https://github.com/opentargets/genetics-gold-standards;https://github.com/opentargets/genetics-variant-annotation
二抡诞、精細(xì)解讀文獻(xiàn) 二
文獻(xiàn)題目: Validation of lipid-related therapeutic targets for coronary heart disease prevention using human genetics
不想看英文題目: 使用人類(lèi)遺傳學(xué)驗(yàn)證預(yù)防冠心病的靶點(diǎn)
雜志和影響因子: Nat Commun (IF: 14.92; Q1)
研究意義: 全基因組生物標(biāo)志物的孟德?tīng)栯S機(jī)化 (MR) 已證實(shí)低密度脂蛋白膽固醇(LDL-C)增加冠心睬钣肌(CHD)風(fēng)險(xiǎn),然而高密度脂蛋白膽固醇 (HDL-C) 和甘油三酯 (TG)對(duì)冠心病的作用仍較為模糊昼汗;
結(jié)論:
- 通過(guò)全基因組生物標(biāo)志物 MR 研究肴熏,在發(fā)現(xiàn)集中發(fā)現(xiàn) LDL-C 和 TG 提高 CHD 的風(fēng)險(xiǎn)(OR CI 分別為 1.39–1.63 和 1.01–1.21),HDL 對(duì) CHD 風(fēng)險(xiǎn)的 OR CI 為 0.90–1.01顷窒,在驗(yàn)證集中同樣證明 LDL-C 和 TG 可提高 CHD 的風(fēng)險(xiǎn)(OR CI 分別為 1.25-1.31 和 1.14-1.32)蛙吏,然而 HDL 對(duì) CHD 風(fēng)險(xiǎn)的 OR CI 為0.83–0.96,可見(jiàn)在單變量 MR 分析中鞋吉, HDL 對(duì) CHD 的貢獻(xiàn)在不同的研究中是存在差異的鸦做;
- 為了評(píng)估三種脂質(zhì)成分對(duì) CHD 的獨(dú)立貢獻(xiàn),作者在發(fā)現(xiàn)集中進(jìn)行了多變量 MR 分析 (MVMR)谓着, 發(fā)現(xiàn) LDL-C泼诱、HDL-C 和 TG 對(duì) CHD 風(fēng)險(xiǎn)的 OR CI 分別為 (1.44-1.62、0.86-0.95赊锚、1.01–1.17)坷檩;
- 隨后對(duì)藥物靶點(diǎn)進(jìn)行 MR 分析却音,以確定對(duì) CHD 具有影響的蛋白質(zhì)。在 P ?<?1?×?10?6 的閾值下矢炼,發(fā)現(xiàn)了 341 個(gè)編碼藥物蛋白的基因系瓢,149 個(gè)基因與 LDL-C 相關(guān),180 個(gè)與 HDL-C 相關(guān)句灌,154 個(gè)與 TG 相關(guān)夷陋。在 341 個(gè)基因中,141(41%) 的基因只與一種脂質(zhì)相關(guān)胰锌,101 個(gè)(30%) 的基因與兩種脂質(zhì)相關(guān)骗绕,100 (29%) 的基因與所有脂質(zhì)相關(guān);
- 在 341 個(gè)藥物靶點(diǎn)中资昧,165 個(gè)與 CHD 相關(guān)酬土,其中 131 個(gè)藥物靶點(diǎn)在LDL-C/TG /HDL-C 中保護(hù)作用一致;
- 藥物靶點(diǎn) MR 分析還發(fā)現(xiàn)了 40 個(gè)藥物靶點(diǎn)被報(bào)道與脂質(zhì)不良反應(yīng)事件相關(guān)格带、另外五個(gè)基因 (PCSK9, PPARG, PPARA, NPC1L1, 和 HMGCR) 參與脂質(zhì)修飾撤缴,其中 NPC1L1, HMGCR 和 PCSK9 可用于 CHD 預(yù)防;
- 為了驗(yàn)證 MR 結(jié)果叽唱,作者使用了 UKBB 進(jìn)行驗(yàn)證屈呕,驗(yàn)證集發(fā)現(xiàn)了 47 個(gè)顯著的 MR 結(jié)果(P值 < 0.05),其中 39/47(83%)與發(fā)現(xiàn)集的方向一致棺亭;
- 為了識(shí)別潛在的脂質(zhì)介導(dǎo)途徑虎眨,作者進(jìn)行了多變量藥物靶標(biāo) MR 分析(MVMR) ,結(jié)果發(fā)現(xiàn) 12 個(gè)藥物靶標(biāo) (SLC12A3, APOB, APOA1, PVRL2, APOE, APOC1, CELSR2, GPR61, PCSK9, 和 CEACAM16)通過(guò) LDL-C 影響 CHD, LPL 通過(guò) HDL-C 影響 CHD镶摘,ALDH1A2 通過(guò) TG 影響 CHD嗽桩。另外SMARCA4 和 APOA5 通過(guò) LDL-C 和 TG 共同影響 CHD, 而RPL7A 通過(guò) LDL-C 和 HDL-C 共同影響 CHD;
- 對(duì)脂質(zhì)和 CHD 進(jìn)行共定位凄敢,發(fā)現(xiàn) 33 個(gè)基因座共定位涤躲,其中25 個(gè)共定位基因?yàn)樗幬锏鞍谆颍?/li>
- 為了研究藥物靶基因是否在肝臟中特異性表達(dá)(肝臟為脂質(zhì)代謝靶向組織),作者提取了人類(lèi)蛋白質(zhì)圖譜的 RNAseq 數(shù)據(jù)贡未,結(jié)果發(fā)現(xiàn)與其他組織相比种樱,藥物靶基因在肝臟中特異性表達(dá);
- 為了探索藥物靶基因?qū)?CHD 潛在的其他影響俊卤,作者進(jìn)行了全表型關(guān)聯(lián)分析(Phenome-wide scan)嫩挤,發(fā)現(xiàn)六個(gè)藥物靶基因(NDUFA13、CILP2消恍、PVRL2岂昭、VEGFA、APOC1 和 LPL)與 2 型糖尿病相關(guān)狠怨、五個(gè)(APOC1, PVR, PVRL2, APOE 和 CEACAM16)與阿爾茨海默病相關(guān)约啊、四個(gè)(SMARCA4邑遏、CETP、VEGFA 和 ALDH1A2)與哮喘相關(guān)恰矩,四個(gè)(APOA1记盒、APOC3、APOA4 和 APOA5)與痛風(fēng)相關(guān)外傅;
亮點(diǎn): 將 GWAS 結(jié)果與藥物靶標(biāo)結(jié)合起來(lái)是這些年一直呼吁的方向纪吮,本文就是很好的一項(xiàng)例子,值得學(xué)習(xí)萎胰;
文章鏈接:
https://www.nature.com/articles/s41467-021-25731-z
公開(kāi)的資料:
LDL-C, HDL-C, Triglycerides [http://lipidgenetics.org/#data-downloads-title]碾盟;
Coronary Heart Disease [http://www.cardiogramplusc4d.org/data-downloads/];
Rheumatoid arthritis [https://grasp.nhlbi.nih.gov/downloads/ResultsOctober2016/Okada/]
Juvenile arthritis [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/HinksA_23603761_GCST005528/]技竟;
Ankylosing spondylitis [https://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/CortesA_23749187_GCST005529/]冰肴;
Ulcerative colitis [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/LiuJZ_26192919_GCST003045/];
Psoriasis [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/TsoiLC_23143594_GCST005527/]榔组;
Crohn disease [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/LiuJZ_26192919]熙尉;
Stroke [http://www.megastroke.org/index.html];
Asthma [https://www.thelancet.com/journals/lanres/article/PIIS2213-2600(18)30389-8/fulltext]瓷患;
Multiple sclerosis (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3832895/];
Gout [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/TinA_31578528_GCST008970/]遣妥;
Ovarian neoplasms [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/PhelanCM_28346442_GCST004462/]擅编;
Parkinson disease [https://drive.google.com/drive/folders/10bGj6HfAXgl-JslpI9ZJIL_JIgZyktxn];
Alzheimer disease (https://www.ncbi.nlm.nih.gov/pubmed/30617256]箫踩;
Type 2 diabetes mellitus [https://www.nature.com/articles/s41588-018-0241-6]爱态;
Myocardial infarction [http://www.cardiogramplusc4d.org/data-downloads/];
Heart failure [https://www.nature.com/articles/s41467-019-13690-5]境钟;
Atrial fibrillation [https://www.nature.com/articles/s41588-018-0171-3]锦担;
Diabetic nephropathies [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/vanZuydamNR_29703844_GCST005881];
Chronic kidney failure [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6698888/]慨削;
Schizophrenia [http://www.med.unc.edu/pgc/files/resultfiles/]洞渔;
Narcolepsy [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/FaracoJ_23459209_GCST005522/];
Atopic dermatitis [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/PaternosterL_26482879_GCST003184]缚态;
Biliary liver cirrhosis [http://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/CordellHJ_26394269_GCST003129]磁椒;
80 ICD10 main diagnoses in UK Biobank released by Neale Lab (1st August 2018, http://www.nealelab.is/uk-biobank/)
三、其他文獻(xiàn)推薦
下面的文獻(xiàn)也挺精彩的玫芦,但由于下不到原文浆熔,或博主時(shí)間有限,沒(méi)法精細(xì)解讀桥帆,故列出來(lái)供各位參閱医增;
當(dāng)然慎皱,你們有精彩的文獻(xiàn)想讓我解讀的(前提是一周內(nèi)剛出爐的文獻(xiàn)),可給我發(fā)pdf(然而可能種種原因叶骨,我不一定有時(shí)間解讀稽亏,不要對(duì)我抱太高期待)补胚;
文獻(xiàn)題目: Single-cell nuclear architecture across cell types in the mouse brain
不想看英文題目: 小鼠大腦細(xì)胞類(lèi)型的單細(xì)胞核結(jié)構(gòu)
雜志和影響因子: Science (IF: 41.845; Q1)
文章鏈接:
https://www.science.org/doi/10.1126/science.abj1966
文獻(xiàn)題目: Exome sequencing and analysis of 454,787 UK Biobank participants
不想看英文題目: 454,787 名英國(guó)生物銀行參與者的外顯子組測(cè)序分析
雜志和影響因子: Nat Genet (IF: 38.33; Q1)
文章鏈接:
https://www.nature.com/articles/s41586-021-04103-z
文獻(xiàn)題目: Mutational signatures in esophageal squamous cell carcinoma from eight countries with varying incidence
不想看英文題目: 八個(gè)不同發(fā)病率國(guó)家的食管鱗狀細(xì)胞癌的突變特征
雜志和影響因子: Nat Genet (IF: 38.33; Q1)
文章鏈接:
https://www.nature.com/articles/s41588-021-00928-6
文獻(xiàn)題目: Genome-wide association study identifies susceptibility loci for acute myeloid leukemia
不想看英文題目: 全基因組關(guān)聯(lián)分析鑒定急性髓系白血病易感位點(diǎn)
雜志和影響因子: Nat Commun (IF: 14.92; Q1)
文章鏈接:
https://www.nature.com/articles/s41467-021-26551-x
文獻(xiàn)題目: Asthma-associated genetic variants induce IL33 differential expression through an enhancer-blocking regulatory region
不想看英文題目: 哮喘相關(guān)變異位點(diǎn)通過(guò)增強(qiáng)子阻斷誘導(dǎo) IL33 差異表達(dá)
雜志和影響因子: Nat Commun (IF: 14.92; Q1)
文章鏈接:
https://www.nature.com/articles/s41467-021-26347-z
四、工具或資源類(lèi)介紹
文獻(xiàn)題目: The National Microbiome Data Collaborative Data Portal: an integrated multi-omics microbiome data resource
不想看英文題目: 集成的多組學(xué)微生物組數(shù)據(jù)庫(kù)
雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab990/6414581
文獻(xiàn)題目: BrainBase: a curated knowledgebase for brain diseases
不想看英文題目: BrainBase:腦部疾病數(shù)據(jù)庫(kù)
雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab987/6414573
文獻(xiàn)題目: TcoFBase: a comprehensive database for decoding the regulatory transcription co-factors in human and mouse
不想看英文題目: TcoFBase:人類(lèi)和小鼠轉(zhuǎn)錄輔因子數(shù)據(jù)庫(kù)
轉(zhuǎn)錄輔因子 (transcription co-factors, TcoFs),包括轉(zhuǎn)錄激酶晒杈、表觀遺傳蛋白和共激活因子等, 連接增強(qiáng)子和啟動(dòng)子,參與轉(zhuǎn)錄調(diào)控猪杭,在基因表達(dá)調(diào)控中發(fā)揮著至關(guān)重要的作用病袄。
雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab950/6414596
文獻(xiàn)題目: EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study
不想看英文題目: EWAS 開(kāi)放平臺(tái):用于全表觀基因組關(guān)聯(lián)分析的集成數(shù)據(jù)、知識(shí)和工具包
雜志和影響因子: Nucleic Acids Res (IF: 16.97; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab972/6414594
文獻(xiàn)題目: EDCNN: Identification of Genome-Wide RNA-binding Proteins Using Evolutionary Deep Convolutional Neural Network
不想看英文題目: EDCNN:使用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別全基因組 RNA 結(jié)合蛋白
雜志和影響因子: Bioinformatics (IF: 5.61; Q1)
文章鏈接:
https://doi.org/10.1093/bioinformatics/btab739
致謝橙子牛奶糖(陳文燕)歉甚,請(qǐng)用參考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感謝小可愛(ài)們多年來(lái)的陪伴万细, 我與你們一起成長(zhǎng)~