本周最新文獻(xiàn)速遞20220227
一、精細(xì)解讀文獻(xiàn) 一
文獻(xiàn)題目: Genetic associations of protein-coding variants in human disease
不想看英文題目: 人類疾病中蛋白質(zhì)編碼變異位點(diǎn)的遺傳關(guān)聯(lián)
雜志和影響因子: Nature (IF: 42.778; Q1)
研究意義: 全基因組關(guān)聯(lián)研究 (GWAS) 鑒定了數(shù)千種與人類疾病風(fēng)險(xiǎn)相關(guān)的變異位點(diǎn)侍瑟。然而,在稀有和低頻位點(diǎn)的關(guān)聯(lián)分析方面仍缺乏統(tǒng)計(jì)效力幌墓。因此悲伶,作者整合 392,814 名英國生物銀行(UKB)參與者與 260,405 名 FinnGen (FG) 參與者(總共 653,219 名個(gè)體)的全外顯子組測序數(shù)據(jù)郊尝,對 744 個(gè)疾病終點(diǎn)進(jìn)行關(guān)聯(lián)薈萃分析秕铛,填補(bǔ)常見和罕見之間的研究差距约郁。
結(jié)論:
- 對 UKB 的 744 個(gè)疾病終點(diǎn)進(jìn)行全基因組編碼變異位點(diǎn)的關(guān)聯(lián)分析 (coding-wide association studies,CWAS)但两,隨后與 FG 隊(duì)列進(jìn)行薈萃分析鬓梅。總共發(fā)現(xiàn)了 975 個(gè)關(guān)聯(lián)位點(diǎn)(P < 5 × 10-8 )谨湘,717 個(gè)關(guān)聯(lián)位點(diǎn)通過多重檢驗(yàn)校正(P < 2 × 10-9 )绽快;
- 在所有疾病中,低頻和罕見變異位點(diǎn)的效應(yīng)值通常更大悲关;
- 975 個(gè)關(guān)聯(lián)位點(diǎn)中谎僻,387 個(gè)通過 UKB 和 FG 薈萃分析才達(dá)到顯著水平娄柳。13 個(gè)變異位點(diǎn)(跨越 11 個(gè)基因)的效應(yīng)值極高(OR>2)寓辱。11 個(gè)基因包括 BRCA1(乳腺癌)、IDH2(骨髓性白血渤嗑堋)秫筏、VWF(馮·維勒布蘭德氏病)或 HFE(疾病或鐵代謝)挎挖;
- 將關(guān)聯(lián)位點(diǎn)映射到基因后这敬,發(fā)現(xiàn)有 482 個(gè)基因與 148 個(gè)疾病簇相關(guān);
- 482 個(gè)基因中蕉朵,十三個(gè)基因座與至少五個(gè)疾病簇相關(guān)崔涂,包括 MHC、APOE始衅、PTPN22冷蚂、GCKR缭保、SH2B3和FUT2,說明這些基因存在基因多效性蝙茶。例如 CHEK2 基因艺骂,除了被報(bào)道與乳腺癌相關(guān)外,在本研究中還發(fā)現(xiàn)與結(jié)直腸癌隆夯、甲狀腺癌钳恕、子宮平滑肌瘤、良性腦膜腫瘤和卵巢囊腫相關(guān)蹄衷;
- 利用 CWAS 可對基因和疾病產(chǎn)生新的生物學(xué)見解忧额,例如 SLC34A1 (rs1460573878; MAF?=?2.6% (UKB) and 2.7% (FG); p.Val91_Ala97del) 編碼的磷酸鈉協(xié)同轉(zhuǎn)運(yùn)蛋白 NPT2a 與腎 (log(OR) = 0.24, P ?= 4.0 × 10-9 ) 和尿路結(jié)石 (log(OR) = 0.21, P ?= 6.8 × 10-9 ) 相關(guān),同時(shí)還與血清鈣增加(β ?= 0.047愧口,P ?= 5.4 × 10-11)和磷酸鹽減少(β ?= -0.075宙址,P ?= 3.3 × 10 -26)相關(guān),說明該突變增加尿酸結(jié)石風(fēng)險(xiǎn)调卑。此外抡砂,該突變攜帶者的血清肌酐沒有升高 ( β ?= -0.07, P ?= 3.6 × 10 -33),表明該突變攜帶者的腎功能不會受到影響恬涧,對于攜帶該突變的腎臟注益、輸尿管結(jié)石和泌尿道結(jié)石患者來說,有望從 NPT2A 相關(guān)的臨床干預(yù)和治療中獲益溯捆;
亮點(diǎn): 又一個(gè)新的可利用的資源
文章鏈接:
https://www.nature.com/articles/s41586-022-04394-w
公開的資料:
- 關(guān)聯(lián)分析結(jié)果:https://doi.org/10.5281/zenodo.5571000
- 代碼:https://github.com/cnfoley/Sun-et-al-2021-protein-coding-variants-in-human-disease
二丑搔、精細(xì)解讀文獻(xiàn) 二
文獻(xiàn)題目: Sequence determinants of human gene regulatory elements
不想看英文題目: 人類基因調(diào)控元件的序列決定因素
雜志和影響因子: Nat Genet (IF: 38.33; Q1)
研究意義: DNA 序列可以控制基因的表達(dá)起始和位置,但具體哪段序列控制則是未知的提揍。因此啤月,作者使用大規(guī)模并行報(bào)告基因分析 (MPRA) 評估了 DNA 序列的轉(zhuǎn)錄活性,以探究驅(qū)動人類增強(qiáng)子和啟動子活性以及相互作用的序列決定因素劳跃。
結(jié)論:
- 為了系統(tǒng)性表征人類基因組調(diào)控元件活性的序列決定因素谎仲,作者開發(fā)了四組 MPRA 文庫方案: 1)用于評估增強(qiáng)子活性的轉(zhuǎn)錄因子( TF )基序(49bp)、2)用于評估增強(qiáng)子活性的人類基因組片段(500bp)刨仑、3)用于評估增強(qiáng)子活性隨機(jī)合成的 DNA 寡核苷酸(170bp)郑诺、4)用于評估增強(qiáng)子和啟動子活性的隨機(jī)合成的 150 bp 序列;
- 將 MPRA 測得的基序與體外特異性結(jié)合測定的基序(HT-SELEX)進(jìn)行比較杉武,發(fā)現(xiàn)二者的一致性很高辙诞,說明該方法可有效測量細(xì)胞中的 TF 活性;
- 大多數(shù)轉(zhuǎn)錄過程被認(rèn)為多個(gè) TF 相互作用的結(jié)果轻抱,為此飞涂,作者比較了多個(gè) TF 在不同模式下增強(qiáng)子活性的變化。結(jié)果發(fā)現(xiàn)對于大多數(shù) TF,增強(qiáng)子活性隨著 TF 共有序列數(shù)量的增加而增加较店,但對于可以單獨(dú)起作用的 TF(例如 p53)志鹃, 其增強(qiáng)子活性低于加性模型下的活性(圖b紅色虛線);
- 為了確定增強(qiáng)子是否是細(xì)胞類型特異性的泽西,作者使用方案三(用于評估增強(qiáng)子活性隨機(jī)合成的 DNA 寡核苷酸)識別激活 HepG2 增強(qiáng)子活性的序列特征曹铃。通過比較 GP5d 和 HepG2 細(xì)胞的增強(qiáng)子基序,發(fā)現(xiàn)大多數(shù)基序在兩種細(xì)胞系中具有相似的增強(qiáng)子活性(Pearson R ?= 0.78)捧杉,只有少數(shù)基序在兩個(gè)細(xì)胞中具有顯著差異陕见,說明只有少量的 TF 在細(xì)胞中是特異的;
- 為了確定 STARR-seq 測定的序列特征是如何結(jié)合增強(qiáng)子味抖,作者以~1.5-bp 的分辨率測定了 GP5d 和 HepG2 細(xì)胞的增強(qiáng)子活性评甜,發(fā)現(xiàn) STARR-seq 測定的序列特征對應(yīng)體內(nèi)開放染色質(zhì)相關(guān)的特征;
- 利用染色質(zhì)可及性(ATAC+/-)和經(jīng)典增強(qiáng)子活性(STARR+/-)的信號差異仔涩,作者將基因組調(diào)控元件分為六大類:(1)封閉染色質(zhì)增強(qiáng)子(STARR+和 ATAC-)忍坷,(2)隱蔽增強(qiáng)子(沉默的 STARR+和 ATAC-區(qū)域),(3)啟動子(ATAC+和 STARR+/-), (4) 染色質(zhì)依賴性增強(qiáng)子 (STARR-/low和 ATAC+具有活性組蛋白標(biāo)記 H3K27ac), (5) 結(jié)構(gòu)染色質(zhì)元件 (STARR- , ATAC+和 CTCF+) 和 (6) 經(jīng)典增強(qiáng)子 (STARR+和ATAC+)熔脂;
- 在上述六大類功能元件中佩研,封閉染色質(zhì)增強(qiáng)子(1)、染色質(zhì)依賴性增強(qiáng)子(4)和經(jīng)典增強(qiáng)子(6)比隱蔽增強(qiáng)子在功能上更為活躍霞揉;
- ChIP-seq 和基序的分析表明旬薯,經(jīng)典增強(qiáng)子和封閉染色質(zhì)增強(qiáng)子均與 TF 結(jié)合;
- 經(jīng)典增強(qiáng)子更容易被有強(qiáng)激活子結(jié)構(gòu)域(例如 FOS 和 JUN)的 TF 結(jié)合适秩,而染色質(zhì)依賴性增強(qiáng)子對 HLF 和 FOXA 基序表現(xiàn)出較弱的偏好绊序,但這兩種類型的增強(qiáng)子都與 HNF4A 結(jié)合;
- 作者利用方案四(用于評估增強(qiáng)子和啟動子活性的隨機(jī)合成的 150 bp 序列)識別啟動子活性的序列決定因素秽荞。發(fā)現(xiàn)大多數(shù)基序在啟動子和增強(qiáng)子位置都富集骤公,且啟動子處富集的大部分基序在所有細(xì)胞類型中都是相似的;
- 隨后作者評估了距離 TSS 不同位置的序列特征扬跋。發(fā)現(xiàn)在 TSS 的 -30 處觀察到 AT 富集阶捆,在 TSS 的 +10 到 +35 位置,觀察到 G 含量逐漸增加胁住;
- 使用 STARR-seq 方法識別啟動子和增強(qiáng)子之間的相互作用趁猴,發(fā)現(xiàn)幾乎所有的 TF 基序?qū)Χ际仟?dú)立富集的刊咳,說明控制轉(zhuǎn)錄的過程非常普遍彪见,幾乎所有 TF 的活動都可以獨(dú)立地促進(jìn)轉(zhuǎn)錄活動。
亮點(diǎn): 開發(fā)了一種通過實(shí)驗(yàn)測定序列轉(zhuǎn)錄活性以及功能元件相互作用的方法娱挨;
文章鏈接:
https://www.nature.com/articles/s41588-021-01009-4
公開的資料:
- 序列數(shù)據(jù):https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE180158
- 代碼:https://doi.org/10.5281/zenodo.5159644
三余指、其他文獻(xiàn)推薦
下面的文獻(xiàn)也挺精彩的,但由于下不到原文,或博主時(shí)間有限酵镜,沒法精細(xì)解讀碉碉,故列出來供各位參閱;
當(dāng)然淮韭,你們有精彩的文獻(xiàn)想讓我解讀的(前提是一周內(nèi)剛出爐的文獻(xiàn))垢粮,可給我發(fā)pdf(然而可能種種原因,我不一定有時(shí)間解讀靠粪,不要對我抱太高期待)蜡吧;
文獻(xiàn)題目: A unified genealogy of modern and ancient genomes
不想看英文題目: 現(xiàn)代和古代基因組的統(tǒng)一譜系
雜志和影響因子: Science (IF: 41.845; Q1)
文章鏈接:
https://www.science.org/doi/10.1126/science.abi8264
文獻(xiàn)題目: Genome-wide association analyses identify new Brugada syndrome risk loci and highlight a new mechanism of sodium channel regulation in disease susceptibility
不想看英文題目: 全基因組關(guān)聯(lián)分析確定了新的 Brugada 綜合征風(fēng)險(xiǎn)位點(diǎn),并突出了鈉通道在調(diào)控疾病易感性中的新機(jī)制
雜志和影響因子: Nat Genet (IF: 38.33; Q1)
文章鏈接:
https://www.nature.com/articles/s41588-021-01007-6
文獻(xiàn)題目: Analysis of rare genetic variation underlying cardiometabolic diseases and traits among 200,000 individuals in the UK Biobank
不想看英文題目: 200,000 名 UK Biobank 個(gè)體的心臟代謝疾病/特征的罕見遺傳變異分析
雜志和影響因子: Nat Genet (IF: 38.33; Q1)
文章鏈接:
https://www.nature.com/articles/s41588-021-01011-w
文獻(xiàn)題目: Proteomic profiling reveals CDK6 upregulation as a targetable resistance mechanism for lenalidomide in multiple myeloma
不想看英文題目: 蛋白質(zhì)組學(xué)分析顯示 CDK6 上調(diào)是來那度胺藥物在多發(fā)性骨髓瘤中的靶向耐藥機(jī)制
雜志和影響因子: Nat Commun (IF: 14.92; Q1)
文章鏈接:
https://www.nature.com/articles/s41467-022-28515-1
文獻(xiàn)題目: Randomized controlled trial for time-restricted eating in healthy volunteers without obesity
不想看英文題目: 無肥胖健康志愿者限時(shí)飲食的隨機(jī)對照試驗(yàn)
雜志和影響因子: Nat Commun (IF: 14.92; Q1)
文章鏈接:
https://www.nature.com/articles/s41467-022-28662-5
四占键、工具或資源類介紹
文獻(xiàn)題目: Characterizing mobile element insertions in 5675 genomes
不想看英文題目: 對 5675 個(gè)基因組的移動元件特性插入進(jìn)行表征
雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac128/6536893
文獻(xiàn)題目: Single-cell genome-wide concurrent haplotyping and copy-number profiling through genotyping-by-sequencing
不想看英文題目: 通過基因分型測序進(jìn)行單細(xì)胞全基因組單倍體分型和拷貝數(shù)分析
雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac134/6536884
文獻(xiàn)題目: Mechanisms of mitochondrial promoter recognition in humans and other mammalian species
不想看英文題目: 人類和其他哺乳動物的線粒體啟動子識別機(jī)制
雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac103/6534357
文獻(xiàn)題目: Genome-wide characterization of i-motifs and their potential roles in the stability and evolution of transposable elements in rice
不想看英文題目: i-motifs 的全基因組特征及其在水稻轉(zhuǎn)座子穩(wěn)定性和進(jìn)化中的作用
雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac121/6533605
文獻(xiàn)題目: Rapid and accurate identification of ribosomal RNA sequences via deep learning
不想看英文題目: 通過深度學(xué)習(xí)快速準(zhǔn)確地識別核糖體 RNA 序列
雜志和影響因子: Nucleic Acids Res (IF: 11.501; Q1)
文章鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkac112/6533611
文獻(xiàn)題目: BamToCov, an efficient toolkit for sequence coverage calculation
不想看英文題目: BamToCov: 計(jì)算序列覆蓋度的高效工具包
雜志和影響因子: Bioinformatics (IF: 5.61; Q1)
文章鏈接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac125/6535233
文獻(xiàn)題目: SEPA: Signalling entropy-based algorithm to evaluate personalized pathway activation for survival analysis on pan-cancer data
不想看英文題目: SEPA:基于信號熵算法用于泛癌數(shù)據(jù)的生存分析
雜志和影響因子: Bioinformatics (IF: 5.61; Q1)
文章鏈接:
文獻(xiàn)題目: monaLisa: an R/Bioconductor package for identifying regulatory motifs
不想看英文題目: monaLisa:用于識別調(diào)控基序的 R/Bioconductor 包
雜志和影響因子: Bioinformatics (IF: 5.61; Q1)
文章鏈接:
https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac102/6535228
文獻(xiàn)題目: ASES: Visualising evolutionary conservation of alternative splicing in proteins
不想看英文題目: ASES:蛋白質(zhì)可變剪接的進(jìn)化保守性可視化
雜志和影響因子: Bioinformatics (IF: 5.61; Q1)
文章鏈接:
文獻(xiàn)題目: Simultaneous test and estimation of total genetic effect in eQTL integrative analysis through mixed models
不想看英文題目: 通過混合模型同時(shí)測試和估計(jì) eQTL 的總遺傳效應(yīng)
雜志和影響因子: Brief Bioinform (IF: 11.62; Q1)
文章鏈接:
文獻(xiàn)題目: Deep learning-based identification of genetic variants: application to Alzheimer’s disease classification
不想看英文題目: 基于深度學(xué)習(xí)進(jìn)行遺傳變異識別:在阿爾茨海默病分類中的應(yīng)用
雜志和影響因子: Brief Bioinform (IF: 11.62; Q1)
文章鏈接:
文獻(xiàn)題目: SVPath: an accurate pipeline for predicting the pathogenicity of human exon structural variants
不想看英文題目: SVPath:預(yù)測人類外顯子結(jié)構(gòu)變異致病性的準(zhǔn)確管道
雜志和影響因子: Brief Bioinform (IF: 11.62; Q1)
文章鏈接:
致謝橙子牛奶糖(陳文燕)昔善,請用參考模版:We thank the blogger (orange_milk_sugar, Wenyan Chen) for XXX
感謝小可愛們多年來的陪伴, 我與你們一起成長~