Nat Biotech | 多組織單細(xì)胞數(shù)據(jù)分析發(fā)現(xiàn)四種類型的細(xì)胞狀態(tài)
原創(chuàng)?huacishu?圖靈基因?2022-10-21 10:11?發(fā)表于江蘇
收錄于合集#前沿生物大數(shù)據(jù)分析
撰文:huacishu
IF=68.164
推薦度:?????
亮點(diǎn):
1、作者開發(fā)了MultiVelo,一種基因表達(dá)的微分方程模型锡溯,它擴(kuò)展了RNA速率框架,以納入表觀基因組數(shù)據(jù)踪栋。MultiVelo使用概率潛在變量模型來估計(jì)染色質(zhì)可及性和基因表達(dá)的切換時(shí)間和速率參數(shù),提高了細(xì)胞命運(yùn)預(yù)測(cè)的準(zhǔn)確性图毕;
2夷都、作者將其應(yīng)用于大腦、皮膚和血細(xì)胞的多組分單細(xì)胞數(shù)據(jù)集予颤,可以發(fā)現(xiàn)兩類不同的基因囤官,其區(qū)別在于染色質(zhì)在轉(zhuǎn)錄停止之前還是之后關(guān)閉厢破。還發(fā)現(xiàn)了四種類型的細(xì)胞狀態(tài):表觀基因組和轉(zhuǎn)錄組耦聯(lián)的兩種狀態(tài)和兩種不同的解耦聯(lián)狀態(tài);
3治拿、作者確定轉(zhuǎn)錄因子表達(dá)和結(jié)合位點(diǎn)可及性之間以及疾病相關(guān)SNP可及性和相關(guān)基因表達(dá)之間的時(shí)間滯后摩泪。
美國(guó)密西根大學(xué)Joshua D. Welch教授課題組在國(guó)際知名期刊Nat Biotechnol在線發(fā)表題為“Multi-omic single-cell velocity models epigenome–transcriptome interactions and improves cell fate prediction”的論文。多組分單細(xì)胞數(shù)據(jù)集中劫谅,同一細(xì)胞內(nèi)有多種分子模式见坑,有助于理解表觀基因組和轉(zhuǎn)錄組之間的時(shí)間關(guān)系。
為了實(shí)現(xiàn)這一潛力捏检,作者開發(fā)了MultiVelo荞驴,一種基因表達(dá)的微分方程模型,它擴(kuò)展了RNA速率框架贯城,以納入表觀基因組數(shù)據(jù)熊楼。MultiVelo使用概率潛在變量模型來估計(jì)染色質(zhì)可及性和基因表達(dá)的切換時(shí)間和速率參數(shù),并與僅從RNA進(jìn)行的速度估計(jì)相比能犯,提高了細(xì)胞命運(yùn)預(yù)測(cè)的準(zhǔn)確性鲫骗。
應(yīng)用于大腦、皮膚和血細(xì)胞的多組分單細(xì)胞數(shù)據(jù)集踩晶,可以發(fā)現(xiàn)兩類不同的基因执泰,其區(qū)別在于染色質(zhì)在轉(zhuǎn)錄停止之前還是之后關(guān)閉。作者還發(fā)現(xiàn)了四種類型的細(xì)胞狀態(tài):表觀基因組和轉(zhuǎn)錄組耦聯(lián)的兩種狀態(tài)和兩種不同的解耦聯(lián)狀態(tài)渡蜻。最后术吝,作者確定轉(zhuǎn)錄因子表達(dá)和結(jié)合位點(diǎn)可及性之間以及疾病相關(guān)SNP可及性和相關(guān)基因表達(dá)之間的時(shí)間滯后。
從DNA到RNA再到蛋白質(zhì)的基因表達(dá)調(diào)控是控制細(xì)胞命運(yùn)的關(guān)鍵過程茸苇。協(xié)調(diào)有序的基因表達(dá)變化是細(xì)胞特異性發(fā)育過程的基礎(chǔ)排苍。越來越多的高通量單細(xì)胞測(cè)序技術(shù)被應(yīng)用于揭示這些序列基因表達(dá)的變化。然而学密,由于實(shí)驗(yàn)測(cè)量會(huì)破壞細(xì)胞淘衙,因此只能使用時(shí)間快照測(cè)量,并且不可能觀察到同一個(gè)細(xì)胞隨時(shí)間的變化则果。
計(jì)算方法可以使用單細(xì)胞快照推斷發(fā)育過程中連續(xù)的基因表達(dá)變化幔翰。然而漩氨,基于相似性的軌跡推斷無法預(yù)測(cè)細(xì)胞轉(zhuǎn)變的方向或相對(duì)速率西壮。推斷RNA速度的方法通過擬合一個(gè)微分方程系統(tǒng)來解決這些限制,該系統(tǒng)使用拼接和非拼接轉(zhuǎn)錄計(jì)數(shù)來描述轉(zhuǎn)錄變化的方向和速率叫惊。單細(xì)胞表觀基因組也被用于推斷細(xì)胞分化的方向款青,但這些方法沒有包含基因表達(dá)。
單細(xì)胞多組學(xué)測(cè)量提供了將表觀基因組數(shù)據(jù)納入轉(zhuǎn)錄機(jī)制模型的機(jī)會(huì)霍狰。表觀基因組和轉(zhuǎn)錄組在細(xì)胞分化過程中都會(huì)發(fā)生變化抡草,因此饰及,單細(xì)胞多組分?jǐn)?shù)據(jù)集中的時(shí)間快照可能會(huì)揭示這些分子層之間的相互作用。
現(xiàn)有的RNA速度模型假設(shè)基因的轉(zhuǎn)錄速率在基因表達(dá)的誘導(dǎo)階段是一致的康震。然而燎含,表觀基因組的變化在調(diào)節(jié)基因表達(dá)方面起著關(guān)鍵作用,因此腿短,一個(gè)更現(xiàn)實(shí)的模型將反映增強(qiáng)子和啟動(dòng)子染色質(zhì)可及性對(duì)轉(zhuǎn)錄速率的影響屏箍。
作者提出了MultiVelo,一種從單細(xì)胞多組分?jǐn)?shù)據(jù)集推斷基因表達(dá)表觀基因調(diào)控的計(jì)算方法橘忱。作者擴(kuò)展了動(dòng)態(tài)RNA速度模型赴魁,將多組分測(cè)量納入其中,以便更準(zhǔn)確地預(yù)測(cè)每個(gè)細(xì)胞的過去和未來狀態(tài)钝诚,共同推斷每個(gè)模式的瞬時(shí)誘導(dǎo)或抑制率颖御,并確定模式之間的耦合程度或時(shí)間延遲。
MultiVelo:一個(gè)包含染色質(zhì)可及性的基因表達(dá)微分方程模型
MultiVelo將基因表達(dá)過程描述為一個(gè)由三個(gè)常微分方程(ODE)組成的系統(tǒng)凝颇,其特征是一組切換時(shí)間和速率參數(shù)(圖1a)潘拱。該模型代表了一種有意簡(jiǎn)化的基因表達(dá)觀點(diǎn),其中染色質(zhì)修飾物和轉(zhuǎn)錄因子(TF)的復(fù)雜作用被抽象為速率常數(shù)拧略。
從這些假設(shè)出發(fā)泽铛,給出了一個(gè)具有兩個(gè)有趣的定性性質(zhì)的數(shù)學(xué)模型。首先辑鲤,染色質(zhì)可及性和RNA轉(zhuǎn)錄狀態(tài)有多種數(shù)學(xué)上可行的組合盔腔。也就是說,當(dāng)轉(zhuǎn)錄被誘導(dǎo)或抑制時(shí)月褥,染色質(zhì)可以打開或關(guān)閉弛随。這意味著事件可能有多種順序:染色質(zhì)關(guān)閉可能發(fā)生在轉(zhuǎn)錄抑制開始之前或之后(圖1b)。作者將第一順序(染色質(zhì)關(guān)閉在轉(zhuǎn)錄抑制之前開始)稱為模式1宁赤,第二順序稱為模式2舀透。
在基因表達(dá)過程的開始,染色質(zhì)在轉(zhuǎn)錄開始之前打開决左。這將創(chuàng)建一個(gè)時(shí)間間隔愕够,在此期間染色質(zhì)可及性c(t)為正,而未切割前mRNA?u(t)和剪接成熟mRNA?s(t)均為零(圖1c)佛猛。這種現(xiàn)象稱為啟動(dòng)惑芭。此外,在基因表達(dá)過程的末尾继找,染色質(zhì)關(guān)閉和轉(zhuǎn)錄抑制可能在不同的時(shí)間發(fā)生遂跟。這創(chuàng)造了一個(gè)時(shí)間間隔,在這個(gè)時(shí)間間隔內(nèi),染色質(zhì)可及性和基因表達(dá)朝相反的方向移動(dòng)(圖1d)幻锁,稱之為脫鉤現(xiàn)象凯亮。
MultiVelo通過單細(xì)胞數(shù)據(jù)估計(jì)的常微分方程參數(shù),推斷并量化這些多階和多類型不一致現(xiàn)象哄尔。首先假消,轉(zhuǎn)換時(shí)間(tc、ti和tr)表明染色質(zhì)關(guān)閉岭接、轉(zhuǎn)錄誘導(dǎo)和轉(zhuǎn)錄抑制開始的時(shí)間置谦。其次,MultiVelo擬合的參數(shù)可用于確定每個(gè)基因是否觀察到模型1或模型2的值最適合(圖1)亿傅。
MultiVelo區(qū)分了胚胎小鼠腦基因表達(dá)調(diào)控的兩種模式
作者首先將MultiVelo應(yīng)用于胚胎小鼠大腦胚胎第18天(E18)的10x Multiome數(shù)據(jù)媒峡。MultiVelo精確地?cái)M合了觀察到的整個(gè)腦細(xì)胞群體的染色質(zhì)可及性、未切割前mRNA和剪接mRNA計(jì)數(shù)葵擎,確定了426個(gè)基因谅阿,其模式很可能符合模型。MultiVelo推斷出的速度矢量和潛伏時(shí)間值準(zhǔn)確地恢復(fù)了哺乳動(dòng)物皮層發(fā)育的已知軌跡酬滤。
具體來說签餐,腦室下區(qū)外的放射狀膠質(zhì)細(xì)胞(RG)產(chǎn)生神經(jīng)元、星形膠質(zhì)細(xì)胞和少突膠質(zhì)細(xì)胞盯串。在神經(jīng)元遷移過程中氯檐,皮質(zhì)層是由內(nèi)向外形成的,新生細(xì)胞向上層移動(dòng)体捏,而較老的細(xì)胞停留在較深層冠摄。RG細(xì)胞可以分裂為中間祖細(xì)胞(IPC),作為神經(jīng)干細(xì)胞几缭,并進(jìn)一步在不同層產(chǎn)生各種成熟的興奮性神經(jīng)元河泳。
與僅RNA模型(如scVelo)相比,結(jié)合染色質(zhì)可及性和基因表達(dá)可提高速度估計(jì)的準(zhǔn)確性(圖2a)年栓。特別是拆挥,僅RNA模型預(yù)測(cè)上層神經(jīng)元內(nèi)的生物異常回流(圖2b)某抓。細(xì)胞周期評(píng)分表明纸兔,發(fā)育過程始于RG附近的循環(huán)種群(圖2c),證實(shí)了MultiVelo推斷的潛伏期否副。
作者預(yù)計(jì)汉矿,染色質(zhì)可及性的增加將最有助于區(qū)分染色質(zhì)重塑和基因表達(dá)不同步的細(xì)胞狀態(tài)。兩個(gè)明顯的例子是Eomes和Tle4副编,它們是IPC和深層神經(jīng)元的典型標(biāo)記负甸。這些基因的RNA轉(zhuǎn)錄物僅在一種或兩種特定的細(xì)胞類型中高度表達(dá)流强,使得RNA速度方法很難區(qū)分它們的相對(duì)順序(圖2d)痹届。換而言之呻待,結(jié)合染色質(zhì)可以讓我們推斷出3D速度矢量,指示每個(gè)細(xì)胞對(duì)每個(gè)基因的預(yù)測(cè)分化队腐,比僅從RNA中提取二維相圖更好地分辨細(xì)胞差異蚕捉。
MultiVelo確定了該數(shù)據(jù)集中模型1或模型2最好描述的基因的清晰示例。比較模型1和模型2的基因相圖柴淘,可以發(fā)現(xiàn)最大染色質(zhì)可及性的時(shí)間存在明顯差異迫淹,與模型預(yù)測(cè)一致(圖2e)。模式1基因如Satb2在轉(zhuǎn)錄誘導(dǎo)階段達(dá)到最大染色質(zhì)可接近性为严,而模式2基因如Gria2在轉(zhuǎn)錄抑制階段達(dá)到最大可接近性(圖2f)敛熬。
進(jìn)一步研究了模型1和模型2基因,以了解它們是否具有任何特性第股∮γ瘢基因本體分析表明,M2基因在與細(xì)胞周期相關(guān)的術(shù)語上顯著富集夕吻。此外诲锹,模型2基因往往在潛伏期比模型1基因更早達(dá)到最高的剪接表達(dá)(圖2g)。假設(shè)細(xì)胞可能使用模型2快速涉馅、短暫地激活不需要維持表達(dá)的基因归园,而模型1可能對(duì)需要穩(wěn)定表達(dá)的基因有用。
接下來稚矿,作者研究了每種類型的基因表達(dá)動(dòng)力學(xué)(僅誘導(dǎo)庸诱、僅抑制、模型1或模型2)發(fā)生的頻率晤揣。大多數(shù)高度可變的基因都顯示誘導(dǎo)和抑制階段偶翅,對(duì)于只有部分軌跡的基因,僅誘導(dǎo)階段的相圖比僅抑制階段更常見(圖2h)碉渡。無論基因是完全動(dòng)力學(xué)還是部分動(dòng)力學(xué)聚谁,MultiVelo都符合描述染色質(zhì)可及性和基因表達(dá)動(dòng)力學(xué)三維軌跡的ODE參數(shù)(圖2i)。
MultiVelo確定胚胎小鼠大腦中的表觀基因啟動(dòng)和去耦聯(lián)
MultiVelo確定了10x Multiome數(shù)據(jù)中四種狀態(tài)的清晰示例(圖3a)滞诺。例如形导,Grin2b是一個(gè)僅誘導(dǎo)的基因,因此僅預(yù)測(cè)該基因的誘導(dǎo)狀態(tài)(啟動(dòng)和耦合)(圖3a)习霹。模型1基因Nfix的相圖具有完整的軌跡形狀朵耕,并標(biāo)有所有四種狀態(tài)(圖3a)。相反淋叶,Epha5是一個(gè)模式2基因阎曹,在整個(gè)時(shí)間范圍內(nèi),它的可接近性持續(xù)上升,沒有觀察到閉合階段处嫌,因此它只占據(jù)耦合和解耦狀態(tài)(圖3a)栅贴。
Robo2 RNA表達(dá)和染色質(zhì)可及性之間的最大差異出現(xiàn)在圓形區(qū)域,預(yù)計(jì)該區(qū)域處于去耦狀態(tài)(圖3b)熏迹。Robo2是模式1基因檐薯;染色質(zhì)關(guān)閉開始后,表達(dá)水平保持在相對(duì)較高的水平注暗。同樣坛缕,Gria2的可及性與去耦狀態(tài)下的RNA不同(圖3b)。模式2基因Gria2的染色質(zhì)可及性在轉(zhuǎn)錄誘導(dǎo)期之后繼續(xù)增加捆昏。此外赚楚,基因Grin2b顯示了染色質(zhì)啟動(dòng)階段染色質(zhì)在RNA生成之前打開(圖3b)。
沿著每個(gè)基因的推斷時(shí)間t繪制c骗卜、u和s可以讓我們?cè)敿?xì)檢查狀態(tài)轉(zhuǎn)換(圖3c)宠页。首先,Robo2的u(t)和s(t)值顯示了轉(zhuǎn)錄抑制階段的兩個(gè)拐點(diǎn)膨俐,對(duì)應(yīng)于從耦合態(tài)到解耦態(tài)以及從解耦態(tài)到耦合態(tài)的轉(zhuǎn)變(圖3c)勇皇。這種模式表明,在u(t)和s(t)中可以看到染色質(zhì)閉合和轉(zhuǎn)錄抑制的不同作用焚刺。
換句話說敛摘,MultiVelo預(yù)測(cè),對(duì)于Robo2乳愉,染色質(zhì)關(guān)閉會(huì)降低總轉(zhuǎn)錄速率兄淫,因?yàn)镽NA水平在染色質(zhì)切換后立即開始下降。隨后轉(zhuǎn)錄速率從正轉(zhuǎn)為零會(huì)引起第二個(gè)拐點(diǎn)蔓姚,導(dǎo)致RNA表達(dá)更快速的下調(diào)捕虽。Gria2的c(t)、u(t)和s(t)曲線圖顯示了相反的趨勢(shì):即使在轉(zhuǎn)換到轉(zhuǎn)錄抑制后坡脐,c仍繼續(xù)上升泄私,導(dǎo)致c和u在去耦狀態(tài)下朝相反的方向移動(dòng)(圖3c)。在Grin2b的長(zhǎng)啟動(dòng)階段备闲,c(t)開始上升晌端,而u(t)和s(t)保持在零(圖3c)。
因?yàn)镸ultiVelo適合每個(gè)基因的速率和切換時(shí)間參數(shù)恬砂,作者的分析提供了一個(gè)觀察基因調(diào)節(jié)一般趨勢(shì)的機(jī)會(huì)咧纠。首先,確實(shí)存在通過神經(jīng)元簇的級(jí)聯(lián)狀態(tài)轉(zhuǎn)換泻骤;每個(gè)細(xì)胞的多個(gè)基因通常同時(shí)處于啟動(dòng)或解耦狀態(tài)(圖3d)漆羔。其次梧奢,發(fā)現(xiàn)耦合的開和耦合的關(guān)閉狀態(tài)在基因表達(dá)過程中所占的比例大于啟動(dòng)和解耦狀態(tài)(圖3e)。此外演痒,還發(fā)現(xiàn)染色質(zhì)通常以相似的速度打開和關(guān)閉亲轨;推斷的染色質(zhì)閉合率和染色質(zhì)開放率之間的中位數(shù)比率幾乎恰好為1(圖3f)。
MultiVelo量化小鼠毛囊SHARE序列數(shù)據(jù)中的表觀基因啟動(dòng)
最近的一項(xiàng)研究使用SHARE-seq來研究毛囊組織中運(yùn)輸擴(kuò)增細(xì)胞(TAC)的快速增殖嫡霞,這些細(xì)胞會(huì)產(chǎn)生一些成熟的效應(yīng)細(xì)胞瓶埋,包括內(nèi)根鞘(IRS)和毛干層:角質(zhì)層希柿、皮質(zhì)層和髓質(zhì)诊沪。當(dāng)應(yīng)用于此數(shù)據(jù)集時(shí),MultiVelo正確識(shí)別了從TAC到IRS和毛干細(xì)胞的分化方向(圖4a)曾撤,而僅使用RNA的速度分析無法捕捉到毛干分化方向(圖4b)端姚。與小鼠大腦相比,此數(shù)據(jù)集中僅誘導(dǎo)更多挤悉,模型2基因更少(圖4c)渐裸。
事實(shí)上,UMAP圖以可及性著色装悲,未分割和剪接的mRNA表達(dá)在各模式中顯示出明顯的時(shí)間延遲(圖4d)昏鹃。接下來,作者檢查了SHARE序列中確定的其他基因诀诊。擬合模型表明洞渤,MultiVelo捕捉了每個(gè)基因的動(dòng)態(tài),并提供了啟動(dòng)和去耦區(qū)域的清晰圖示(圖4e)属瓣。
Wnt3上的動(dòng)態(tài)時(shí)間扭曲(DTW)結(jié)果表明载迄,與基因表達(dá)之前的染色質(zhì)可及性一致(圖4f,頂部)抡蛙。未拼接和拼接表達(dá)式顯示了類似的模式护昧,但具有較短的時(shí)間延遲(圖4f)。由于DTW將早期曲線上的每個(gè)時(shí)間點(diǎn)映射到后期曲線上的一個(gè)時(shí)間點(diǎn)粗截,因此可以通過減去匹配點(diǎn)的時(shí)間來計(jì)算每個(gè)時(shí)間點(diǎn)的時(shí)間滯后(圖4f)惋耙。
MultiVelo揭示了人類HSPC的早期表觀基因組和轉(zhuǎn)錄組變化
血細(xì)胞分化是一個(gè)很難用RNA速度建模的系統(tǒng)。然而熊昌,作者發(fā)現(xiàn)合并染色質(zhì)信息可以提高造血數(shù)據(jù)集中預(yù)測(cè)細(xì)胞方向的局部一致性和生物學(xué)準(zhǔn)確性(圖5a)绽榛。與小鼠大腦一樣,MultiVelo預(yù)測(cè)模型1在這個(gè)數(shù)據(jù)集中比模型2更常見浴捆;誘導(dǎo)是第二個(gè)最常見的基因類別(圖5b)蒜田。觀測(cè)到的素?cái)?shù)間隔和解耦間隔的中值長(zhǎng)度比耦合相位的中值長(zhǎng)度短(圖5c)。這些模式與在小鼠大腦數(shù)據(jù)集中觀察到的一致选泻,表明可能存在共同的潛在生物學(xué)機(jī)制冲粤。
與小鼠大腦數(shù)據(jù)集一樣美莫,HSPC數(shù)據(jù)集中的模型2基因顯著豐富了與細(xì)胞周期相關(guān)的基因術(shù)語。研究髓系梯捕、紅系和血小板系的分離軌跡厢呵,許多G2/M期標(biāo)記基因顯示出清晰的模型2模式,表達(dá)開始下降后染色質(zhì)可及性最高(圖5d)傀顾。MultiVelo擬合的基因模型揭示了許多啟動(dòng)的例子(圖5e)襟铭。
繪圖速度允許我們更詳細(xì)地檢查局部染色質(zhì)和RNA趨勢(shì)(圖5f,g)短曾。雖然染色質(zhì)在這些基因開始時(shí)表現(xiàn)出最大潛力(最高速度)寒砖,但對(duì)于RNA來說,干細(xì)胞群體如HSC嫉拐、多能祖細(xì)胞哩都、巨核細(xì)胞紅細(xì)胞祖細(xì)胞和GMP在向一個(gè)譜系分化的過程中表現(xiàn)出更強(qiáng)的潛力。
MultiVelo與發(fā)育中人腦的TFs婉徘、多態(tài)位點(diǎn)和基因表達(dá)相關(guān)
將MultiVelo應(yīng)用于最近發(fā)布的來自開發(fā)人類皮質(zhì)的10x Multiome數(shù)據(jù)集漠嵌。與胚胎小鼠大腦數(shù)據(jù)集一樣,MultiVero推斷出與已知腦細(xì)胞發(fā)育模式一致的速度矢量(圖6a)盖呼。MultiVelo正確推斷RG附近的循環(huán)細(xì)胞群是潛伏期最早的細(xì)胞類型儒鹿。相反,在沒有染色質(zhì)信息的情況下推斷出的速度矢量預(yù)測(cè)了IPC和上層興奮性神經(jīng)元的不一致回流(圖6b)几晤。與小鼠大腦數(shù)據(jù)集一樣约炎,確定了模型1和模型2基因的明確示例(圖6c),盡管在人類數(shù)據(jù)集中預(yù)測(cè)遵循模型2的基因較少(圖6d)锌仅。
MultiVelo的一個(gè)關(guān)鍵優(yōu)點(diǎn)是它能夠?qū)⒓?xì)胞置于從染色質(zhì)和表達(dá)數(shù)據(jù)推斷出的潛伏時(shí)間尺度上章钾。潛伏期可以識(shí)別基因座表達(dá)和可訪問性之間的時(shí)間滯后,而不僅僅是基因附近的基因座热芹。例如贱傀,潛伏期可用于計(jì)算TF表達(dá)與其結(jié)合位點(diǎn)可及性之間的時(shí)間長(zhǎng)度(圖6e-f)。
MultiVelo推斷的潛伏期也有助于將疾病相關(guān)變異位點(diǎn)的染色質(zhì)可及性與附近基因的表達(dá)聯(lián)系起來伊脓。作者收集了6968個(gè)單核苷酸多態(tài)性(SNPs)及其相關(guān)基因的列表府寒,這些基因與精神疾病的全基因組關(guān)聯(lián)研究有關(guān),包括雙相情感障礙和精神分裂癥报腔。利用MultiVelo的潛伏期株搔,我們確定了每個(gè)SNP的最大可達(dá)性時(shí)間以及SNP可達(dá)性與其連鎖基因最大表達(dá)之間的時(shí)間差(圖6g)。
討論
總之纯蛾,MultiVelo建模反映了時(shí)間染色質(zhì)可及性和基因表達(dá)水平纤房,并量化了染色質(zhì)可獲性和基因表現(xiàn)暫時(shí)不同步的啟動(dòng)和去耦間隔的長(zhǎng)度。模型精確地?cái)M合了胚胎小鼠大腦翻诉、小鼠背部皮膚炮姨、胎兒人腦和人類HSPC的單細(xì)胞多組分?jǐn)?shù)據(jù)集捌刮。作者發(fā)現(xiàn),合并染色質(zhì)可及性數(shù)據(jù)可以提高速度估計(jì)的總體準(zhǔn)確性舒岸,在經(jīng)歷快速表觀基因組變化的早期干細(xì)胞中差異最大绅作。
MultiVelo開創(chuàng)的最令人興奮的新方向是將分化過程中的表觀基因組和轉(zhuǎn)錄變化聯(lián)系起來的能力。未來工作的一個(gè)有趣方向是將該方法擴(kuò)展到包括基因表達(dá)過程的其他步驟蛾派。MultiVelo將在一系列生物環(huán)境中俄认,包括正常細(xì)胞分化、重編程和疾病洪乍,對(duì)基因表達(dá)的表觀基因調(diào)控提供見解眯杏。
教授介紹
Joshua D. Welch教授就職于美國(guó)密西根大學(xué)。他的研究旨在通過開發(fā)新的工具來解決生物醫(yī)學(xué)研究和計(jì)算機(jī)科學(xué)中的基本問題典尾,這些工具是為高通量測(cè)序技術(shù)量身定制的役拴。從廣義上講糊探,他試圖了解哪些基因定義了健康組織中細(xì)胞類型和細(xì)胞狀態(tài)的補(bǔ)充钾埂,細(xì)胞如何分化,以及特定細(xì)胞類型中基因的失調(diào)如何導(dǎo)致人類疾病科平。
作為計(jì)算方法的開發(fā)人員褥紫,Joshua D. Welch教授尋求使用和改進(jìn)機(jī)器學(xué)習(xí)方法,特別是用于高維數(shù)據(jù)的無監(jiān)督分析弃酌。最近氨菇,他專注于開發(fā)用于處理妓湘、分析和建模單細(xì)胞測(cè)序數(shù)據(jù)的開源軟件查蓉。該領(lǐng)域的主要貢獻(xiàn)包括SingleSplice,第一種用于單細(xì)胞剪接分析的計(jì)算方法;SLICER唬党,一種推斷發(fā)展軌跡的算法;和MATCHER房铭,第一種整合單細(xì)胞轉(zhuǎn)錄組和表觀基因組數(shù)據(jù)的方法。并且辩诞,應(yīng)用這些方法研究干細(xì)胞分化撩炊、體細(xì)胞重編程和大腦骆膝。
參考文獻(xiàn)
Li C, Virgilio MC, Collins KL, Welch JD. Multi-omic single-cell velocity models epigenome-transcriptome interactions and improves cell fate prediction. Nat Biotechnol. 2022;10.1038/s41587-022-01476-y. doi:10.1038/s41587-022-01476-y