Top5 -2021年度單細(xì)胞基因組學(xué)論文

博文名稱:Top 5 Single-cell Genomics Papers of 2021
博文鏈接:https://towardsdatascience.com/top-5-single-cell-genomics-papers-of-2021-d9c8cfcda643
發(fā)表時(shí)間:Dec 24, 2021


回顧今年大數(shù)據(jù)時(shí)代下一些激動(dòng)人心的論文


image.png

在生物學(xué)大數(shù)據(jù)時(shí)代烫止,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的蓬勃發(fā)展涧偷,得益于它們在生物學(xué)領(lǐng)域中的跨學(xué)科應(yīng)用雇逞。特別是2021年,對于單細(xì)胞基因組學(xué)來說尤其重要吃靠,這是一個(gè)仍處于起步階段的領(lǐng)域,它利用數(shù)據(jù)科學(xué)的概念足淆,在單個(gè)細(xì)胞的分辨率下巢块,解析高維生物數(shù)據(jù)。作為該學(xué)科的研究生巧号,我讀了很多文獻(xiàn)以了解最新進(jìn)展(還有大量的閱讀清單要趕W迳荨),我想和大家分享一下我今年讀過的一些很好的文獻(xiàn)丹鸿。

1. Specious Art of Single-cell Genomics

單細(xì)胞基因組學(xué)的奇異藝術(shù)
https://www.biorxiv.org/content/10.1101/2021.08.25.457696v3

在你讀到的大約80-90%的單細(xì)胞論文中歹鱼,根據(jù)研究問題的不同,至少會(huì)有一兩張tSNE或UMAP圖來可視化他們收集的數(shù)據(jù)卜高,通常是單細(xì)胞RNA測序(scRNA-seq)數(shù)據(jù)弥姻,其中對單個(gè)細(xì)胞的整個(gè)基因組中的RNA豐度進(jìn)行分析南片。

文章使用了一個(gè)極端的例子,細(xì)胞在高維空間中保持等距庭敦,然后將其釋放到近等距離疼进,他們展示了tSNE和UMAP在原始空間中具有近等間距的細(xì)胞組如何扭曲方向,并將它們與均勻分布得更遠(yuǎn)的細(xì)胞組聚集在一起秧廉。然后伞广,他們繼續(xù)演示了一種半監(jiān)督降維方法,該方法可以將數(shù)據(jù)擬合到預(yù)定義的形狀(例如疼电,大象)嚼锄,同時(shí)似乎在將數(shù)據(jù)映射到低維嵌入方面表現(xiàn)更好。由于其大膽而令人信服的論據(jù)蔽豺,它在推特上引起了很多積極的討論区丑,推特上的內(nèi)容超過了1000次,資深作者Lior Pachter也積極參與了討論修陡。

2. Quantifying the effect of experimental perturbations at single-cell resolution

在單細(xì)胞分辨率下量化實(shí)驗(yàn)擾動(dòng)的影響
https://www.nature.com/articles/s41587-020-00803-5

開發(fā)PHATE算法的同一個(gè)實(shí)驗(yàn)室沧侥,提出了一種新方法,確定實(shí)驗(yàn)處理(experimental treatments)如何在單細(xì)胞分辨率下影響高維數(shù)據(jù)的結(jié)構(gòu)魄鸦。這是醫(yī)學(xué)中的一個(gè)重要問題宴杀,例如在研究新的癌癥療法或COVID-19治療效果時(shí)。

使用單細(xì)胞方法(如 scRNA-seq)在很大程度上有助于公正地了解這些治療對感興趣組織的影響拾因。但是當(dāng)你考慮到批次效應(yīng)產(chǎn)生的技術(shù)噪音旺罢,樣本的生物異質(zhì)性,處理數(shù)目增加(例如绢记,樣品 A 接受藥物 X主经,樣品 B 接受藥物 Y,樣品 C 接受安慰劑等)庭惜,以及樣品暴露于藥物/治療的時(shí)間罩驻,這些方法可能會(huì)受到阻礙影響。

作者使用了一種稱為MELD的算法來解決這個(gè)問題护赊,該算法使用圖形信號(hào)處理來確定細(xì)胞受實(shí)驗(yàn)擾動(dòng)影響的可能性惠遏。然后,他們擴(kuò)展了這種方法骏啰,衍生出一種稱為頂點(diǎn)頻率聚類(Vertex Frequency Clustering节吮,VFC)的聚類算法,該算法在對細(xì)胞進(jìn)行分組時(shí)不僅考慮轉(zhuǎn)錄譜的相似性判耕,而且還考慮了受到上述相同處理影響的可能性透绩。在另一個(gè)研究中(詳見附錄),他將MELD應(yīng)用于 COVID-19 患者的單細(xì)胞數(shù)據(jù)分析。

3. Chimeric Contributions of Human Extended Pluripotent Stem Cells to Monkey Embryos ex vivo

體外人擴(kuò)展多能干細(xì)胞對猴胚胎的嵌合作用
https://pubmed.ncbi.nlm.nih.gov/33861963/

與第一篇文章一樣帚豪,這是另一篇有爭議的論文碳竟,對于一般讀者來說,原因可能更清楚狸臣。在這里莹桅,作者展示了他們?nèi)绾螌⑷祟惛杉?xì)胞移植到猴子的胚胎中,在那里他們能夠生長和分化烛亦,創(chuàng)造出一種嵌合體(chimera)—一種由一種或多種不同生物體的細(xì)胞組成的生物體诈泼,靈感來自希臘神話中的野獸。然后煤禽,他們進(jìn)行了scRNA-seq铐达,利用tSNE將這些嵌合胚胎與純?nèi)祟惡秃镒优咛ミM(jìn)行比較和對比。這讀起來像科幻小說中的東西檬果,比如《人猿星球》瓮孙,但他們?yōu)槭裁匆@么做呢?再生醫(yī)學(xué)(regenerative medicine)的一個(gè)令人興奮的途徑是能夠產(chǎn)生細(xì)胞和器官來替換人類受損的組織或器官汁汗,建立疾病模型衷畦,并測試治療該疾病的藥物栗涂。

希望是利用患者自身的細(xì)胞創(chuàng)造出一種嵌合體知牌,這種嵌合體含有專門為患者生長的人體器官,從而支持再生醫(yī)學(xué)領(lǐng)域斤程。目標(biāo)不是創(chuàng)造人類/猴子的雜交角寸,甚至不是從猴子身上獲取人體器官,因?yàn)檫@涉及到倫理問題忿墅。相反扁藕,由于我們進(jìn)化上的相似性,科學(xué)家希望以此為模型來研究宿主胚胎細(xì)胞與外來細(xì)胞之間的串?dāng)_疚脐,然后將其推廣到進(jìn)化上更遙遠(yuǎn)的物種(如豬)中生長的人體器官亿柑,因?yàn)樵谶@些物種中,倫理并不那么模糊棍弄。

4. Whole-cell segmentation of tissue images with human-level performance using large-scale data annotation and deep learning

利用大規(guī)模數(shù)據(jù)注釋和深度學(xué)習(xí)對組織圖像進(jìn)行具有人類水平的全細(xì)胞分割
https://www.nature.com/articles/s41587-021-01094-0

我的實(shí)驗(yàn)室為我們的研究做了很多熒光顯微鏡檢查望薄。在這樣的實(shí)驗(yàn)室工作,我最喜歡的事情之一就是看到單個(gè)細(xì)胞在顯微鏡的熒光標(biāo)記下發(fā)光呼畸。這就像觀察迷你星系痕支,但不是恒星和行星,而是細(xì)胞蛮原。與scRNA-seq不同卧须,提取生物信息不需要破壞樣本,這有助于重新利用樣本進(jìn)行額外檢測,以及獲取細(xì)胞的空間信息花嘶,從而為這些細(xì)胞作為一個(gè)整體的潛在功能提供更多信息笋籽。

然而,該領(lǐng)域的一個(gè)經(jīng)常性挑戰(zhàn)是在這些顯微鏡圖像中自動(dòng)分割細(xì)胞——分離和定位單個(gè)細(xì)胞察绷。已經(jīng)有許多工具被設(shè)計(jì)用來解決這些挑戰(zhàn)干签,但它們在更大、更復(fù)雜的數(shù)據(jù)集和組織類型方面往往不夠拆撼,而自動(dòng)化在這些方面尤為重要容劳。

為了解決這個(gè)問題,一組研究人員構(gòu)建了一個(gè)名為 TissueNet 的龐大數(shù)據(jù)集闸度,其中包含來自多個(gè)成像平臺(tái)和多種器官(包括正常組織和患病組織)的超過 100 萬個(gè)手動(dòng)標(biāo)記的細(xì)胞竭贩,包括正常和病變組織。然后莺禁,他們在這個(gè)數(shù)據(jù)集上訓(xùn)練了一個(gè)稱為Mesmer的深度學(xué)習(xí)模型來分割單個(gè)細(xì)胞留量。由于組織樣本的多樣性和龐大的樣本量,它是一種很有前景的資源哟冬,可以用作你感興趣的數(shù)據(jù)集的遷移學(xué)習(xí)中的預(yù)訓(xùn)練模型楼熄,并且我可能會(huì)在新的一年里自己進(jìn)行實(shí)驗(yàn)。

5. Single-cell transcriptomic characterization of a gastrulating human embryo

原腸胚形成的單細(xì)胞轉(zhuǎn)錄組學(xué)特征

https://www.nature.com/articles/s41586-021-04158-y

最后這篇論文為我們理解人類發(fā)展提供了新的視角浩峡。我們都是從一個(gè)沒有意識(shí)的單個(gè)細(xì)胞開始的可岂,它迅速膨脹成一團(tuán)細(xì)胞,形成一個(gè)胚胎翰灾。一旦它附著在我們母親的子宮上(這個(gè)過程稱為著床缕粹,implantation),我們的主要組織和器官就會(huì)開始發(fā)育纸淮。

在過去的幾十年里平斩,我們已經(jīng)了解了很多關(guān)于胚胎植入前(pre-implantation)發(fā)育的早期機(jī)制,但是我們對植入后(post-implantation)發(fā)育的了解還有很多不足之處咽块。由于明顯的倫理考慮绘面,很難闡明人類這一過程的全部機(jī)制,我們只能從體外(即在皮氏培養(yǎng)皿中)模型中研究這么多侈沪。

本文的作者通過對受精后16-19天自愿捐贈(zèng)的男性胚胎進(jìn)行單細(xì)胞RNA測序來闡明這些機(jī)制揭璃。在這一階段,胚胎正在形成早期的細(xì)胞層峭竣,形成發(fā)育中人類的主要組織和器官塘辅。在這個(gè)階段,胚胎正在形成初始層皆撩,產(chǎn)生發(fā)育中的人類的主要組織和器官扣墩。對這一過程的透徹理解可以收集關(guān)于先天性疾病如何發(fā)生以及妊娠并發(fā)癥的見解哲银,從而為未來的治療和干預(yù)工作提供信息。

使用擴(kuò)散映射(diffusion maps)和RNA速率(RNA velocity)等計(jì)算方法呻惕,作者確定了發(fā)育“軌跡”—細(xì)胞在計(jì)算推斷的發(fā)育時(shí)間線中的排列方式——從而洞察了誘導(dǎo)胚胎中新生干細(xì)胞向更成熟細(xì)胞轉(zhuǎn)化的轉(zhuǎn)錄網(wǎng)絡(luò)荆责,組織特異性細(xì)胞,如早期血細(xì)胞亚脆,以及這些事件發(fā)生的時(shí)間做院。這項(xiàng)工作提供了一個(gè)令人興奮的資源,可以與植入后發(fā)育的體外模型的數(shù)據(jù)進(jìn)行比較(正如這篇偉大的論文所做的:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8185470/)也是發(fā)育生物學(xué)領(lǐng)域的一次重大飛躍濒持。


附錄

Multiscale PHATE Exploration of SARS-CoV-2 Data Reveals Multimodal Signatures of Disease

SARS-CoV-2數(shù)據(jù)的多尺度PHATE探索揭示疾病的多模態(tài)特征

https://www.biorxiv.org/content/10.1101/2020.11.15.383661v1

雖然 Krishnaswamy實(shí)驗(yàn)室的這份預(yù)印本于2020年底出版键耕,但今年發(fā)現(xiàn)了它,并有機(jī)會(huì)在今年秋天參加了Dr. Smita Krishnaswamy博士的虛擬研討會(huì)柑营,她在會(huì)上詳細(xì)介紹了這項(xiàng)工作屈雄。正如標(biāo)題所示,這是她實(shí)驗(yàn)室的PHATE算法的擴(kuò)展官套,這是另一種降維算法酒奶。Multiscale PHATE的關(guān)鍵在于它可以在多個(gè)分辨率或尺度上可視化高維數(shù)據(jù)——因此有了“多尺度”(multiscale)這個(gè)詞。

根據(jù)分辨率(resolution)奶赔、粒度(granularity)或規(guī)模(scale)惋嚎,我指的是流形(manifold)中呈現(xiàn)的詳細(xì)程度。例如站刑,在粗粒度嵌入(oarse-grained embedding, )中另伍,我們獲得了相關(guān)數(shù)據(jù)的高層次的概要,重點(diǎn)是全局結(jié)構(gòu)和將臨近細(xì)胞折疊為奇異點(diǎn)笛钝。相比之下质况,更細(xì)粒度的流形可以深入了解細(xì)胞之間的變化(或者更一般地說愕宋,附近的數(shù)據(jù)點(diǎn)之間可能存在的差異)玻靡。在幾乎所有降維算法中—PCA、tSNE中贝、UMAP囤捻,甚至 PHATE——默認(rèn)情況下,我們只能看到一個(gè)分辨率或底層流形的粒度級(jí)別邻寿。

然而蝎土,考慮數(shù)據(jù)中的所有詳細(xì)程度可能是有用的,例如绣否,在預(yù)測疾病嚴(yán)重程度時(shí)誊涯。在持續(xù)的 COVID-19 大流行中,有大量論文和預(yù)印本利用患者細(xì)胞的單細(xì)胞基因組學(xué)來了解SARS-CoV-2病毒對我們細(xì)胞的影響蒜撮,這可以深入了解死亡率結(jié)果暴构。然而跪呈,僅僅從一個(gè)尺度上看數(shù)據(jù),我們可能會(huì)忽略通過考慮患者樣本中存在多少免疫細(xì)胞來區(qū)分有效免疫反應(yīng)的細(xì)節(jié)取逾。

這就是Multiscale PHATE的動(dòng)機(jī)耗绿,他們將其應(yīng)用于COVID-19患者的真實(shí)的單細(xì)胞數(shù)據(jù)。 使用上述MELD算法砾隅,他們可以根據(jù)疾病嚴(yán)重程度對樣本進(jìn)行分類误阻。受時(shí)間不均勻馬爾可夫過程的啟發(fā),這種方法的數(shù)學(xué)思想非常吸引人晴埂,其應(yīng)用在這場持續(xù)的流行病中非常相關(guān)究反,值得一讀鹏往。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末榕茧,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子同木,更是在濱河造成了極大的恐慌晶丘,老刑警劉巖黍氮,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異浅浮,居然都是意外死亡沫浆,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門滚秩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來专执,“玉大人,你說我怎么就攤上這事郁油”竟桑” “怎么了?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵桐腌,是天一觀的道長拄显。 經(jīng)常有香客問我,道長案站,這世上最難降的妖魔是什么躬审? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮蟆盐,結(jié)果婚禮上承边,老公的妹妹穿的比我還像新娘。我一直安慰自己石挂,他們只是感情好博助,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著痹愚,像睡著了一般富岳。 火紅的嫁衣襯著肌膚如雪罗心。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天城瞎,我揣著相機(jī)與錄音渤闷,去河邊找鬼。 笑死脖镀,一個(gè)胖子當(dāng)著我的面吹牛飒箭,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播蜒灰,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼弦蹂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了强窖?” 一聲冷哼從身側(cè)響起凸椿,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎翅溺,沒想到半個(gè)月后脑漫,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡咙崎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年优幸,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片褪猛。...
    茶點(diǎn)故事閱讀 39,690評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡网杆,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出伊滋,到底是詐尸還是另有隱情碳却,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布笑旺,位于F島的核電站昼浦,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏燥撞。R本人自食惡果不足惜座柱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一迷帜、第九天 我趴在偏房一處隱蔽的房頂上張望物舒。 院中可真熱鬧,春花似錦戏锹、人聲如沸冠胯。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽荠察。三九已至置蜀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間悉盆,已是汗流浹背盯荤。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留焕盟,地道東北人秋秤。 一個(gè)月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像脚翘,于是被迫代替她去往敵國和親灼卢。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容