導(dǎo)--單細(xì)胞測序數(shù)據(jù)分析指南

PMID: 33288955 https://www.nature.com/articles/s41596-020-00409-w#Sec1
DOI: 10.1038/s41596-020-00409-w

單細(xì)胞RNA測序（scRNA-seq）是一種流行且功能強(qiáng)大的技術(shù)截歉，它允許您分析大量單個(gè)細(xì)胞的整個(gè)轉(zhuǎn)錄組只搁。然而氓奈，分析這些實(shí)驗(yàn)產(chǎn)生的大量數(shù)據(jù)需要專門的統(tǒng)計(jì)和計(jì)算方法用爪。這里我們概述了處理scRNA序列數(shù)據(jù)所涉及的計(jì)算工作流程病袄。我們將討論一些最常見的任務(wù)和解決中心生物學(xué)問題的工具。在本文和我們的指南網(wǎng)站(https://scrnaseq-course.cog.sanger.ac.uk/website/index.html)佑女，我們提供有關(guān)執(zhí)行計(jì)算分析的最佳實(shí)踐的指南奥秆。本教程為有興趣分析數(shù)據(jù)的實(shí)驗(yàn)者提供了實(shí)踐指南，也為尋求開發(fā)新計(jì)算方法的生物信息學(xué)家提供了概述傅是。

請直接閱讀原文并實(shí)踐~~

這是一條分割線

介紹

scRNA-seq已成為一種轉(zhuǎn)化技術(shù)匪燕，用于表征復(fù)雜組織，并回答無法通過批量RNA測序解決的問題喧笔。自2009年第一個(gè)scRNA-seq協(xié)議發(fā)布以來帽驯，許多協(xié)議和商業(yè)平臺已經(jīng)發(fā)布。如今书闸，scRNA-seq實(shí)驗(yàn)有兩種主要模式尼变。最常見的方法是使用顯微鏡下的復(fù)制品或孔來分離大量細(xì)胞，然后對文庫進(jìn)行相對較淺的排序4,5浆劲。為了確定給定轉(zhuǎn)錄本來自哪個(gè)細(xì)胞嫌术，這些方法使用了細(xì)胞弧（附在每個(gè)讀數(shù)上的短核苷酸標(biāo)簽是液滴或井所特有的）牌借。這種高通量度气、低深度的模式是使用流行的10×Chromium平臺進(jìn)行實(shí)驗(yàn)的典型模式。這項(xiàng)技術(shù)的一個(gè)重要優(yōu)點(diǎn)是它支持獨(dú)特的分子標(biāo)識符（UMI）膨报。UMI是在擴(kuò)增前附加在轉(zhuǎn)錄本上的短條形碼磷籍，使得消除聚合酶鏈反應(yīng)重復(fù)并獲得更準(zhǔn)確的表達(dá)水平估計(jì)成為可能。一個(gè)主要缺點(diǎn)是該平臺僅允許對每個(gè)信使RNA（mRNA）的5′或3′端進(jìn)行測序现柠。許多研究采取了相反的方法择示，即分離相對較少的細(xì)胞，但更深入地排列它們晒旅。這些低通量栅盲、高深度的實(shí)驗(yàn)通常將細(xì)胞分離到單個(gè)孔中，并應(yīng)用Smart-seq2協(xié)議废恋。除了最近引入的Smart-seq3協(xié)議外谈秫，這些方法不支持UMIs，但它們通常顯示出比基于液滴的技術(shù)更高的靈敏度鱼鼓，并且它們還允許對整個(gè)轉(zhuǎn)錄本進(jìn)行分析拟烫。有關(guān)不同平臺的深入概述，請參閱最近的綜述和相關(guān)標(biāo)準(zhǔn)迄本。

除了促進(jìn)實(shí)驗(yàn)工作流程外硕淑，最近的創(chuàng)新還大大降低了scRNA-seq的每細(xì)胞成本。因此，就所分析的細(xì)胞數(shù)量而言置媳，出現(xiàn)了指數(shù)增長于樟。鑒于生成的數(shù)據(jù)量巨大，單細(xì)胞數(shù)據(jù)分析需要高效的計(jì)算和統(tǒng)計(jì)方法拇囊。隨著實(shí)驗(yàn)協(xié)議的迅速改進(jìn)迂曲，處理數(shù)據(jù)的計(jì)算工作流也得到了改進(jìn)。本教程的目的是為scRNA序列數(shù)據(jù)提供最常見分析類型的概述寥袭。本文旨在作為我們?yōu)榻淌趕cRNA-seq數(shù)據(jù)的計(jì)算分析而開發(fā)的課程材料的配套(https://scrnaseq-course.cog.sanger.ac.uk/website/index.html)路捧。該網(wǎng)站于2016年首次推出，并不斷更新传黄，包括新方法杰扫，并提供最新的最佳實(shí)踐建議。

scRNA序列分析的一個(gè)核心組成部分是表達(dá)矩陣膘掰，它代表每個(gè)基因和細(xì)胞的轉(zhuǎn)錄數(shù)量章姓。工作流程可分為兩個(gè)主要部分：1）表達(dá)式矩陣的生成，2）表達(dá)式矩陣的分析（圖1和表1）炭序。盡管我們的在線教程涵蓋了這兩個(gè)方面，但這里我們重點(diǎn)介紹了獲得表達(dá)式矩陣后執(zhí)行的分析類型苍日。大多數(shù)基因只在一組細(xì)胞類型中使用惭聂，但是，由于在scRNA-seq實(shí)驗(yàn)中普遍使用的起始材料量低和測序深度低相恃，一些基因即使表達(dá)也無法檢測到辜纲。結(jié)果是基因表達(dá)矩陣中存在大量的零值，這是一個(gè)問題拦耐，因?yàn)橐恍┝阒悼梢源砑?xì)胞中實(shí)際的低或零表達(dá)以及測量過程中的變化耕腾。難以區(qū)分這些觀察到的零值并對其進(jìn)行適當(dāng)建模是計(jì)算分析的主要挑戰(zhàn)之一。即使是深度測序的數(shù)據(jù)集也可能有約50%的零杀糯，而測序深度較低的數(shù)據(jù)集可能有99%的零扫俺。相比之下，在非典型批量RNA測序數(shù)據(jù)集中固翰，<20%的數(shù)據(jù)條目為零狼纬。

圖1 | 工作流程概述。在典型場景中骂际，研究人員必須首先組合多個(gè)實(shí)驗(yàn)中的表達(dá)矩陣疗琉，以獲得一個(gè)組合表達(dá)矩陣，該矩陣根據(jù)測序深度歉铝、細(xì)胞周期階段和其他混雜因素進(jìn)行校正盈简。接下來，數(shù)據(jù)被可視化，并通過聚類柠贤、偽時(shí)間和差異表達(dá)分析來識別具有生物學(xué)意義的模式香浩。最后，將結(jié)果與文獻(xiàn)和現(xiàn)有數(shù)據(jù)集進(jìn)行比較种吸。

質(zhì)量控制

分析scRNA序列的第一步是排除不太可能代表完整單個(gè)細(xì)胞的細(xì)胞條形碼弃衍。對于高通量方法，關(guān)鍵步驟是過濾掉不代表單個(gè)細(xì)胞的barcode坚俗。
最直接的方法是計(jì)算需要考慮條形碼作為ACEL11的UMI的數(shù)據(jù)集特定閾值镜盯。或者猖败，一些最近開發(fā)的工具速缆，如MPT-HYDROPS12，首先估計(jì)存在于空孔或液滴中的RNA的背景水平恩闻，然后識別明顯偏離背景的細(xì)胞條形碼艺糜，這表明存在細(xì)胞。這種策略的優(yōu)點(diǎn)是幢尚，相對于樣本中的其他細(xì)胞破停，它能夠檢測RNA含量較低的細(xì)胞類型。

不幸的是尉剩，這些方法都不能區(qū)分完整的活細(xì)胞和受損或垂死的細(xì)胞真慢。必須執(zhí)行第二輪質(zhì)量控制，考慮檢測到的基因數(shù)量理茎、來自線粒體基因組的 RNA 比例以及每個(gè)細(xì)胞不可映射或多映射讀數(shù)的比例黑界。具有高比例的線粒體衍生基因、很少檢測到的基因或高比例的未映射或多映射讀數(shù)的細(xì)胞通常是受損或死亡的細(xì)胞¹³皂林。具體閾值通常是通過手動(dòng)檢查質(zhì)量控制指標(biāo)圖來確定的朗鸠，因?yàn)樽罴呀刂怪等Q于組織、解離協(xié)議和其他技術(shù)因素础倍。為關(guān)鍵指標(biāo)定義離群細(xì)胞（根據(jù)中值絕對偏差）允許直接構(gòu)建數(shù)據(jù)集特定閾值烛占，但應(yīng)謹(jǐn)慎應(yīng)用，尤其是對于包含高度異質(zhì)細(xì)胞類型的樣本¹⁴沟启。

最后編輯于：2023.04.04 09:20:45

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末扰楼，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子美浦，更是在濱河造成了極大的恐慌弦赖，老刑警劉巖，帶你破解...
沈念sama閱讀 206,013評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件浦辨，死亡現(xiàn)場離奇詭異蹬竖，居然都是意外死亡沼沈，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,205評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門币厕，熙熙樓的掌柜王于貴愁眉苦臉地迎上來列另，“玉大人，你說我怎么就攤上這事旦装∫逞茫” “怎么了？”我有些...
開封第一講書人閱讀 152,370評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵阴绢，是天一觀的道長店乐。經(jīng)常有香客問我，道長呻袭，這世上最難降的妖魔是什么眨八？我笑而不...
開封第一講書人閱讀 55,168評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮左电，結(jié)果婚禮上廉侧，老公的妹妹穿的比我還像新娘。我一直安慰自己篓足，他們只是感情好段誊，可當(dāng)我...
茶點(diǎn)故事閱讀 64,153評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著栈拖，像睡著了一般连舍。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上辱魁，一...
開封第一講書人閱讀 48,954評論 1贊 283
城市分裂傳說
那天烟瞧，我揣著相機(jī)與錄音诗鸭，去河邊找鬼染簇。笑死，一個(gè)胖子當(dāng)著我的面吹牛强岸，可吹牛的內(nèi)容都是我干的锻弓。我是一名探鬼主播，決...
沈念sama閱讀 38,271評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼蝌箍，長吁一口氣：“原來是場噩夢啊……” “哼青灼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起妓盲，我...
開封第一講書人閱讀 36,916評論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤杂拨，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后悯衬，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弹沽，經(jīng)...
沈念sama閱讀 43,382評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,877評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了策橘。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炸渡。...
茶點(diǎn)故事閱讀 37,989評論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖丽已，靈堂內(nèi)的尸體忽然破棺而出蚌堵，到底是詐尸還是另有隱情，我是刑警寧澤沛婴，帶...
沈念sama閱讀 33,624評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布吼畏，位于F島的核電站，受9級特大地震影響瘸味，放射性物質(zhì)發(fā)生泄漏宫仗。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,209評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一旁仿、第九天我趴在偏房一處隱蔽的房頂上張望藕夫。院中可真熱鬧，春花似錦枯冈、人聲如沸毅贮。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,199評論 0贊 19
一樁弒父案尘奏，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽滩褥。三九已至，卻和暖如春炫加，著一層夾襖步出監(jiān)牢的瞬間瑰煎，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,418評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工俗孝，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留酒甸，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,401評論 2贊 352
代替公主和親
正文我出身青樓赋铝，卻偏偏與公主長得像插勤，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子革骨，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,700評論 2贊 345

導(dǎo)--單細(xì)胞測序數(shù)據(jù)分析指南

請直接閱讀原文并實(shí)踐~~

介紹

質(zhì)量控制

推薦閱讀更多精彩內(nèi)容