STREAM:細(xì)胞軌跡

什么是STREAM

STREAM(Single-cell Trajectories Reconstruction, Exploration And Mapping of omics data),它是一個交互式的 pipeline粘都,能夠從單細(xì)胞轉(zhuǎn)錄組和表觀基因組數(shù)據(jù)中分離和可視化復(fù)雜的分支軌跡洲炊。它還允許自動發(fā)展軌跡相關(guān)的標(biāo)記基因發(fā)現(xiàn)和可視化容握。STREAM是一款用戶友好的開源軟件谭胚,可以作為web應(yīng)用程序在stream.pinellolab.org上交互使用,也可以作為Docker的獨立命令行工具使用。 https://github.com/pinellolab/STREAM

Figure1.png

能用來做什么

1 一個交互式數(shù)據(jù)庫專注于單細(xì)胞軌跡可視化的幾個發(fā)表的研究。

用戶可以在單細(xì)胞水平上可視化和探索細(xì)胞發(fā)育軌跡啤挎、亞群及其基因表達(dá)模式驻谆。

2 一個計算軌跡推斷工具

STREAM既可以作為單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)的輸入卵凑,也可以作為表觀基因組數(shù)據(jù)的輸入。它可以在簡單分叉或復(fù)雜分支的情況下可靠地重建軌跡和偽時間胜臊,而不需要事先知道軌跡的結(jié)構(gòu)或數(shù)目勺卢。

STREAM提供了映射過程,它允許重用以前推斷的主圖作為引用來映射原始擬合過程中沒有包含的新單元格象对。(目前只支持命令行接口https://github.com/pinellolab/STREAM)

STREAM為不同類型的潛在標(biāo)記基因(或k-mers)提供了分析工具:分支基因黑忱,即在定義分支分支間差異表達(dá)的分支點上起重要作用的基因,以及轉(zhuǎn)移基因勒魔,即表達(dá)與給定分支上細(xì)胞偽時間相關(guān)的基因甫煞。

STREAM提供了單細(xì)胞水平和密度水平的細(xì)胞可視化和推斷軌跡的基因表達(dá)模式。特別是STREAM提出了一種新的可視化方法冠绢,稱為STREAM plot抚吠,它有助于沿著分支軌跡研究亞種群組成和細(xì)胞命運基因。

用法

預(yù)先計算的結(jié)果

通過點擊“Precomputd resutls”弟胀,用戶可以看到幾個已發(fā)布數(shù)據(jù)集的預(yù)計算軌跡楷力。(以后會有更多的數(shù)據(jù)集)

  1. 選擇預(yù)計算數(shù)據(jù)集
    用戶可以從droplist中選擇任何預(yù)先計算的數(shù)據(jù)。這是郭孵户,G萧朝。以2013年《et al.2013》為例:
    一旦用戶選擇了數(shù)據(jù)集,一個簡短的描述將自動出現(xiàn)在菜單下夏哭。
    2)軌跡可視化
    在MLLE空間中检柬,三維散點圖通過STREAM來顯示單元的位置和擬合主圖。在3D散點圖中竖配,用戶可以輕松何址、交互式地執(zhí)行許多不同的操作,包括旋轉(zhuǎn)械念、放大头朱、縮小、在特定視圖上拍攝快照龄减。
    此外项钮,當(dāng)鼠標(biāo)懸停在點上時,將顯示從實驗中獲得的細(xì)胞坐標(biāo)和細(xì)胞標(biāo)簽。用戶還可以交互控制圖例面板烁巫。第一次點擊細(xì)胞類型或擬合曲線署隘,相關(guān)細(xì)胞或曲線將消失。再次點擊它們亚隙,單元格或曲線就會回來磁餐。這有助于關(guān)注興趣的分支或細(xì)胞類型。
    平面樹形圖直觀方便地將曲線(軌跡)表示為二維平面上的線段阿弃。在這個表示中诊霹,樹枝的長度是從三個或更高維度的MLLE空間中保留下來的。此外渣淳,單元根據(jù)其分支位置和與指定分支的距離被投影到樹上脾还。當(dāng)鼠標(biāo)懸停在點上時,會出現(xiàn)二維平面上的細(xì)胞坐標(biāo)和實驗得到的細(xì)胞標(biāo)簽入愧。用戶可以通過選擇一個特定的區(qū)域來放大鄙漏。類似于3D散點圖,用戶可以交互控制圖例部分棺蛛。
    用戶可以選擇不同的起始節(jié)點來可視化地鐵圖(單細(xì)胞級)或流圖(密度級)中的軌跡怔蚌。默認(rèn)情況下,選擇推薦的開始節(jié)點旁赊。這使得使用廣度優(yōu)先搜索可以很容易地重新組織樹桦踊,從而更好地表示從所選起始節(jié)點開始的偽時間序列。
    3)可視化感興趣的基因
    在基因組合框中彤恶,用戶可以從droplist中選擇基因钞钙,也可以輸入自己的基因名稱。
    基因?qū)⒃诘罔F圖和河流圖中被可視化声离。當(dāng)鼠標(biāo)懸停在點上時芒炼,細(xì)胞坐標(biāo)和基因表達(dá)都會顯示出來。
    4)可視化不同的基因
    分支基因术徊,即在定義分支點時起重要作用的基因本刽。
    用戶首先需要選擇一對相鄰的分支,通過流式計算其中的差異表達(dá)基因赠涮。
    然后用戶可以指定DE基因相對高表達(dá)的分支子寓。
    頂部自動檢測到的DE基因?qū)@示。用戶可以很容易地控制通過一個滑動條顯示多少基因笋除。
    在右側(cè)斜友,用戶可以在平樹和流圖上可視化檢測到的分流基因。
    5)Transition Genes可視化
    轉(zhuǎn)移基因垃它,即表達(dá)與細(xì)胞在某一分支上的假時間相關(guān)的基因鲜屏。
    用戶首先需要選擇一個分支烹看,通過流計算沿哪個分支的過渡基因。
    然后頂部自動檢測到的過渡基因?qū)@示洛史。用戶可以很容易地控制通過一個滑動條顯示多少基因惯殊。
    在右邊,用戶可以看到檢測到的轉(zhuǎn)移基因也殖。

根據(jù)您自己的數(shù)據(jù)進(jìn)行計算

1).輸入文件

數(shù)據(jù)矩陣
對于轉(zhuǎn)錄組數(shù)據(jù)土思,STREAM只需要一個表分離的基因表達(dá)矩陣(raw counts or normalized values) in .tsv or .tsv.gz file format. 每一行代表一個獨特的基因,每一列代表一個細(xì)胞忆嗜。對于原始計數(shù)己儒,需要進(jìn)行l(wèi)og2轉(zhuǎn)換和 library size 歸一化。
對于表觀基因組數(shù)據(jù)霎褐,進(jìn)行scac -seq軌跡推斷分析址愿,主要輸入為:
1)一組文件该镣,包括計數(shù)文件冻璃、區(qū)域文件和樣本文件。由于這部分有點耗時损合,目前網(wǎng)站還不支持省艳。但是用戶可以通過在命令行界面上運行流來輕松實現(xiàn)https://github.com/pinellolab/STREAM.
2)a precomputed scaled z-score file by STREAM. Each row represents a k-mer DNA sequence. Each column represents one cell. Each entry is a scaled z-score of the accessibility of each k-mer across cells
此外,還可以提供以下文件的嫁审。tsv或跋炕。tsv.gz格式:
cell_tags文件:.tsv或.tsv.gz格式。每個項目可以是一個假定的細(xì)胞類型或從實驗中獲得的采樣時間點律适。單元格標(biāo)簽有助于可視化地驗證所推斷的軌跡辐烂。標(biāo)簽的順序應(yīng)與基因表達(dá)矩陣文件中細(xì)胞的順序一致。不需要標(biāo)題捂贿。
cell_label_color文件:.tsv或.tsv.gz格式纠修。為不同的單元格標(biāo)簽定制顏色。第一列指定單元格標(biāo)簽厂僧,第二列指定十六進(jìn)制格式的顏色扣草。不需要標(biāo)題。
除了個人文件外颜屠,為了幫助用戶快速了解流是如何工作的辰妙,用戶可以簡單地點擊“加載示例數(shù)據(jù)”按鈕。這將自動上傳數(shù)據(jù)矩陣文件甫窟,cell_label文件和cell_label_color文件的用戶密浑。

2)參數(shù)

該面板主要由基本參數(shù)和高級參數(shù)組成〈志基本參數(shù)應(yīng)該能夠在大多數(shù)情況下正常工作尔破。如果用戶提供的數(shù)據(jù)矩陣包含原始計數(shù)敬锐,則需要進(jìn)行l(wèi)og2轉(zhuǎn)換和庫大小規(guī)范化。此外呆瞻,由于scat -seq數(shù)據(jù)與轉(zhuǎn)錄組數(shù)據(jù)有很大的不同台夺,用戶需要指定它是否是ATAC-seq數(shù)據(jù)。在特征選擇上痴脾,我們默認(rèn)使用黃土擬合來選擇變量最多的基因颤介。在scac -seq數(shù)據(jù)中,由于z-score矩陣為負(fù)值赞赖,用戶需要使用PCA來選擇top PCs滚朵。在sc-qPCR數(shù)據(jù)中,通城坝颍基因數(shù)量相對較少辕近,我們建議用戶選擇‘a(chǎn)ll’保留所有基因。對于降維匿垄,我們使用的是MLLE.鄰居的大小是根據(jù)單元格的數(shù)量來選擇的移宅,默認(rèn)設(shè)置為單元格總數(shù)的10%。要使用的MLLE組件的數(shù)量取決于分支的數(shù)量和要學(xué)習(xí)的結(jié)構(gòu)的復(fù)雜性椿疗。通常漏峰,三個組件捕獲大多數(shù)數(shù)據(jù)集的主要結(jié)構(gòu),增加它們可以恢復(fù)更精細(xì)的結(jié)構(gòu)(盡管我們觀察到在所有測試的數(shù)據(jù)集中選擇超過5個組件沒有任何好處)届榄。

3)計算軌跡

當(dāng)用戶點擊“compute”按鈕時浅乔,STREAM將根據(jù)用戶設(shè)置的參數(shù)推斷軌跡。根據(jù)數(shù)據(jù)大小铝条,這個過程可能需要幾分鐘(對于有數(shù)百個細(xì)胞的sc-qPCR數(shù)據(jù)靖苇,可能需要一分鐘)。對于包含大約2000個細(xì)胞和3k基因的scRNA-seq數(shù)據(jù)班缰,可能需要2分鐘)贤壁。一旦完成,類似于“預(yù)計算結(jié)果”部分鲁捏,用戶可以看到不同的交互可視化效果芯砸,包括帶有擬合軌跡的3D散點圖、平面樹圖给梅、地鐵地圖和流圖假丧。對于地鐵圖和流線圖,用戶可以通過選擇不同的起始節(jié)點來探索不同的推斷樹結(jié)構(gòu)的重新組織动羽。

4)感興趣的基因可視化

與“預(yù)計算結(jié)果”類似包帚,用戶在選擇insterst的基因后,只需點擊“執(zhí)行分析”运吓,就可以交互地可視化其在“計算軌跡”步驟得到的地鐵圖和流線圖中的基因表達(dá)模式渴邦。

5)識別不同的基因

用戶只需點擊“執(zhí)行分析”按鈕疯趟,就可以開始發(fā)散基因分析。然后按鈕狀態(tài)將變成'運行'谋梭。這個過程通常比“計算軌跡”要長信峻。運行時間取決于基因和細(xì)胞的數(shù)量。(對于有數(shù)百個細(xì)胞的sc-qPCR數(shù)據(jù)瓮床,可能需要5分鐘左右盹舞。對于包含大約2000個細(xì)胞和3k基因的scRNA-seq數(shù)據(jù),可能需要大約8分鐘)隘庄。一旦完成踢步,類似于“預(yù)計算結(jié)果”,將根據(jù)用戶選擇的分支對顯示發(fā)散基因丑掺,用戶可以交互地在右側(cè)的地鐵圖和流圖中可視化發(fā)散基因获印。

6)識別轉(zhuǎn)錄基因

用戶只需點擊“執(zhí)行分析”按鈕,就可以開始轉(zhuǎn)換基因分析街州。然后按鈕狀態(tài)將變成'運行'兼丰。這個過程通常比發(fā)散基因分析要快一點(對于有數(shù)百個細(xì)胞的sc-qPCR數(shù)據(jù),可能需要3分鐘左右菇肃。對于包含大約2000個細(xì)胞和3k基因的scRNA-seq數(shù)據(jù)地粪,可能需要大約6分鐘)。完成后琐谤,類似于“預(yù)計算結(jié)果”,根據(jù)用戶選擇的分支顯示過渡基因玩敏,用戶可以交互地在右側(cè)的地鐵圖和流圖中可視化過渡基因斗忌。

下載當(dāng)前分析

完成前面的分析步驟后,通過點擊“下載文件”旺聚,用戶可以輕松下載流分析結(jié)果织阳。所有結(jié)果都將被形式化并包含在一個zip文件中。用戶也非常歡迎向我們提供他們的個人分析結(jié)果流砰粹。我們將很高興包括在流網(wǎng)站上的預(yù)先計算結(jié)果部分唧躲。(對于3D散點圖、平樹圖碱璃、地鐵圖弄痹,用戶也可以直接從交互圖中下載)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市嵌器,隨后出現(xiàn)的幾起案子肛真,更是在濱河造成了極大的恐慌,老刑警劉巖爽航,帶你破解...
    沈念sama閱讀 222,946評論 6 518
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蚓让,死亡現(xiàn)場離奇詭異乾忱,居然都是意外死亡,警方通過查閱死者的電腦和手機历极,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,336評論 3 399
  • 文/潘曉璐 我一進(jìn)店門窄瘟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人趟卸,你說我怎么就攤上這事寞肖。” “怎么了衰腌?”我有些...
    開封第一講書人閱讀 169,716評論 0 364
  • 文/不壞的土叔 我叫張陵新蟆,是天一觀的道長。 經(jīng)常有香客問我右蕊,道長琼稻,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,222評論 1 300
  • 正文 為了忘掉前任饶囚,我火速辦了婚禮帕翻,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘萝风。我一直安慰自己嘀掸,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 69,223評論 6 398
  • 文/花漫 我一把揭開白布规惰。 她就那樣靜靜地躺著睬塌,像睡著了一般。 火紅的嫁衣襯著肌膚如雪歇万。 梳的紋絲不亂的頭發(fā)上揩晴,一...
    開封第一講書人閱讀 52,807評論 1 314
  • 那天,我揣著相機與錄音贪磺,去河邊找鬼硫兰。 笑死,一個胖子當(dāng)著我的面吹牛寒锚,可吹牛的內(nèi)容都是我干的劫映。 我是一名探鬼主播,決...
    沈念sama閱讀 41,235評論 3 424
  • 文/蒼蘭香墨 我猛地睜開眼刹前,長吁一口氣:“原來是場噩夢啊……” “哼泳赋!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起腮郊,我...
    開封第一講書人閱讀 40,189評論 0 277
  • 序言:老撾萬榮一對情侶失蹤摹蘑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后轧飞,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體衅鹿,經(jīng)...
    沈念sama閱讀 46,712評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡撒踪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,775評論 3 343
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了大渤。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片制妄。...
    茶點故事閱讀 40,926評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖泵三,靈堂內(nèi)的尸體忽然破棺而出耕捞,到底是詐尸還是另有隱情,我是刑警寧澤烫幕,帶...
    沈念sama閱讀 36,580評論 5 351
  • 正文 年R本政府宣布俺抽,位于F島的核電站,受9級特大地震影響较曼,放射性物質(zhì)發(fā)生泄漏磷斧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,259評論 3 336
  • 文/蒙蒙 一捷犹、第九天 我趴在偏房一處隱蔽的房頂上張望弛饭。 院中可真熱鬧,春花似錦萍歉、人聲如沸侣颂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,750評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽憔晒。三九已至,卻和暖如春销凑,著一層夾襖步出監(jiān)牢的瞬間丛晌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,867評論 1 274
  • 我被黑心中介騙來泰國打工斗幼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抚垄。 一個月前我還...
    沈念sama閱讀 49,368評論 3 379
  • 正文 我出身青樓蜕窿,卻偏偏與公主長得像,于是被迫代替她去往敵國和親呆馁。 傳聞我的和親對象是個殘疾皇子桐经,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,930評論 2 361

推薦閱讀更多精彩內(nèi)容