loom文件轉(zhuǎn)換成seurat對象

GEOdatabase下載了一個.loom文件点待,想要用一下這個數(shù)據(jù)允乐,折磨了一周,終于成功的將它轉(zhuǎn)換成了seurat對象滑臊,現(xiàn)記錄如下:
數(shù)據(jù)為GSE162183,地址:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE162183

關于loomR的簡介:

隨著單細胞數(shù)據(jù)量的增長箍铲,計算要求成指數(shù)增長雇卷,當數(shù)據(jù)量大于10萬個細胞的時候,seurat包分析就顯得非常有壓力了颠猴,因為在實時內(nèi)存中儲存數(shù)據(jù)就變得非常困難关划,HDF5數(shù)據(jù)格式提供了高效的磁盤存儲,而不是在內(nèi)存中存儲數(shù)據(jù)翘瓮,這就將分析擴展到大規(guī)模數(shù)據(jù)集贮折,甚至可以達到大于100萬細胞的級別 ,Linnarson實驗室開發(fā)了一種基于hdf5的數(shù)據(jù)結(jié)構(gòu)资盅,loom脱货,可以方便地存儲單細胞基因組數(shù)據(jù)集和元數(shù)據(jù)。他們還發(fā)布了一個名為loompy的Python API來與loom文件交互律姨,而loomR為基于R的與loom交互的R包,詳細的信息可以參考:https://satijalab.org/loomr/loomr_tutorial

安裝并加載loomR包

devtools::install_github(repo = "hhoeflin/hdf5r")
devtools::install_github(repo = "mojaveazure/loomR", ref = "develop")
library(loomR)

loomR包基于R6對象與seurat基于R4對象不同臼疫,R6對象用$而不是@來取值

與loom建立連接

與將包含在其內(nèi)部的所有數(shù)據(jù)加載到內(nèi)存中的標準R對象不同择份,loom對象僅僅是到磁盤上的一個文件的連接,這使得可以在低內(nèi)存消耗的情況下擴展到大量數(shù)據(jù)集烫堤∪俑希可以通過 connect 連接到一個現(xiàn)有的loom文件,使用loom::create從表達式矩陣創(chuàng)建您自己的文件鸽斟,或者使用Convert從現(xiàn)有的Seurat對象創(chuàng)建一個loom文件拔创。

>hc.2=connect('D:/Google/GSE162183_Raw_gene_counts_matrix_LoomFile.loom/GSE162183_Raw_gene_counts_matrix_LoomFile.loom',mode = 'r+',skip.validate = TRUE)
Warning message:
In initialize(...) :
  Skipping validation step, some fields are not populated
> hc.2
Class: loom
Filename: D:\Google\GSE162183_Raw_gene_counts_matrix_LoomFile.loom\GSE162183_Raw_gene_counts_matrix_LoomFile.loom
Access type: H5F_ACC_RDWR
Attributes: last_modified, version
Listing:
       name    obj_type  dataset.dims
      attrs   H5I_GROUP          <NA>
  col_attrs   H5I_GROUP          <NA>
 col_graphs   H5I_GROUP          <NA>
     layers   H5I_GROUP          <NA>
     matrix H5I_DATASET 24234 x 19968
  row_attrs   H5I_GROUP          <NA>
 row_graphs   H5I_GROUP          <NA>
 dataset.type_class
               <NA>
               <NA>
               <NA>
               <NA>
        H5T_INTEGER
               <NA>
               <NA>

在沒加參數(shù)skip.validate之前,我遇到了一個error(Error in validateLoom(object = self) :
There can only be 5 groups in the loom file: 'row_attrs', 'col_attrs', 'layers', 'row_graphs', 'col_graphs')富蓄,github上找到了解決方法剩燥,貌似是版本的問題,加上那個參數(shù)設置便可以了


github上的解答

接下來創(chuàng)建成Seurat對象立倍,實際上灭红,loom文件也可以支持seurat的基本函數(shù)(詳見函數(shù)介紹),但還是seurat對象比較熟悉口注,所以想轉(zhuǎn)換成seurat對象变擒,在seurat4.0.3官網(wǎng)所示方法如下:



但是我直接as.seurat之后,顯示error如下:
hc.2=as.Seurat(hc.2)
Error in UseMethod(generic = "as.Seurat", object = x) : 
  "as.Seurat"沒有適用于"c('loom', 'H5File', 'H5RefClass', 'R6')"目標對象的方法

仍然不行寝志,觀察.loom文件中的matrix即為創(chuàng)建seurat對象中的單細胞表達矩陣娇斑,因此考慮將matrix提取出來策添,再將barcode和feature提出來,即可創(chuàng)建seurat對象毫缆,如下所示:

psoriasis=hc.2[["matrix"]][,] #提取.loom文件的matrix
psoriasis=t(psoriasis) #發(fā)現(xiàn)那個matrix的gene和barcode顛倒了唯竹,換過來才符合seurat對象中的矩陣行為基因,列為barcode
 dim(psoriasis)
[1] 19968 24234
gene=hc.2$row.attrs$Gene[] #提取基因名
barcode=hc.2$col.attrs$CellID[]# 提取barcode
length(gene)
[1] 19968
 length(barcode)
[1] 24234
colnames(psoriasis)= barcode
row.names(psoriasis)= gene
dim(psoriasis)
[1] 19968 24234
####創(chuàng)建seurat對象####
psoriasis=CreateSeuratObject(counts = psoriasis,project = 'psoriasis',min.cells = 3, min.features = 200)
psoriasis
An object of class Seurat 
18642 features across 24234 samples within 1 assay 
Active assay: RNA (18642 features, 0 variable features)
hc.2$close_all()# Always remember to close loom files when done

至此悔醋,loom文件轉(zhuǎn)換成了seurat對象摩窃,可以開心的進行下游分析啦,完結(jié)芬骄,撒花猾愿!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市账阻,隨后出現(xiàn)的幾起案子蒂秘,更是在濱河造成了極大的恐慌,老刑警劉巖淘太,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件姻僧,死亡現(xiàn)場離奇詭異,居然都是意外死亡蒲牧,警方通過查閱死者的電腦和手機撇贺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來冰抢,“玉大人松嘶,你說我怎么就攤上這事】嫒牛” “怎么了翠订?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長遵倦。 經(jīng)常有香客問我尽超,道長,這世上最難降的妖魔是什么梧躺? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任似谁,我火速辦了婚禮,結(jié)果婚禮上燥狰,老公的妹妹穿的比我還像新娘棘脐。我一直安慰自己,他們只是感情好龙致,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布蛀缝。 她就那樣靜靜地躺著,像睡著了一般目代。 火紅的嫁衣襯著肌膚如雪屈梁。 梳的紋絲不亂的頭發(fā)上嗤练,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天,我揣著相機與錄音在讶,去河邊找鬼煞抬。 笑死,一個胖子當著我的面吹牛构哺,可吹牛的內(nèi)容都是我干的革答。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼曙强,長吁一口氣:“原來是場噩夢啊……” “哼残拐!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起碟嘴,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤溪食,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后娜扇,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體错沃,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年雀瓢,在試婚紗的時候發(fā)現(xiàn)自己被綠了枢析。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡刃麸,死狀恐怖登疗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情嫌蚤,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布断傲,位于F島的核電站脱吱,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏认罩。R本人自食惡果不足惜箱蝠,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望垦垂。 院中可真熱鬧宦搬,春花似錦、人聲如沸劫拗。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽页慷。三九已至憔足,卻和暖如春胁附,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背滓彰。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工控妻, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人揭绑。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓弓候,卻偏偏與公主長得像,于是被迫代替她去往敵國和親他匪。 傳聞我的和親對象是個殘疾皇子菇存,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容