h5ad文件
h5ad文件提供了一種可擴展的方式來記錄數(shù)據(jù)及其注釋 (annotation)素邪。單細胞測序的h5ad被分割成X, obs, var, uns等多個部分,分別存儲不同的信息鄙早。
其中X是表達量矩陣;
obs包含細胞元數(shù)據(jù),即從不同方向描述細胞的結(jié)果萧求,例如細胞所屬tissue托享;
var包含基因元數(shù)據(jù)骚烧,即從不同方向描述基因的結(jié)果浸赫,X, obs, var均以dataframe格式存儲;
uns是非結(jié)構(gòu)化注釋赃绊,更多解釋可查詢h5ad(AnnData)既峡。
h5ad文件需滿足的要求
- X是矩陣數(shù)據(jù)(通常是原始或經(jīng)過normalization的數(shù)據(jù))
- 至少一種降維方式(例如 tSNE, UMAP)的結(jié)果
- 每個細胞需要一個唯一的標識符
- 每個基因需要一個唯一的標識符
數(shù)據(jù)格式
(1)這是之前的數(shù)據(jù)格式
https://scvelo.readthedocs.io/getting_started/
(2) 最新的數(shù)據(jù)格式做了擴增
https://anndata.readthedocs.io/en/latest/
數(shù)據(jù)格式說明及API: https://anndata.readthedocs.io/en/stable/generated/anndata.AnnData.html#anndata.AnnData
loom 文件
也是類似的結(jié)構(gòu)
https://github.com/basilkhuder/Seurat-to-RNA-Velocity