作者深胳,Evil Genius
HD數(shù)據(jù)不同于Xenium,目前還是橫屏豎直的一刀切數(shù)據(jù)分析模式眉睹,但是真實(shí)的細(xì)胞絕對不是如此分布的,那么實(shí)際分析中废膘,2um的精度配合圖像的信息竹海,獲取真實(shí)的細(xì)胞分布數(shù)據(jù),就成了分析的必須丐黄。
多說一句斋配,分析的準(zhǔn)確性和超前化也是公司對核心分析人員的核心要求。
如下如,我們最好不要采用8um艰争,16um這種一刀切的模式坏瞄,而是識別每個(gè)2um中是否含有細(xì)胞,如果有則保留甩卓,沒有則舍棄鸠匀。
這個(gè)時(shí)候拿到的數(shù)據(jù)才是有效數(shù)據(jù),所做的分析才可以認(rèn)為是非趁推担可靠的。利用2um的精度重構(gòu)細(xì)胞分布信息蛛勉。
在Visium HD的最高2μm分辨率下鹿寻,將亞細(xì)胞bin連接成單個(gè)細(xì)胞消玄。這可以通過使用StarDist進(jìn)行形態(tài)分割來完成的历极,使用其預(yù)訓(xùn)練的H&E模型識別細(xì)胞核,隨后將其擴(kuò)展到鄰近的未標(biāo)記的bin中倦蚪。
我們需要實(shí)現(xiàn)如下的分析目標(biāo)
分析得到的結(jié)果流程圖
分析得到的結(jié)果
局部放大
我們來實(shí)現(xiàn),是官方示例數(shù)據(jù)
import scanpy as sc
import os
import bin2cell as b2c
import celltypist
from celltypist import models
import numpy as np
from matplotlib import rcParams
from matplotlib import font_manager
import matplotlib.pyplot as plt
rcParams['pdf.fonttype'] = 42
sc.settings.set_figure_params(dpi = 150, color_map = 'RdPu', dpi_save = 150, vector_friendly = True, format = 'pdf')
font_manager.fontManager.addfont(".../software/Arial.ttf")
print(font_manager.findfont("Arial"))
plt.rcParams["font.sans-serif"] = ["Arial"]
sc.settings.set_figure_params(dpi = 150, color_map = 'RdPu', dpi_save = 300, vector_friendly = True, format = 'pdf')
path008 = ".../visium_hd/gut_public/square_008um/"
path002 = ".../visium_hd/gut_public/square_002um/"
source_image_path = ".../10X_datasets/human_CRC/Visium_HD_Human_Colon_Cancer_tissue_image.btf"
bdata = b2c.read_visium(path008, source_image_path = source_image_path)
bdata.var_names_make_unique()
bdata.raw = bdata.copy()
基礎(chǔ)處理