STOmics-seq:Stereopy教程(二)

本期內(nèi)容展示Stereopy的Cell Bin的處理久橙,即bin1的時候的教程

一俄占、代碼教程

1、讀取數(shù)據(jù)生成 StereoExpData 對象

import stereo as st
import warnings
warnings.filterwarnings('ignore')
data_path = 'sample.cellbin.gef'
st.io.read_gef_info(data_path)
data = st.io.read_gef(file_path=data_path, bin_type='cell_bins')
data
StereoExpData object with n_cells X n_genes = 51601 X 30798
bin_type: cell_bins
offset_x = None
offset_y = None
cells: ['cell_name']
genes: ['gene_name']

2淆衷、質(zhì)控

#質(zhì)控,對以下三個指標(biāo)進(jìn)行total_counts,n_genes_by_counts,pct_countss_mt
#這個函數(shù)就完成了這三個指標(biāo)的計算
data.tl.cal_qc()
data#發(fā)現(xiàn)比上次data中多了cells缸榄,和genes的label
StereoExpData object with n_cells X n_genes = 51601 X 30798
bin_type: cell_bins
offset_x = None
offset_y = None
cells: ['cell_name', 'total_counts', 'n_genes_by_counts', 'pct_counts_mt']
genes: ['gene_name', 'n_cells', 'n_counts', 'mean_umi']
#可視化
data.plt.violin()
data.plt.spatial_scatter()
data.plt.genes_count()
image.png
image.png
image.png

3、過濾吭敢,根據(jù)QC部分計算的質(zhì)量控制指標(biāo)碰凶,和散點圖觀察的細(xì)胞的分布去設(shè)置合適的參數(shù)過濾細(xì)胞。

#去除線粒體基因表達(dá)過多鹿驼、表達(dá)基因不足且超出計數(shù)范圍的細(xì)胞欲低。
data.tl.filter_cells(
        min_gene=200,
        min_n_genes_by_counts=3,
        max_n_genes_by_counts=2500,
        pct_counts_mt=5,
        inplace=True
        )
#去掉,在細(xì)胞中表達(dá)次數(shù)過低的基因畜晰,這里參考的是seurat的參數(shù)
data.tl.filter_genes(min_cell=3) 

4砾莱、標(biāo)準(zhǔn)化Normalization
官方給出的方法:

教程里的代碼使用的是normalize_total和log1p,scale凄鼻,這個過程和seurat的流程一樣

# inplace is set to True by default
data.tl.normalize_total()
data.tl.log1p()
#計算高變基因
data.tl.highly_variable_genes(
            min_mean=0.0125,
            max_mean=3,
            min_disp=0.5,
            n_top_genes=2000,
            res_key='highly_variable_genes'
            )
#高變基因可視化
data.plt.highly_variable_genes(res_key='highly_variable_genes')
#scale
data.tl.scale()
image.png

5腊瑟、embedding,這個也和seurat類似

data.tl.pca(
        use_highly_genes=True,
        n_pcs=30,
        res_key='pca'
        )
data.tl.neighbors(pca_res_key='pca', res_key='neighbors')
data.tl.umap(
        pca_res_key='pca',
        neighbors_res_key='neighbors',
        res_key='umap'
        )
#umap可視化块蚌,查看兩個基因的umap圖
data.plt.umap(gene_names=['Atpif1', 'Tmsb4x'], res_key='umap')
image.png

6闰非、clustering,提供三種常見的聚類方法峭范,包括Leiden财松,Louvain和Phenograph

data.tl.leiden(neighbors_res_key='neighbors',res_key='leiden')
#可視化
data.plt.cluster_scatter(res_key='leiden')
data.plt.umap(res_key='umap', cluster_key='leiden')
image.png

image.png

7、查找標(biāo)記基因

data.tl.find_marker_genes(
        cluster_res_key='phenograph',
        method='t_test',
        use_highly_genes=False,
        use_raw=True
        )
#可視化每組中前10個標(biāo)記基因的排名和得分
data.plt.marker_genes_text(
        res_key='marker_genes',
        markers_num=10,
        sort_key='scores'
        )
#可視化每組中前5個標(biāo)記基因的氣泡圖
data.plt.marker_genes_scatter(res_key='marker_genes', markers_num=5)
#通過logfc等過濾掉基因
data.tl.filter_marker_genes(
    marker_genes_res_key='marker_genes',
    min_fold_change=1,
    min_in_group_fraction=0.25,
    max_out_group_fraction=0.5,
    res_key='marker_genes_filtered'
)
image.png

image.png

7纱控、注釋

#注釋的字典太長辆毡,沒寫完
annotation_dict = {
    '1':'a',
    '2':'b',
    '3':'c',
    '4':'d',
    '5':'e',
    '6':'f',
    '7':'g'
}
data.tl.annotation(
        annotation_information=annotation_dict,
        cluster_res_key='leiden',
        res_key='anno_leiden'
        )
#可視化
data.plt.cluster_scatter(res_key='anno_leiden')
image.png

二、小結(jié)

1甜害、過濾參數(shù)的設(shè)置舶掖,不要過于嚴(yán)格,不然空間位點的圖空點會過多尔店。
2眨攘、Normalization的方法較多,在選擇方法時要思考闹获,不要無腦按照教程搬期犬。
3、降維時pca等設(shè)置的參數(shù)由于不同的Normalization避诽,設(shè)置的細(xì)節(jié)也有差別龟虎。
4、clustering分群時用的方法有三種沙庐,也需要選擇鲤妥。我比較習(xí)慣用Louvain佳吞。
總之,教程只是一個引導(dǎo)棉安,拋磚引玉的過程底扳,細(xì)節(jié)部分大家自行考量。
如有錯誤之處贡耽,請留言指正衷模。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市蒲赂,隨后出現(xiàn)的幾起案子阱冶,更是在濱河造成了極大的恐慌,老刑警劉巖滥嘴,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件木蹬,死亡現(xiàn)場離奇詭異,居然都是意外死亡若皱,警方通過查閱死者的電腦和手機(jī)镊叁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來走触,“玉大人晦譬,你說我怎么就攤上這事』ス悖” “怎么了蛔添?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長兜辞。 經(jīng)常有香客問我,道長夸溶,這世上最難降的妖魔是什么逸吵? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮缝裁,結(jié)果婚禮上扫皱,老公的妹妹穿的比我還像新娘。我一直安慰自己捷绑,他們只是感情好韩脑,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著粹污,像睡著了一般段多。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上壮吩,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天进苍,我揣著相機(jī)與錄音加缘,去河邊找鬼。 笑死觉啊,一個胖子當(dāng)著我的面吹牛拣宏,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播杠人,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼勋乾,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了嗡善?” 一聲冷哼從身側(cè)響起辑莫,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎滤奈,沒想到半個月后摆昧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡蜒程,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年绅你,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片昭躺。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡忌锯,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出领炫,到底是詐尸還是另有隱情偶垮,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布帝洪,位于F島的核電站似舵,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏葱峡。R本人自食惡果不足惜砚哗,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望砰奕。 院中可真熱鬧蛛芥,春花似錦、人聲如沸军援。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽胸哥。三九已至涯竟,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昆禽。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工蝗蛙, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人醉鳖。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓捡硅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親盗棵。 傳聞我的和親對象是個殘疾皇子壮韭,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容