STOmics-seq：Stereopy教程（二）

本期內(nèi)容展示Stereopy的Cell Bin的處理久橙，即bin1的時候的教程

一俄占、代碼教程

1、讀取數(shù)據(jù)生成 StereoExpData 對象

import stereo as st
import warnings
warnings.filterwarnings('ignore')
data_path = 'sample.cellbin.gef'
st.io.read_gef_info(data_path)
data = st.io.read_gef(file_path=data_path, bin_type='cell_bins')
data
StereoExpData object with n_cells X n_genes = 51601 X 30798
bin_type: cell_bins
offset_x = None
offset_y = None
cells: ['cell_name']
genes: ['gene_name']

2淆衷、質(zhì)控

#質(zhì)控,對以下三個指標(biāo)進(jìn)行total_counts,n_genes_by_counts,pct_countss_mt
#這個函數(shù)就完成了這三個指標(biāo)的計算
data.tl.cal_qc()
data#發(fā)現(xiàn)比上次data中多了cells缸榄，和genes的label
StereoExpData object with n_cells X n_genes = 51601 X 30798
bin_type: cell_bins
offset_x = None
offset_y = None
cells: ['cell_name', 'total_counts', 'n_genes_by_counts', 'pct_counts_mt']
genes: ['gene_name', 'n_cells', 'n_counts', 'mean_umi']
#可視化
data.plt.violin()
data.plt.spatial_scatter()
data.plt.genes_count()

image.png

3、過濾吭敢，根據(jù)QC部分計算的質(zhì)量控制指標(biāo)碰凶，和散點圖觀察的細(xì)胞的分布去設(shè)置合適的參數(shù)過濾細(xì)胞。

#去除線粒體基因表達(dá)過多鹿驼、表達(dá)基因不足且超出計數(shù)范圍的細(xì)胞欲低。
data.tl.filter_cells(
        min_gene=200,
        min_n_genes_by_counts=3,
        max_n_genes_by_counts=2500,
        pct_counts_mt=5,
        inplace=True
        )
#去掉，在細(xì)胞中表達(dá)次數(shù)過低的基因畜晰，這里參考的是seurat的參數(shù)
data.tl.filter_genes(min_cell=3)

4砾莱、標(biāo)準(zhǔn)化Normalization
官方給出的方法：

normalize_total
log1p
scale
scTransform
quantile

教程里的代碼使用的是normalize_total和log1p，scale凄鼻，這個過程和seurat的流程一樣

# inplace is set to True by default
data.tl.normalize_total()
data.tl.log1p()
#計算高變基因
data.tl.highly_variable_genes(
            min_mean=0.0125,
            max_mean=3,
            min_disp=0.5,
            n_top_genes=2000,
            res_key='highly_variable_genes'
            )
#高變基因可視化
data.plt.highly_variable_genes(res_key='highly_variable_genes')
#scale
data.tl.scale()

image.png

5腊瑟、embedding，這個也和seurat類似

data.tl.pca(
        use_highly_genes=True,
        n_pcs=30,
        res_key='pca'
        )
data.tl.neighbors(pca_res_key='pca', res_key='neighbors')
data.tl.umap(
        pca_res_key='pca',
        neighbors_res_key='neighbors',
        res_key='umap'
        )
#umap可視化块蚌，查看兩個基因的umap圖
data.plt.umap(gene_names=['Atpif1', 'Tmsb4x'], res_key='umap')

image.png

6闰非、clustering，提供三種常見的聚類方法峭范，包括Leiden财松，Louvain和Phenograph

data.tl.leiden(neighbors_res_key='neighbors',res_key='leiden')
#可視化
data.plt.cluster_scatter(res_key='leiden')
data.plt.umap(res_key='umap', cluster_key='leiden')

image.png

7、查找標(biāo)記基因

data.tl.find_marker_genes(
        cluster_res_key='phenograph',
        method='t_test',
        use_highly_genes=False,
        use_raw=True
        )
#可視化每組中前10個標(biāo)記基因的排名和得分
data.plt.marker_genes_text(
        res_key='marker_genes',
        markers_num=10,
        sort_key='scores'
        )
#可視化每組中前5個標(biāo)記基因的氣泡圖
data.plt.marker_genes_scatter(res_key='marker_genes', markers_num=5)
#通過logfc等過濾掉基因
data.tl.filter_marker_genes(
    marker_genes_res_key='marker_genes',
    min_fold_change=1,
    min_in_group_fraction=0.25,
    max_out_group_fraction=0.5,
    res_key='marker_genes_filtered'
)

image.png

7纱控、注釋

#注釋的字典太長辆毡，沒寫完
annotation_dict = {
    '1':'a',
    '2':'b',
    '3':'c',
    '4':'d',
    '5':'e',
    '6':'f',
    '7':'g'
}
data.tl.annotation(
        annotation_information=annotation_dict,
        cluster_res_key='leiden',
        res_key='anno_leiden'
        )
#可視化
data.plt.cluster_scatter(res_key='anno_leiden')

image.png

二、小結(jié)

1甜害、過濾參數(shù)的設(shè)置舶掖，不要過于嚴(yán)格，不然空間位點的圖空點會過多尔店。
2眨攘、Normalization的方法較多，在選擇方法時要思考闹获，不要無腦按照教程搬期犬。
3、降維時pca等設(shè)置的參數(shù)由于不同的Normalization避诽，設(shè)置的細(xì)節(jié)也有差別龟虎。
4、clustering分群時用的方法有三種沙庐，也需要選擇鲤妥。我比較習(xí)慣用Louvain佳吞。
總之，教程只是一個引導(dǎo)棉安，拋磚引玉的過程底扳，細(xì)節(jié)部分大家自行考量。
如有錯誤之處贡耽，請留言指正衷模。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市蒲赂，隨后出現(xiàn)的幾起案子阱冶，更是在濱河造成了極大的恐慌，老刑警劉巖滥嘴，帶你破解...
沈念sama閱讀 206,839評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件木蹬，死亡現(xiàn)場離奇詭異，居然都是意外死亡若皱，警方通過查閱死者的電腦和手機(jī)镊叁，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來走触，“玉大人晦譬，你說我怎么就攤上這事』ス悖” “怎么了蛔添？”我有些...
開封第一講書人閱讀 153,116評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長兜辞。經(jīng)常有香客問我，道長夸溶，這世上最難降的妖魔是什么逸吵？我笑而不...
開封第一講書人閱讀 55,371評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮缝裁，結(jié)果婚禮上扫皱，老公的妹妹穿的比我還像新娘。我一直安慰自己捷绑，他們只是感情好韩脑，可當(dāng)我...
茶點故事閱讀 64,384評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著粹污，像睡著了一般段多。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上壮吩，一...
開封第一講書人閱讀 49,111評論 1贊 285
城市分裂傳說
那天进苍，我揣著相機(jī)與錄音加缘，去河邊找鬼。笑死觉啊，一個胖子當(dāng)著我的面吹牛拣宏，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播杠人，決...
沈念sama閱讀 38,416評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼勋乾，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了嗡善？” 一聲冷哼從身側(cè)響起辑莫，我...
開封第一講書人閱讀 37,053評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎滤奈，沒想到半個月后摆昧，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,558評論 1贊 300
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡蜒程，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,007評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年绅你，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片昭躺。...
茶點故事閱讀 38,117評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡忌锯，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出领炫，到底是詐尸還是另有隱情偶垮，我是刑警寧澤，帶...
沈念sama閱讀 33,756評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布帝洪，位于F島的核電站似舵，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏葱峡。R本人自食惡果不足惜砚哗，卻給世界環(huán)境...
茶點故事閱讀 39,324評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望砰奕。院中可真熱鬧蛛芥，春花似錦、人聲如沸军援。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽胸哥。三九已至涯竟，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背昆禽。一陣腳步聲響...
開封第一講書人閱讀 31,539評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工蝗蛙，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人醉鳖。一個月前我還...
沈念sama閱讀 45,578評論 2贊 355
代替公主和親
正文我出身青樓捡硅，卻偏偏與公主長得像，于是被迫代替她去往敵國和親盗棵。傳聞我的和親對象是個殘疾皇子壮韭，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 42,877評論 2贊 345

STOmics-seq：Stereopy教程（二）

一俄占、代碼教程

二、小結(jié)

推薦閱讀更多精彩內(nèi)容