python單細(xì)胞測(cè)序分析教程-0 | 數(shù)據(jù)結(jié)構(gòu)及操作

目錄

  1. 根據(jù)barcodes的名稱獲取數(shù)據(jù)的meta信息,或批量修改var或obs對(duì)象
  2. 查看是否有重名的基因葛菇,或查看基因是否存在
  3. 將Anndata導(dǎo)出為csv
  4. 刪除特定基因
  5. 獲取矩陣數(shù)據(jù)沒(méi)有經(jīng)過(guò)尺度歸一化的raw adata數(shù)據(jù)
  6. 根據(jù)obs對(duì)象的信息(聚類等)獲取barcodes index
  7. 根據(jù)Index獲取adata的部分
  8. 查看某些基因是否在同一個(gè)細(xì)胞中表達(dá)
  9. 刪除obs中的某一列
  10. 多個(gè)adata組合

1甘磨、根據(jù)barcodes的名稱獲取數(shù)據(jù)的meta信息

# 獲取barcodes名
obs_name_list = adata.obs_names.to_list()
obs_name_list
OUTS:
['AAATGCCCAATCTGCA_Ileum-1_Enterocyte',
 'AACTCTTGTCTAGTCA_Ileum-1_Enterocyte',
 'AAGACCTCACGGACAA_Ileum-1_Enterocyte',
 'AAGCCGCGTCTTGCGG_Ileum-1_Enterocyte',
 'AAGTCTGGTTGTCTTT_Ileum-1_Enterocyte',
......
]
# 根據(jù)barcodes名的組成模式,選擇分割符
obs_name_list = [i.split("_") for i in obs_name_list]
obs_name_list
OUTS:
[['AAATGCCCAATCTGCA', 'Ileum-1', 'Enterocyte'],
 ['AACTCTTGTCTAGTCA', 'Ileum-1', 'Enterocyte'],
 ['AAGACCTCACGGACAA', 'Ileum-1', 'Enterocyte'],
 ['AAGCCGCGTCTTGCGG', 'Ileum-1', 'Enterocyte'],
 ['AAGTCTGGTTGTCTTT', 'Ileum-1', 'Enterocyte'],
 ['ACGAGGATCGGCCGAT', 'Ileum-1', 'Enterocyte'],
 ['ACGGCCAGTCTAAACC', 'Ileum-1', 'Enterocyte'],
 ['AGGCCGTTCGAGCCCA', 'Ileum-1', 'Enterocyte'],
 ['AGTGAGGGTCGGCTCA', 'Ileum-1', 'Enterocyte'],
 ['ATGAGGGAGGATATAC', 'Ileum-1', 'Enterocyte'],
 ['ATGAGGGCAAGGTTCT', 'Ileum-1', 'Enterocyte'],
 ['ATGAGGGTCTGCCAGG', 'Ileum-1', 'Enterocyte'],
 ['ATTGGACGTTGAGTTC', 'Ileum-1', 'Enterocyte'],
......
]
# 獲取批次信息
batch_name_list = []
for i in obs_name_list:
    # barcodes的第2個(gè)元素(i[1])對(duì)應(yīng)了器官和器官序號(hào)眯停,即batch信息
    j = i[1]
    batch_name_list.append(j)
# 獲取batch的list济舆,注意list一定是和barcodes的數(shù)量等長(zhǎng)
adata.obs['batch'] = batch_name_list
adata.obs
OUTS:
                                    batch
AAATGCCCAATCTGCA_Ileum-1_Enterocyte Ileum-1
AACTCTTGTCTAGTCA_Ileum-1_Enterocyte Ileum-1
AAGACCTCACGGACAA_Ileum-1_Enterocyte Ileum-1
AAGCCGCGTCTTGCGG_Ileum-1_Enterocyte Ileum-1
AAGTCTGGTTGTCTTT_Ileum-1_Enterocyte Ileum-1
... ...

2. 查看基因在數(shù)據(jù)集中是否存在,或是否有重名的基因

(1)查看是否有重名基因
起因是在整合不同文章開(kāi)源的數(shù)據(jù)的時(shí)候發(fā)現(xiàn)一個(gè)報(bào)錯(cuò)庵朝,提示Reindexing only valid with uniquely valued Index objects(重新索引僅對(duì)唯一值索引對(duì)象有效)吗冤,這個(gè)報(bào)錯(cuò)意味著obs_names(barcodes)或者var_names(gene)存在重復(fù)的對(duì)象又厉,導(dǎo)致在整合時(shí)無(wú)法處理九府。

adata = adata_1.concatenate([adata_2,adata_3,adata_4],join='outer')

---------------------------------------------------------------------------
InvalidIndexError                         Traceback (most recent call last)
<ipython-input-3-17e328e1a874> in <module>
----> 1 adata = adata_1.concatenate([adata_2,adata_3,adata_4],join='outer')

/mnt/f/Linux/anaconda/envs/pytorch/lib/python3.7/site-packages/anndata/_core/anndata.py in concatenate(self, join, batch_key, batch_categories, uns_merge, index_unique, fill_value, *adatas)
   1705             fill_value=fill_value,
   1706             index_unique=index_unique,
-> 1707             pairwise=False,
   1708         )
   1709 

/mnt/f/Linux/anaconda/envs/pytorch/lib/python3.7/site-packages/anndata/_core/merge.py in concat(adatas, axis, join, merge, uns_merge, label, keys, index_unique, fill_value, pairwise)
    800     )
    801     reindexers = [
--> 802         gen_reindexer(alt_indices, dim_indices(a, axis=1 - axis)) for a in adatas
    803     ]
    804 

/mnt/f/Linux/anaconda/envs/pytorch/lib/python3.7/site-packages/anndata/_core/merge.py in <listcomp>(.0)
    800     )
    801     reindexers = [
--> 802         gen_reindexer(alt_indices, dim_indices(a, axis=1 - axis)) for a in adatas
    803     ]
    804 

/mnt/f/Linux/anaconda/envs/pytorch/lib/python3.7/site-packages/anndata/_core/merge.py in gen_reindexer(new_var, cur_var)
    393            [1., 0., 0.]], dtype=float32)
    394     """
--> 395     return Reindexer(cur_var, new_var)
    396 
    397 

/mnt/f/Linux/anaconda/envs/pytorch/lib/python3.7/site-packages/anndata/_core/merge.py in __init__(self, old_idx, new_idx)
    265         self.no_change = new_idx.equals(old_idx)
    266 
--> 267         new_pos = new_idx.get_indexer(old_idx)
    268         old_pos = np.arange(len(new_pos))
    269 

/mnt/f/Linux/anaconda/envs/pytorch/lib/python3.7/site-packages/pandas/core/indexes/base.py in get_indexer(self, target, method, limit, tolerance)
   2985         if not self.is_unique:
   2986             raise InvalidIndexError(
-> 2987                 "Reindexing only valid with uniquely valued Index objects"
   2988             )
   2989 

InvalidIndexError: Reindexing only valid with uniquely valued Index objects
  1. 首先,嘗試對(duì)不同adata的組合進(jìn)行整合覆致,判斷出現(xiàn)重復(fù)的adata侄旬。發(fā)現(xiàn)adata_3存在時(shí)會(huì)報(bào)錯(cuò),其他adata都可以整合煌妈。
  2. 其次儡羔,排除barcodes的重復(fù),對(duì)adata_3的barcodes進(jìn)行重命名技即,在重命名的過(guò)程中發(fā)現(xiàn)墅冷,barcodes被提示最好使用符號(hào)型元素而不是數(shù)值型元素廓脆。重命名方法如下:
# 獲取barcodes列表,以便于循環(huán)
obs_name_list = adata_3.obs_names.to_list()
n = 'aaa'
m = 0
re_name_list = []
for i in obs_name_list:
    j = n + '%d' %m
    m = m+1
    re_name_list.append(j)

adata_3.obs_names = re_name_list

重命名保證barcodes不會(huì)重復(fù)后族操,再次嘗試整合還是出現(xiàn)相同報(bào)錯(cuò),表明問(wèn)題出在var_names上比被。下面查找重復(fù)基因色难。

# 查找重復(fù)基因名,發(fā)現(xiàn)一個(gè)重復(fù)基因名
adata_3.var[adata_3.var.index.duplicated()]

OUTS:
       n_cells
NAA38   1522
# 定位重復(fù)基因等缀,該基因重復(fù)了兩次
adata_3.var.loc['NAA38']

OUTS:
       n_cells
NAA38   523
NAA38   1522
# 刪除重復(fù)基因(刪除的前提是得先確認(rèn)這個(gè)基因?qū)ρ芯康囊饬x不大枷莉,也不是什么特別的細(xì)胞群的marker基因)
# 剔除NAA38基因
non_NAA38_genes_list = [name for name in adata.var_names if not name.startswith('NAA38')]
adata_3 = adata_3[:, non_NAA38_genes_list]

重新測(cè)試數(shù)據(jù)整合,發(fā)現(xiàn)可以整合了尺迂。

(2)查看基因'obj'是否存在笤妙,也可以用來(lái)判斷該基因是否重名
list.count() 方法用來(lái)統(tǒng)計(jì)某個(gè)元素在列表中出現(xiàn)的次數(shù)冒掌,基本語(yǔ)法格式為:

# listname 代表列表名,obj 表示要統(tǒng)計(jì)的元素
# 如果 count() 返回 0蹲盘,就表示列表中不存在該元素宋渔,所以 count() 也可以用來(lái)判斷列表中的某個(gè)元素是否存在
listname.count(obj)

應(yīng)用在adata里:

# 測(cè)試TPH1,返回1表示該基因存在辜限,且只有唯一的基因?yàn)樵摶蛎?# 若返回值為大于1的值皇拣,表明該基因出現(xiàn)了重名。
adata.var_names.to_list().count('TPH1')
OUTS:
1
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末薄嫡,一起剝皮案震驚了整個(gè)濱河市氧急,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌毫深,老刑警劉巖吩坝,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異哑蔫,居然都是意外死亡钉寝,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門闸迷,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)嵌纲,“玉大人,你說(shuō)我怎么就攤上這事腥沽〈撸” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵今阳,是天一觀的道長(zhǎng)师溅。 經(jīng)常有香客問(wèn)我,道長(zhǎng)盾舌,這世上最難降的妖魔是什么墓臭? 我笑而不...
    開(kāi)封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮妖谴,結(jié)果婚禮上窿锉,老公的妹妹穿的比我還像新娘。我一直安慰自己窖维,他們只是感情好榆综,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著铸史,像睡著了一般鼻疮。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上琳轿,一...
    開(kāi)封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天判沟,我揣著相機(jī)與錄音耿芹,去河邊找鬼。 笑死挪哄,一個(gè)胖子當(dāng)著我的面吹牛吧秕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播迹炼,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼砸彬,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了斯入?” 一聲冷哼從身側(cè)響起砂碉,我...
    開(kāi)封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎刻两,沒(méi)想到半個(gè)月后增蹭,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡磅摹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年滋迈,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片户誓。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡饼灿,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出厅克,到底是詐尸還是另有隱情赔退,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布证舟,位于F島的核電站,受9級(jí)特大地震影響窗骑,放射性物質(zhì)發(fā)生泄漏女责。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一创译、第九天 我趴在偏房一處隱蔽的房頂上張望抵知。 院中可真熱鬧,春花似錦软族、人聲如沸刷喜。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)掖疮。三九已至,卻和暖如春颗祝,著一層夾襖步出監(jiān)牢的瞬間浊闪,已是汗流浹背恼布。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留搁宾,地道東北人折汞。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像盖腿,于是被迫代替她去往敵國(guó)和親爽待。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345