10X單細(xì)胞(10X空間轉(zhuǎn)錄組)數(shù)據(jù)分析之細(xì)胞過濾那些事

hello屡江,大家好,今天已經(jīng)是五一假期的第二天赛不,本人呢盼理,哪也去不了,只好在家歇著俄删,所以呢宏怔,給自己找點(diǎn)事做,本人93年畴椰,單身臊诊,現(xiàn)居天津武清,女孩子有沒有想談戀愛了斜脂,可以聯(lián)系我抓艳,聯(lián)系方式是。帚戳。玷或。。片任。偏友。《怨咳咳位他,錯(cuò)了,再來产场,今天我們就來聊一聊10X單細(xì)胞和10X空間轉(zhuǎn)錄組細(xì)胞過濾的那些事鹅髓,我們來回顧一下:

過濾1、線粒體過濾

在我們的分析結(jié)果里京景,線粒體過濾應(yīng)該是繞不開的一個(gè)話題窿冯,我們?cè)诜治龅臅r(shí)候,通常會(huì)拿到如下的質(zhì)控圖(比較極端的一張作為示例):

NPC1_nGene_nUMI_mito_HB.png

我們這里先來討論線粒體确徙,上面的圖其實(shí)相對(duì)比較極端醒串,但還不是最極端的执桌,首先我們要明白一下線粒體含量高代表了什么,我聽過很多單細(xì)胞專家的講解厦凤,其中有一個(gè)共識(shí)鼻吮,那就是線粒體過高育苟,代表了細(xì)胞的狀態(tài)變差较鼓,用大白話講,細(xì)胞狀態(tài)差违柏,膜完整性遭到破壞博烂,普通的mRNA處于游離狀態(tài),會(huì)游離出來漱竖,而線粒體基因處于線粒體細(xì)胞器之內(nèi)禽篱,不容易游離出來,從而導(dǎo)致了線粒體基因的占比較高馍惹。這里呢躺率,我們首先要了解一些基礎(chǔ)知識(shí):

  • 線粒體基因轉(zhuǎn)錄和翻譯的場(chǎng)所 :線粒體,對(duì)比于核轉(zhuǎn)錄組万矾,翻譯在細(xì)胞質(zhì)悼吱。
  • 線粒體參與的生物學(xué)功能,能量供給,自由基生成和細(xì)胞凋亡良狈,其中后兩種功能都跟細(xì)胞狀態(tài)差有關(guān)后添。

所以無論從哪個(gè)角度看,線粒體高都不是一個(gè)正常的現(xiàn)象薪丁,那么就會(huì)有第一個(gè)問題:

(1)問題1遇西、線粒體占比多高算細(xì)胞狀態(tài)差?严嗜?粱檀?

我們細(xì)胞本身就需要能量,所以必然含有一定的線粒體基因漫玄,那么如何挑選細(xì)胞狀態(tài)差的呢梧税??称近?在單細(xì)胞剛興起的時(shí)候第队,對(duì)于線粒體比例的認(rèn)識(shí)不足,一律按照線粒體的閾值為5%來進(jìn)行過濾刨秆,時(shí)至今日凳谦,很多深刻的問題來到了我們的身邊,一刀切肯定是不對(duì)的衡未,給大家分享一些常識(shí):
  • 不同類型的細(xì)胞線粒體含量實(shí)不一樣的尸执,其中肌肉細(xì)胞線粒體含量最高可達(dá)50%家凯,腫瘤區(qū)域的正常細(xì)胞線粒體含量有時(shí)也在30%以上
  • 目前統(tǒng)計(jì)文章的閾值,在5%~30%之間不等如失,那么绊诲,我們應(yīng)該選多少?褪贵?掂之?
  • 目前文獻(xiàn)中使用頻率最高的閾值是10%
我們以上圖為例,線粒體的閾值應(yīng)該是多少脆丁?世舰?10%合適么?槽卫?跟压?很顯然,不合適歼培,直觀的判斷閾值應(yīng)該在15%~20%之間震蒋,那么,到底應(yīng)該選擇多少呢躲庄?查剖??我們畫一個(gè)直方圖看看:
圖片.png
很符合預(yù)期读跷,在10%~20%之間有明顯的斷崖下降梗搅,那么這個(gè)地方,個(gè)人建議閾值設(shè)置為10%或者15%效览,最好的閾值應(yīng)該是15%无切。這里我們總結(jié)一下線粒體閾值判斷的原則就是,對(duì)線粒體含量進(jìn)行排序之后的異常區(qū)域進(jìn)行去除丐枉,具體情況具體分析哆键,不能搞一刀切。

過濾2瘦锹,紅細(xì)胞過濾

我們?cè)賮硪粡垐D作為分析示例

NPC2_nGene_nUMI_mito_HB.png

首先我們要討論一個(gè)問題籍嘹,紅細(xì)胞要不要過濾?弯院?如果我的研究重點(diǎn)就是紅細(xì)胞辱士,當(dāng)然不能過濾,如果不是呢听绳?颂碘??這里就需要知道椅挣,紅細(xì)胞一旦過濾了头岔,會(huì)造成什么影響呢塔拳??峡竣?

影響有以下幾個(gè)地方

1靠抑、高變基因的變化,不過濾高變基因含有紅細(xì)胞基因适掰,過濾掉就沒有這類基因了颂碧。

2、PCA成分的變化攻谁,PCA講過很多次了稚伍,軸的旋轉(zhuǎn)肯定收到基因變化的影響弯予,去除了一些高變基因戚宦,填補(bǔ)了一些次高變基因,會(huì)增加噪音锈嫩,影響降維受楼、聚類和分群。

3呼寸、閾值的選擇艳汽,目前文獻(xiàn)中明確去除紅細(xì)胞的很少,所以对雪, 需要相當(dāng)慎重河狐。

那如果是紅細(xì)胞污染呢?瑟捣?很多時(shí)候馋艺,我們?cè)趯?shí)驗(yàn)制備之前需要確實(shí)是否進(jìn)行過裂紅處理,來減少紅細(xì)胞污染的影響迈套,所以呢捐祠,要根據(jù)自身的情況具體分析。

個(gè)人建議桑李,正常情況下踱蛀, 不需要過濾紅細(xì)胞。

3贵白、多細(xì)胞(雙細(xì)胞)的去除

不知道大家做分析有沒有去除過雙細(xì)胞率拒,一般來講,一般不會(huì)捕獲到雙細(xì)胞禁荒,但是隨著通量的增大猬膨,很有可能就要出現(xiàn)捕獲雙細(xì)胞的概率了,10X官網(wǎng)介紹了關(guān)于雙細(xì)胞捕獲的一些知識(shí)圈浇,其中捕獲一萬的細(xì)胞量寥掐,大約0.7%多是雙細(xì)胞靴寂,這里我們不展開了,關(guān)于多細(xì)胞去除我分享了很多了召耘,大家可以參考文章DoubletFinder百炬,python分析單細(xì)胞數(shù)據(jù),多細(xì)胞去除的模塊污它,多細(xì)胞去除之三剖踊,R包DoubletDecon,很多時(shí)候,我們可以直觀判斷衫贬,以下圖為例:

NPC2_nGene_nUMI_mito_HB.png

直觀判斷的話德澈,基因數(shù)高于6000的明顯是異常點(diǎn),需要暫定為雙細(xì)胞固惯,很多文獻(xiàn)都是這樣的閾值來篩選雙細(xì)胞的梆造,但是我們需要注意,雙細(xì)胞的去除還是要借助專業(yè)的軟件葬毫,個(gè)人推薦的軟件是Scrublet镇辉,效果最好。

4贴捡、低基因數(shù)量的細(xì)胞去除

這個(gè)在很多時(shí)候我們一般認(rèn)為一個(gè)細(xì)胞維持生命至少需要多少個(gè)基因忽肛,不知道大家把這個(gè)閾值設(shè)成了多少,參照官網(wǎng)的實(shí)例代碼是200烂斋,個(gè)人人為這個(gè)值有點(diǎn)低屹逛,我們還是以下圖為例:

NPC3_nGene_nUMI_mito_HB.png

這樣的圖我們根本無法判斷,畫一個(gè)直方圖來看看

圖片.png

數(shù)值太大的關(guān)系汛骂,無從判斷罕模,我們截取一下:

圖片.png

這個(gè)地方看,如果最低基因設(shè)置成200香缺,那基本沒有過濾手销,但是大家看圖的結(jié)果,在500~1000處明顯有一個(gè)低谷图张,明顯的分界線锋拖,所以這里,設(shè)置成500也很合適祸轮,這個(gè)時(shí)候就要重點(diǎn)研究一下這個(gè)部分的一般特征兽埃,這些表達(dá)很低的細(xì)胞基因都有什么,功能是什么适袜,希望引起大家的注意柄错。那么,如果部分細(xì)胞基因數(shù)低會(huì)有什么影響呢?假設(shè)A細(xì)胞表達(dá)了500個(gè)基因售貌,B細(xì)胞表達(dá)的2000個(gè)基因给猾,在進(jìn)行均一化的時(shí)候,A細(xì)胞的基因數(shù)會(huì)擴(kuò)大20倍颂跨,某些基因會(huì)明顯的放大敢伸,而B細(xì)胞擴(kuò)大了10倍,很多假陽性的生物學(xué)差異由此誕生恒削,所以大家一定要慎重池颈。

5、多樣本整合的過濾問題

首先問大家一個(gè)問題钓丰,如果單樣本過濾分析之后躯砰,多樣本整合大家還過濾么?携丁?琢歇?如果答案是否,那么恭喜你则北,你已經(jīng)掉坑里了矿微,因?yàn)閱螛颖鹃撝档牟唤y(tǒng)一性痕慢,把你的數(shù)據(jù)已經(jīng)進(jìn)行了一定的歪曲尚揣,很多結(jié)果,是假陽性掖举。

如果答案是否快骗,那么你有一定的幾率不會(huì)入坑,但不保證一定不入坑塔次,舉一個(gè)簡(jiǎn)單的例子方篮,正常樣本和腫瘤樣本的線粒體過濾的問題,如果用統(tǒng)一的閾值励负,那么恭喜你藕溅,你已經(jīng)進(jìn)坑了,上面說過了继榆,腫瘤組織的正常細(xì)胞線粒體基因的比例會(huì)變高巾表,如果用統(tǒng)一的閾值,恭喜你入坑了略吨,可能分析了很多還不知道結(jié)果為什么這樣集币,那么,到底翠忠,我們應(yīng)該如何做呢鞠苟?

結(jié)合文獻(xiàn)的思路,merge之后統(tǒng)一進(jìn)行過濾,很多文獻(xiàn)是這樣的做法当娱,但不代表都是這樣吃既,所以說這種方法更穩(wěn)妥一些,同時(shí)閾值會(huì)適當(dāng)調(diào)整跨细,以滿足樣本之間的異質(zhì)性态秧。其實(shí)真正的細(xì)胞過濾,也會(huì)有一些很深的算法支撐扼鞋!

所以說申鱼,如果進(jìn)行多樣本分析,不如直接做整合分析吧云头,單樣本的分析可以暫時(shí)放一放了捐友。

最后提一下關(guān)于空間轉(zhuǎn)錄組過濾的問題,個(gè)人建議溃槐,不要過濾匣砖,保留最原始的空間位置信息,即使線粒體比例高昏滴,也說明具有局部的生物學(xué)差異猴鲫。

生活很好,有你更好谣殊,再問一句拂共,有處對(duì)象的么?姻几?宜狐? 祝大家51快樂

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請(qǐng)通過簡(jiǎn)信或評(píng)論聯(lián)系作者蛇捌。
  • 序言:七十年代末抚恒,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子络拌,更是在濱河造成了極大的恐慌俭驮,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件春贸,死亡現(xiàn)場(chǎng)離奇詭異混萝,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)祥诽,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門譬圣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人雄坪,你說我怎么就攤上這事厘熟⊥捅模” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵绳姨,是天一觀的道長(zhǎng)登澜。 經(jīng)常有香客問我,道長(zhǎng)飘庄,這世上最難降的妖魔是什么脑蠕? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮跪削,結(jié)果婚禮上谴仙,老公的妹妹穿的比我還像新娘。我一直安慰自己碾盐,他們只是感情好晃跺,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著毫玖,像睡著了一般掀虎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上付枫,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天烹玉,我揣著相機(jī)與錄音,去河邊找鬼阐滩。 笑死二打,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的叶眉。 我是一名探鬼主播址儒,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼衅疙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起鸳慈,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤饱溢,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后走芋,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體绩郎,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年翁逞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了肋杖。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡挖函,死狀恐怖状植,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤津畸,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布振定,位于F島的核電站,受9級(jí)特大地震影響肉拓,放射性物質(zhì)發(fā)生泄漏后频。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一暖途、第九天 我趴在偏房一處隱蔽的房頂上張望卑惜。 院中可真熱鬧,春花似錦驻售、人聲如沸残揉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽抱环。三九已至,卻和暖如春纸巷,著一層夾襖步出監(jiān)牢的瞬間镇草,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工瘤旨, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留梯啤,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓存哲,卻偏偏與公主長(zhǎng)得像因宇,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子祟偷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容