hello屡江,大家好,今天已經(jīng)是五一假期的第二天赛不,本人呢盼理,哪也去不了,只好在家歇著俄删,所以呢宏怔,給自己找點(diǎn)事做,本人93年畴椰,單身臊诊,現(xiàn)居天津武清,女孩子有沒有想談戀愛了斜脂,可以聯(lián)系我抓艳,聯(lián)系方式是。帚戳。玷或。。片任。偏友。《怨咳咳位他,錯(cuò)了,再來产场,今天我們就來聊一聊10X單細(xì)胞和10X空間轉(zhuǎn)錄組細(xì)胞過濾的那些事鹅髓,我們來回顧一下:
過濾1、線粒體過濾
在我們的分析結(jié)果里京景,線粒體過濾應(yīng)該是繞不開的一個(gè)話題窿冯,我們?cè)诜治龅臅r(shí)候,通常會(huì)拿到如下的質(zhì)控圖(比較極端的一張作為示例):
我們這里先來討論線粒體确徙,上面的圖其實(shí)相對(duì)比較極端醒串,但還不是最極端的执桌,首先我們要明白一下線粒體含量高代表了什么,我聽過很多單細(xì)胞專家的講解厦凤,其中有一個(gè)共識(shí)鼻吮,那就是線粒體過高育苟,代表了細(xì)胞的狀態(tài)變差较鼓,用大白話講,細(xì)胞狀態(tài)差违柏,膜完整性遭到破壞博烂,普通的mRNA處于游離狀態(tài),會(huì)游離出來漱竖,而線粒體基因處于線粒體細(xì)胞器之內(nèi)禽篱,不容易游離出來,從而導(dǎo)致了線粒體基因的占比較高馍惹。這里呢躺率,我們首先要了解一些基礎(chǔ)知識(shí):
- 線粒體基因轉(zhuǎn)錄和翻譯的場(chǎng)所 :線粒體,對(duì)比于核轉(zhuǎn)錄組万矾,翻譯在細(xì)胞質(zhì)悼吱。
- 線粒體參與的生物學(xué)功能,能量供給,自由基生成和細(xì)胞凋亡良狈,其中后兩種功能都跟細(xì)胞狀態(tài)差有關(guān)后添。
所以無論從哪個(gè)角度看,線粒體高都不是一個(gè)正常的現(xiàn)象薪丁,那么就會(huì)有第一個(gè)問題:
(1)問題1遇西、線粒體占比多高算細(xì)胞狀態(tài)差?严嗜?粱檀?
我們細(xì)胞本身就需要能量,所以必然含有一定的線粒體基因漫玄,那么如何挑選細(xì)胞狀態(tài)差的呢梧税??称近?在單細(xì)胞剛興起的時(shí)候第队,對(duì)于線粒體比例的認(rèn)識(shí)不足,一律按照線粒體的閾值為5%來進(jìn)行過濾刨秆,時(shí)至今日凳谦,很多深刻的問題來到了我們的身邊,一刀切肯定是不對(duì)的衡未,給大家分享一些常識(shí):
- 不同類型的細(xì)胞線粒體含量實(shí)不一樣的尸执,其中肌肉細(xì)胞線粒體含量最高可達(dá)50%家凯,腫瘤區(qū)域的正常細(xì)胞線粒體含量有時(shí)也在30%以上
- 目前統(tǒng)計(jì)文章的閾值,在5%~30%之間不等如失,那么绊诲,我們應(yīng)該選多少?褪贵?掂之?
- 目前文獻(xiàn)中使用頻率最高的閾值是10%
我們以上圖為例,線粒體的閾值應(yīng)該是多少脆丁?世舰?10%合適么?槽卫?跟压?很顯然,不合適歼培,直觀的判斷閾值應(yīng)該在15%~20%之間震蒋,那么,到底應(yīng)該選擇多少呢躲庄?查剖??我們畫一個(gè)直方圖看看:
很符合預(yù)期读跷,在10%~20%之間有明顯的斷崖下降梗搅,那么這個(gè)地方,個(gè)人建議閾值設(shè)置為10%或者15%效览,最好的閾值應(yīng)該是15%无切。這里我們總結(jié)一下線粒體閾值判斷的原則就是,對(duì)線粒體含量進(jìn)行排序之后的異常區(qū)域進(jìn)行去除丐枉,具體情況具體分析哆键,不能搞一刀切。
過濾2瘦锹,紅細(xì)胞過濾
我們?cè)賮硪粡垐D作為分析示例
首先我們要討論一個(gè)問題籍嘹,紅細(xì)胞要不要過濾?弯院?如果我的研究重點(diǎn)就是紅細(xì)胞辱士,當(dāng)然不能過濾,如果不是呢听绳?颂碘??這里就需要知道椅挣,紅細(xì)胞一旦過濾了头岔,會(huì)造成什么影響呢塔拳??峡竣?
影響有以下幾個(gè)地方
1靠抑、高變基因的變化,不過濾高變基因含有紅細(xì)胞基因适掰,過濾掉就沒有這類基因了颂碧。
2、PCA成分的變化攻谁,PCA講過很多次了稚伍,軸的旋轉(zhuǎn)肯定收到基因變化的影響弯予,去除了一些高變基因戚宦,填補(bǔ)了一些次高變基因,會(huì)增加噪音锈嫩,影響降維受楼、聚類和分群。
3呼寸、閾值的選擇艳汽,目前文獻(xiàn)中明確去除紅細(xì)胞的很少,所以对雪, 需要相當(dāng)慎重河狐。
那如果是紅細(xì)胞污染呢?瑟捣?很多時(shí)候馋艺,我們?cè)趯?shí)驗(yàn)制備之前需要確實(shí)是否進(jìn)行過裂紅處理,來減少紅細(xì)胞污染的影響迈套,所以呢捐祠,要根據(jù)自身的情況具體分析。
個(gè)人建議桑李,正常情況下踱蛀, 不需要過濾紅細(xì)胞。
3贵白、多細(xì)胞(雙細(xì)胞)的去除
不知道大家做分析有沒有去除過雙細(xì)胞率拒,一般來講,一般不會(huì)捕獲到雙細(xì)胞禁荒,但是隨著通量的增大猬膨,很有可能就要出現(xiàn)捕獲雙細(xì)胞的概率了,10X官網(wǎng)介紹了關(guān)于雙細(xì)胞捕獲的一些知識(shí)圈浇,其中捕獲一萬的細(xì)胞量寥掐,大約0.7%多是雙細(xì)胞靴寂,這里我們不展開了,關(guān)于多細(xì)胞去除我分享了很多了召耘,大家可以參考文章DoubletFinder百炬,python分析單細(xì)胞數(shù)據(jù),多細(xì)胞去除的模塊污它,多細(xì)胞去除之三剖踊,R包DoubletDecon,很多時(shí)候,我們可以直觀判斷衫贬,以下圖為例:
直觀判斷的話德澈,基因數(shù)高于6000的明顯是異常點(diǎn),需要暫定為雙細(xì)胞固惯,很多文獻(xiàn)都是這樣的閾值來篩選雙細(xì)胞的梆造,但是我們需要注意,雙細(xì)胞的去除還是要借助專業(yè)的軟件葬毫,個(gè)人推薦的軟件是Scrublet镇辉,效果最好。
4贴捡、低基因數(shù)量的細(xì)胞去除
這個(gè)在很多時(shí)候我們一般認(rèn)為一個(gè)細(xì)胞維持生命至少需要多少個(gè)基因忽肛,不知道大家把這個(gè)閾值設(shè)成了多少,參照官網(wǎng)的實(shí)例代碼是200烂斋,個(gè)人人為這個(gè)值有點(diǎn)低屹逛,我們還是以下圖為例:
這樣的圖我們根本無法判斷,畫一個(gè)直方圖來看看
數(shù)值太大的關(guān)系汛骂,無從判斷罕模,我們截取一下:
這個(gè)地方看,如果最低基因設(shè)置成200香缺,那基本沒有過濾手销,但是大家看圖的結(jié)果,在500~1000處明顯有一個(gè)低谷图张,明顯的分界線锋拖,所以這里,設(shè)置成500也很合適祸轮,這個(gè)時(shí)候就要重點(diǎn)研究一下這個(gè)部分的一般特征兽埃,這些表達(dá)很低的細(xì)胞基因都有什么,功能是什么适袜,希望引起大家的注意柄错。那么,如果部分細(xì)胞基因數(shù)低會(huì)有什么影響呢?假設(shè)A細(xì)胞表達(dá)了500個(gè)基因售貌,B細(xì)胞表達(dá)的2000個(gè)基因给猾,在進(jìn)行均一化的時(shí)候,A細(xì)胞的基因數(shù)會(huì)擴(kuò)大20倍颂跨,某些基因會(huì)明顯的放大敢伸,而B細(xì)胞擴(kuò)大了10倍,很多假陽性的生物學(xué)差異由此誕生恒削,所以大家一定要慎重池颈。
5、多樣本整合的過濾問題
首先問大家一個(gè)問題钓丰,如果單樣本過濾分析之后躯砰,多樣本整合大家還過濾么?携丁?琢歇?如果答案是否,那么恭喜你则北,你已經(jīng)掉坑里了矿微,因?yàn)閱螛颖鹃撝档牟唤y(tǒng)一性痕慢,把你的數(shù)據(jù)已經(jīng)進(jìn)行了一定的歪曲尚揣,很多結(jié)果,是假陽性掖举。
如果答案是否快骗,那么你有一定的幾率不會(huì)入坑,但不保證一定不入坑塔次,舉一個(gè)簡(jiǎn)單的例子方篮,正常樣本和腫瘤樣本的線粒體過濾的問題,如果用統(tǒng)一的閾值励负,那么恭喜你藕溅,你已經(jīng)進(jìn)坑了,上面說過了继榆,腫瘤組織的正常細(xì)胞線粒體基因的比例會(huì)變高巾表,如果用統(tǒng)一的閾值,恭喜你入坑了略吨,可能分析了很多還不知道結(jié)果為什么這樣集币,那么,到底翠忠,我們應(yīng)該如何做呢鞠苟?
結(jié)合文獻(xiàn)的思路,merge之后統(tǒng)一進(jìn)行過濾,很多文獻(xiàn)是這樣的做法当娱,但不代表都是這樣吃既,所以說這種方法更穩(wěn)妥一些,同時(shí)閾值會(huì)適當(dāng)調(diào)整跨细,以滿足樣本之間的異質(zhì)性态秧。其實(shí)真正的細(xì)胞過濾,也會(huì)有一些很深的算法支撐扼鞋!
所以說申鱼,如果進(jìn)行多樣本分析,不如直接做整合分析吧云头,單樣本的分析可以暫時(shí)放一放了捐友。
最后提一下關(guān)于空間轉(zhuǎn)錄組過濾的問題,個(gè)人建議溃槐,不要過濾匣砖,保留最原始的空間位置信息,即使線粒體比例高昏滴,也說明具有局部的生物學(xué)差異猴鲫。
生活很好,有你更好谣殊,再問一句拂共,有處對(duì)象的么?姻几?宜狐? 祝大家51快樂