相信許多做生物信息學(xué)的童鞋來(lái)說(shuō),空間轉(zhuǎn)錄組是最近很火的技術(shù),但是不知道大家發(fā)現(xiàn)了沒(méi)有狡汉,我們做空間的分析對(duì)于空間位置信息利用的很少,大多數(shù)情況我們就是把很多單細(xì)胞的分析方法映射于空間闽颇,從生物學(xué)的角度看盾戴, 當(dāng)然是沒(méi)有問(wèn)題的,但是讓我們放寬思路兵多,不僅僅局限于生物信息層面尖啡,這就是我們接下來(lái)分享的技術(shù)CNNs.
首先我們來(lái)看看什么是CNNs
卷積神經(jīng)網(wǎng)絡(luò)(Convolutinal Neural Networks)是非常強(qiáng)大的一種深度神經(jīng)網(wǎng)絡(luò),它在圖片的識(shí)別分類(lèi)剩膘、NLP句子分類(lèi)等方面已經(jīng)獲得了巨大的成功衅斩,也被廣泛使用于工業(yè)界,例如谷歌將它用于圖片搜索援雇、亞馬遜將它用于商品推薦等矛渴。
在我們?nèi)祟?lèi)眼睛的視野里椎扬,我們看到的圖片是風(fēng)景惫搏,是人物,是一個(gè)地方的展示蚕涤,但是對(duì)于機(jī)器而言筐赔,機(jī)器對(duì)于圖片的識(shí)別就是來(lái)源于像素點(diǎn),機(jī)器無(wú)法識(shí)別我們?nèi)祟?lèi)識(shí)別的美揖铜,只是把圖片當(dāng)成一個(gè)一個(gè)的數(shù)字來(lái)進(jìn)行存儲(chǔ)茴丰,這兩者的區(qū)別不僅僅在于格式不同,應(yīng)用起來(lái)會(huì)有千差萬(wàn)別。
接下來(lái)我們看看CNNs是如何工作的
如同人類(lèi)對(duì)事物的識(shí)別一樣贿肩,CNNs在卷積的過(guò)程中對(duì)圖片進(jìn)行特征提嚷鸵(具體原理很復(fù)雜,需要請(qǐng)教數(shù)學(xué)專(zhuān)業(yè)的大牛)汰规,而我們這里僅需要知道經(jīng)過(guò)卷積汤功,每一個(gè)過(guò)濾器就會(huì)生成一個(gè)維度的圖片,也就是經(jīng)過(guò)一個(gè)過(guò)濾器之后的圖片特征溜哮。
接下來(lái)的步驟對(duì)于小白的我來(lái)說(shuō)滔金,有點(diǎn)難以理解,不過(guò)好在數(shù)學(xué)家們將這樣的方法很好的封裝了起來(lái)茂嗓,對(duì)于這樣的技術(shù)餐茵,我們生信人員主要關(guān)注其在10X空間轉(zhuǎn)錄組上的應(yīng)用。
CNNs在空間轉(zhuǎn)錄組上的應(yīng)用
目前的空間轉(zhuǎn)錄組述吸,染色圖片還是HE染色為主忿族,圖像像素強(qiáng)度數(shù)據(jù)包含可用于診斷疾病(例如癌癥分期)的信息特征蝌矛,但是我們?cè)诜治龅倪^(guò)程主要是運(yùn)用空間的基因表達(dá)數(shù)據(jù)情況肠阱,很好對(duì)空間的圖片進(jìn)行深入的研究(畢竟我們不是計(jì)算機(jī)專(zhuān)業(yè)的嘛~),但是忽略這樣的信息就導(dǎo)致我們走向了一個(gè)極端朴读,過(guò)分的關(guān)注基因表達(dá)及空間分布屹徘,但是在非單細(xì)胞分辨率的前提下,這樣的分析有些片面衅金,沒(méi)有與病理學(xué)的圖片相結(jié)合噪伊,(另一個(gè)極端就是病理學(xué)醫(yī)生通過(guò)圖片診斷,依據(jù)經(jīng)驗(yàn)來(lái)判斷病理學(xué)特征)氮唯,而CNNs,可以將圖片的信息數(shù)字化鉴吹,以此來(lái)彌補(bǔ)分析上的不足。
話(huà)不多說(shuō)惩琉,我們來(lái)看應(yīng)用
從圖片上解釋?zhuān)粋€(gè)基因作為一個(gè)過(guò)濾器豆励,由此提取到該基因的過(guò)濾特征,有250個(gè)基因瞒渠,就會(huì)有250個(gè)過(guò)濾后的圖片深度良蒸,基于這樣的機(jī)器學(xué)習(xí),我們就可以來(lái)預(yù)測(cè)新的圖片的特征伍玖。
例如這里的預(yù)測(cè)空間基因的表達(dá)特征嫩痰,不需要進(jìn)行測(cè)序的前提下就可以預(yù)測(cè)。
事先對(duì)腫瘤特征的細(xì)胞進(jìn)行機(jī)器學(xué)習(xí)的話(huà)窍箍,那我們就可以對(duì)新的腫瘤圖片進(jìn)行疾病細(xì)胞的預(yù)測(cè)串纺,這樣的預(yù)測(cè)對(duì)于生物學(xué)研究很有意義丽旅。
在這里我就不過(guò)多的解釋了,把文獻(xiàn)的鏈接給大家纺棺,如果對(duì)于這部分內(nèi)容想深入學(xué)習(xí)的話(huà)榄笙,請(qǐng)“保持憤怒,讓王多魚(yú)傾家蕩產(chǎn)~~~”祷蝌。
SpaCell: integrating tissue morphology and spatialgene expression to predict disease cells
Integrating spatial gene expression and breast tumour morphology via deep learning
另外推薦一個(gè)研究空間信息很專(zhuān)業(yè)的R包spatstat办斑,總之一句話(huà),空間位置信息很重要杆逗,我們需要更多的手段來(lái)解讀這個(gè)信息乡翅。還是那句話(huà),請(qǐng)“保持憤怒罪郊,讓王多魚(yú)傾家蕩產(chǎn)~~~”蠕蚜。