hello彩倚,大家好者春,今天給大家分享一個(gè)新的內(nèi)容栅隐,基因調(diào)控網(wǎng)絡(luò)分析,文章在Modeling gene regulatory networks using neural network architectures屈糊,文章中提出的DeepSEM的榛,可以針對(duì)單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),進(jìn)行基因調(diào)控網(wǎng)絡(luò)推斷逻锐,數(shù)據(jù)可視化和聚類夫晌,以及模擬數(shù)據(jù)生成,非常好的方法昧诱,值得大家借鑒和學(xué)習(xí)晓淀。
不同細(xì)胞類型中,基因調(diào)控網(wǎng)絡(luò)存在差異盏档,通過單細(xì)胞測(cè)序凶掰,可以找出這些差異。但由于單細(xì)胞數(shù)據(jù)中,不同細(xì)胞類型間的噪聲大懦窘,傳統(tǒng)的方法需要復(fù)雜校正前翎,而基于深度學(xué)習(xí)的方法,往往模型是一個(gè)黑箱奶赠,對(duì)其內(nèi)部運(yùn)行的細(xì)節(jié)知之甚少鱼填。而DeepSEM,能夠只基于單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)毅戈,不使用轉(zhuǎn)錄因子或單細(xì)胞 ATAC數(shù)據(jù),就能完成基因調(diào)控網(wǎng)絡(luò)的推斷愤惰。
DeepSEM的算法架構(gòu)是一個(gè)beta變分自編碼器苇经,其中編碼器在經(jīng)過多層感知機(jī)降維之后,通過優(yōu)化編碼器的模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)的誤差宦言,訓(xùn)練模型中的參數(shù)扇单,經(jīng)由編碼器,可得出基因調(diào)控網(wǎng)絡(luò)奠旺,經(jīng)由對(duì)神經(jīng)網(wǎng)絡(luò)權(quán)重的UMAP蜘澜。可得出單細(xì)胞數(shù)據(jù)的聚類及可視化响疚;而通過編碼器鄙信,可生產(chǎn)類似給定訓(xùn)練數(shù)據(jù)的模擬數(shù)據(jù)集,生成的模擬數(shù)據(jù)忿晕,可在數(shù)據(jù)集有限的情況下装诡,通過結(jié)合模擬數(shù)據(jù),提升細(xì)胞類型分類模型的準(zhǔn)確性践盼,增強(qiáng)差異基因識(shí)別的準(zhǔn)確性鸦采。
在來自人類和小鼠的五個(gè)細(xì)胞系中,選取不同大小的基因調(diào)控網(wǎng)絡(luò)中咕幻,在已知調(diào)控網(wǎng)絡(luò)時(shí)渔伯,使用不同的標(biāo)準(zhǔn)集,DeepSEM的表現(xiàn)肄程,都優(yōu)于其它方法锣吼,而當(dāng)真集變?yōu)榧?xì)胞特異的chip-seq數(shù)據(jù)時(shí),其相比非特異性chip-seq數(shù)據(jù)為真集時(shí)绷耍,效果更好
- 注:使用不同數(shù)據(jù)吐限,將隨機(jī)預(yù)測(cè)得出的情況作為最差預(yù)測(cè),通過顏色判斷推斷出的轉(zhuǎn)錄網(wǎng)絡(luò)好壞褂始,圖中的數(shù)字越小诸典,模型預(yù)測(cè)的調(diào)控網(wǎng)絡(luò)的邊和實(shí)際情況越接近。
使用表觀數(shù)據(jù)來驗(yàn)證,發(fā)現(xiàn)6個(gè)細(xì)胞的聚類分開狐粱,且不同細(xì)胞中舀寓,基因Rotb和Syt6預(yù)測(cè)的調(diào)控基因,其表達(dá)量都相對(duì)較高肌蜻,這進(jìn)一步說明了該方法預(yù)測(cè)的基因調(diào)控網(wǎng)絡(luò)的準(zhǔn)確性方椎。
之后凌净,該文論證了使用DeepSEM得出的低維度表征的有效性,相比其它方法得出的低維度表征,在由小鼠大腦揽趾,胚胎及外周血組成的數(shù)據(jù)集中,使用DeepDEM得出的表征甲捏,在可視化后細(xì)胞間分的更開含蓉,且ARI和MNI兩個(gè)量化指標(biāo)得分也更高。
由于DeepSEM的運(yùn)行時(shí)間帮哈,會(huì)隨著轉(zhuǎn)錄組中基因數(shù)目的變化而增大膛檀,因此作者推薦輸入數(shù)據(jù)應(yīng)先篩選出高可變基因,而不是以全部轉(zhuǎn)錄組作為輸入娘侍】校考慮到基因調(diào)控網(wǎng)絡(luò)在各類細(xì)胞中是相同的,該方法構(gòu)建的調(diào)控網(wǎng)絡(luò)憾筏,可以作為隱空間嚎杨,用于單細(xì)胞數(shù)據(jù)的批次校正。同時(shí)踩叭,類似的方法磕潮,未來還可能應(yīng)用于更多類型的數(shù)據(jù),例如轉(zhuǎn)錄組或染色質(zhì)開放性的測(cè)序數(shù)據(jù)上容贝。
示例代碼鏈接
數(shù)據(jù)聚類
網(wǎng)絡(luò)調(diào)控推斷
數(shù)據(jù)模擬
生活很好自脯,有你更好