機器學(xué)習(xí)識別腫瘤干性指數(shù)mRNAsi

腫瘤干性細胞指數(shù)si是一種描述腫瘤細胞與干細胞相似程度的指標,可以認為是CSCs的量化蚁孔。干細胞具有自我更新以及治療耐藥性的特征奶赔,在癌癥中發(fā)揮著重要作用。

2018年發(fā)表在Cell上面的一篇文章采用創(chuàng)新的單類邏輯回歸(OCLR)機器學(xué)習(xí)算法杠氢,通過對干細胞轉(zhuǎn)錄組站刑、甲基化組和轉(zhuǎn)錄因子結(jié)合位點的多平臺分析,得到了兩個獨立的干性指數(shù)鼻百,其中mRNAsi可以反映干細胞的基因表達特征绞旅,另一種mDNAsi則反映干細胞的表觀遺傳特征。目前研究腫瘤干細胞大多通過RNA計算的mRNAsi進行相似程度評估温艇,因此本次我們也針對mRNAsi的OCLR計算過程進行分享玻靡。

??流程大體思路如下

利用PCBC數(shù)據(jù)庫中的干細胞類群及其分化的外胚層、中胚層和內(nèi)胚層祖細胞信息作為初始數(shù)據(jù)集中贝,使用OCLR算法訓(xùn)練推導(dǎo)出干性指數(shù)。然后將基于OCLR的計算得到的干性指數(shù)對應(yīng)的轉(zhuǎn)錄組表達量應(yīng)用于TCGA數(shù)據(jù)集臼朗,計算每個樣本的mRNAsi邻寿。每個干性指數(shù)(si)的范圍從低(0)到高(1)。


一视哑、加載相應(yīng)R包

二绣否、創(chuàng)建genes2hugo函數(shù)

該函數(shù)可以將Ensemble ID轉(zhuǎn)換為HUGO Symbols。


三挡毅、創(chuàng)建模型訓(xùn)練函數(shù)

首先我們創(chuàng)建函數(shù)main.train對新數(shù)據(jù)進行訓(xùn)練蒜撮,該函數(shù)的流程分為以下幾步:

1)利用synGet獲取PCBC數(shù)據(jù),包括兩種數(shù)據(jù),其中X是一個由229個細胞樣本的13189個基因構(gòu)成的表達矩陣段磨,Y是一個含有301個觀測值的單變量數(shù)據(jù)框取逾;

2)從 metadata 獲取 labels;

3)調(diào)用之前創(chuàng)建的genes2hugo函數(shù)苹支,將Ensembl ID轉(zhuǎn)換為HUGO Symbols砾隅;

4)計算每個基因的平均值中心(初始值-平均值);

5)根據(jù)y是否等于“SC”判斷干細胞并將所有樣本劃分為干細胞組X.tr和非干細胞組X.bk债蜜;

6)執(zhí)行g(shù)elnet函數(shù)來訓(xùn)練模型晴埂,gelnet函數(shù)使用協(xié)調(diào)下降的迭代方法,具有四個主要的參數(shù):

# X: 由( X.r?)轉(zhuǎn)置后的矩陣

# y: 如果為`NULL`則為一類模型?

# l1: L1范數(shù)懲罰的系數(shù)=> 0?

# l2: L2范數(shù)懲罰的系數(shù)=> 1

7)將signature文件存儲為pcbc-stemsig.tsv寻定;

8)使用留一法交叉驗證測試模型的準確性儒洛。

函數(shù)main.train完整代碼如下:


四、創(chuàng)建預(yù)測函數(shù)

接下來創(chuàng)建main.predict函數(shù)預(yù)測未知樣本的mRNAsi指數(shù)狼速,該函數(shù)的流程分為以下幾步:

1)讀入上個模塊中保存的signature文件琅锻,同時讀入樣本的基因表達數(shù)據(jù)(該示例從synapse中獲取表達數(shù)據(jù));

2)過濾基因ID唐含,保留僅在signature中包含的HUGO symbols, 并將表達矩陣X轉(zhuǎn)為矩陣形式浅浮,其中行為基因名,列為樣本名稱捷枯;

3)使用Spearman相關(guān)性對矩陣`X`評分滚秩,并將評分標準化為0到1之間;

4)分數(shù)輸出到文件mRNA_StemScore.tsv淮捆。

函數(shù)main.predict完整代碼如下:


五郁油、執(zhí)行完整分析

在創(chuàng)建完上述函數(shù)main.train和main.predict后,我們使用main函數(shù)將這兩個函數(shù)打包攀痊,最后運行main函數(shù)執(zhí)行完整的分析桐腌。

參考文獻:Malta TM, Sokolov A, Gentles AJ, Burzykowski T, Poisson L, Weinstein JN, Kamińska B, Huelsken J, Omberg L, Gevaert O, Colaprico A, Czerwińska P, Mazurek S, Mishra L, Heyn H, Krasnitz A, Godwin AK, Lazar AJ; Cancer Genome Atlas Research Network, Stuart JM, Hoadley KA, Laird PW, Noushmehr H, Wiznerowicz M. Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation. Cell. 2018 Apr 5;173(2):338-354.e15. doi: 10.1016/j.cell.2018.03.034. PMID: 29625051; PMCID: PMC5902191.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市苟径,隨后出現(xiàn)的幾起案子案站,更是在濱河造成了極大的恐慌,老刑警劉巖棘街,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件蟆盐,死亡現(xiàn)場離奇詭異,居然都是意外死亡遭殉,警方通過查閱死者的電腦和手機石挂,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來险污,“玉大人痹愚,你說我怎么就攤上這事。” “怎么了拯腮?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵窖式,是天一觀的道長。 經(jīng)常有香客問我疾瓮,道長脖镀,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任狼电,我火速辦了婚禮蜒灰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘肩碟。我一直安慰自己强窖,他們只是感情好,可當我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布削祈。 她就那樣靜靜地躺著翅溺,像睡著了一般。 火紅的嫁衣襯著肌膚如雪髓抑。 梳的紋絲不亂的頭發(fā)上咙崎,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天,我揣著相機與錄音吨拍,去河邊找鬼褪猛。 笑死,一個胖子當著我的面吹牛羹饰,可吹牛的內(nèi)容都是我干的伊滋。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼队秩,長吁一口氣:“原來是場噩夢啊……” “哼笑旺!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起馍资,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤筒主,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后鸟蟹,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體物舒,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年戏锹,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片火诸。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡锦针,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情奈搜,我是刑警寧澤悉盆,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站馋吗,受9級特大地震影響焕盟,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宏粤,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一脚翘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧绍哎,春花似錦来农、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至海诲,卻和暖如春繁莹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背特幔。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工咨演, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人敬辣。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓雪标,卻偏偏與公主長得像,于是被迫代替她去往敵國和親溉跃。 傳聞我的和親對象是個殘疾皇子村刨,可洞房花燭夜當晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容