數(shù)據(jù)挖掘的非編碼RNA的“五分以上”文章鳍怨,標(biāo)題:Identification of a RNA-Seq based prognostic signature with five lncRNAs for lung squamous cell carcinoma。
為了方便理解跪妥,小博簡單的為本文梳理了一個(gè)流程圖:
看了這個(gè)流程圖鞋喇,是不是瞬間感覺自己也能做呢?那么下面咱們一起來解讀一下這篇文章的思路吧眉撵。
1侦香、首先文章共分離出了7589個(gè)lncRNA,事實(shí)上TCGA上lncRNA的數(shù)量遠(yuǎn)不止于此纽疟。
2罐韩、使用R包DEseq來篩選具有差異表達(dá)的lncRNA,共得到4225個(gè)差異的lncRNA污朽。事實(shí)上lncRNA豐度都比較低散吵,使用該包未必是最優(yōu)的選擇。
來張美美的火山圖,展示一下:
3矾睦、對(duì)每一個(gè)差異的lncRNA做單因素生存分析晦款,共篩選出41個(gè)有預(yù)后差異的lncRNA。這41個(gè)lncRNA在論文中不好展示枚冗,直接用表格作為補(bǔ)充材料提交缓溅。
4、對(duì)這41個(gè)lncRNA進(jìn)行多因素生存回歸分析赁温,最終構(gòu)建出5個(gè)lncRNA的生存模型坛怪。
5、得到這五個(gè)lncRNA后股囊,首先要展示這五個(gè)lncRNA的染色體位置袜匿,預(yù)后的顯著性等各方面信息,以便大家了解這五個(gè)lncRNA的基本情況毁涉。
6沉帮、接下來就要看看不同風(fēng)險(xiǎn)分?jǐn)?shù)(PI)下,這五個(gè)lncRNA的表達(dá)和預(yù)后情況贫堰,為之后的樣本分類做好準(zhǔn)備。
這個(gè)圖顯示了五個(gè)lncRNA構(gòu)建的預(yù)后模型中不同樣本的風(fēng)險(xiǎn)得分以及表達(dá)水平上的對(duì)應(yīng)關(guān)系待牵。從圖中可以看出隨著風(fēng)險(xiǎn)得分的增高其屏,樣本的死亡時(shí)間有所加快(圖B);且前兩個(gè)lncRNA的表達(dá)有下降趨勢(shì)缨该,后三個(gè)的表達(dá)呈現(xiàn)上升趨勢(shì)偎行。
這就說明三個(gè)問題:
①風(fēng)險(xiǎn)得分越高,預(yù)后越差
②前兩個(gè)lncRNA表達(dá)越低贰拿,預(yù)后越差
③后三個(gè)lncRNA表達(dá)越高蛤袒,預(yù)后越差
那么這個(gè)圖是怎么做出來的呢?其實(shí)很簡單膨更,三個(gè)圖橫軸都是樣本妙真,按照風(fēng)險(xiǎn)得分進(jìn)行排序,第一個(gè)就是散點(diǎn)圖荚守,第二個(gè)也是(將死亡的標(biāo)記成紅色)珍德,第三個(gè)是熱圖,三個(gè)圖組合一下就完事矗漾,實(shí)在不行一個(gè)一個(gè)畫锈候,畫完之后用AI拼一下就行了。
7敞贡、通過對(duì)比這五個(gè)lncRNA的預(yù)后模型與現(xiàn)有的病理學(xué)分類的區(qū)別泵琳,最終發(fā)現(xiàn)這個(gè)模型比現(xiàn)有的要好一些(這就是這篇文章的全部意義。。获列。)琳钉。
8、既然模型公式有了蛛倦,那么選擇一個(gè)好用的閾值來進(jìn)行分類就顯得至關(guān)重要了歌懒。這里使用ROC來評(píng)判模型的好壞,以及選擇一個(gè)最優(yōu)的閾值(A圖中對(duì)應(yīng)y軸-x軸最大那個(gè)點(diǎn))溯壶。
9及皂、找到最優(yōu)的閾值之后,對(duì)樣本進(jìn)行分類且改,然后對(duì)比一下五個(gè)lncRNA的表達(dá)情況验烧。圖一定要好看。
10又跛、使用WGCNA構(gòu)建共表達(dá)網(wǎng)絡(luò)來看這五個(gè)基因的功能碍拆。小博猜這一步應(yīng)該是為了說明,如何找到這五個(gè)lncRNA中最關(guān)鍵的lncRNA-RP11-54H7.4慨蓝。其實(shí)小博覺得如果跟基因表達(dá)一起構(gòu)建的話感混,可能更有利于說明這個(gè)lncRNA的功能。
11礼烈、通過其他數(shù)據(jù)集進(jìn)行驗(yàn)證弧满。作者不僅利用好多套GEO的來驗(yàn)證預(yù)后,還結(jié)合該課題組之前的lncRNA數(shù)據(jù)來驗(yàn)證差異表達(dá)此熬。
這樣分析下來庭呜,是不是覺得5分也不是很難呢,趕快行動(dòng)起來吧犀忱!
許多關(guān)注nambou1 W信公眾號(hào)的朋友都解決了自己在論文發(fā)表方面的困惑募谎,順利的發(fā)表了論文,你不去關(guān)注一下阴汇?
公眾號(hào)回復(fù):scihub 獲取最新版SciHub下載工具 免費(fèi)下載科學(xué)文獻(xiàn)
歡迎關(guān)注官方公眾號(hào)数冬,還有更多實(shí)用工具等你來拿
免費(fèi)求助熱線: 400-080-3779
??END??