之前在Connectivity Map(cMap)的探索應(yīng)用(二)中提到了兩種cmap在線分析網(wǎng)站,一個是build2 ;另一個是CLUE平臺盅抚。bulid2在cMAP在線分析——舊版build2的使用 那期已經(jīng)講解過,今天就來簡單介紹下CLUE平臺的使用!由于CLUE平臺的功能很多塔猾,會分多期講解。上一期cMAP新版clue的使用——List Marker已經(jīng)簡單介紹了List Maker的操作方法稽坤,今天開始 query的介紹丈甸!
cMAP新版clue在線分析 糯俗,網(wǎng)站:https://clue.io/。
cMAP新版clue在線分析 睦擂,網(wǎng)站:https://clue.io/得湘。
clue的主工具區(qū)(Tools)
今天主要介紹query,該工具主要用于比較輸入signature list與參考數(shù)據(jù)庫中表達譜的相似性顿仇。
- 首先淘正,點擊tools—query,進入如下界面臼闻,(1)命名本次分析鸿吆,這命名為Myfirst individual query;(2)在query參數(shù)處些阅,選擇L1000數(shù)據(jù)庫伞剑。
Individual query
- 然后選擇individual query,在"UP-regulated genes"加載所要分析的基因list市埋,系統(tǒng)會彈出之前在網(wǎng)站上傳的基因list黎泣,這里我們選擇"mygene_up";在"DOWN-regulated genes"同理缤谎,上傳它的配對下調(diào)基因"mygene_down"抒倚,這是個可選項,如果沒有可不選坷澡。(這里強調(diào)下:基因list的數(shù)量只能在10-150之間個基因托呕,上下調(diào)加起來不超過300個基因)
- 加載基因list成功后如下圖,這時候需要核實自己上傳的基因名稱有沒有問題频敛,網(wǎng)站系統(tǒng)能不能識別项郊,系統(tǒng)給出三種表示:
Invalid gene代表不能識別,說明基因名稱不是正確的Entrez ID或HUGO symbol斟赚。
Valid gene代表可識別着降,說明基因名稱正確。
Valid but not used in query代表可識別但未收錄在L1000數(shù)據(jù)中拗军。L1000數(shù)據(jù)庫大概收錄有10000左右的基因任洞,不包括所有已知基因。
從以下結(jié)果來看发侵,加載的數(shù)據(jù)中沒有不被識別的情況交掏,因此數(shù)據(jù)是合格的,點擊submit進行分析刃鳄。
- 分析自動運行盅弛,這過程比較費時間,這次運行大概跑了三十分鐘。熊尉。罐柳。。如下展示狰住,運行結(jié)束张吉。
batch query(批量)
- 點擊tools—query,進入如下界面催植,(1)-命名本次分析肮蛹,這命名為Myfirst individual query;(2)在query參數(shù)處创南,選擇L1000數(shù)據(jù)庫伦忠。(3)選擇batch query
- 然后加載基因集,首先上傳UP的基因集稿辙,這里彈出選擇框昆码,選擇提前整理好的"cancer_up";同理上傳DOWN的基因集邻储,這里彈出選擇框赋咽,選擇提前整理好的"cancer_down"。
- UP和DOWN的基因集成功上傳后吨娜,發(fā)現(xiàn)有警告信息脓匿,提醒我基因list里有不能被識別的基因(由于這里隨便找了個gene symbol數(shù)據(jù)做測試,沒有提前評估數(shù)據(jù)宦赠,比較懶哈哈陪毡,大家自己的數(shù)據(jù)做之前,先進行EntreID轉(zhuǎn)化,這樣保險點)勾扭,我這邊就直接忽略這個警告信息啦毡琉,點擊sumit,進行分析妙色。
同樣的绊起,運行時間也需要二三十分鐘,運行結(jié)束如下:
結(jié)果線上查看
HEAT MAP查看結(jié)果
運行結(jié)束后燎斩,我們來看看結(jié)果,以"Myfirst individual query"為例蜂绎,點擊HEAT MAP
得到如下界面栅表,該界面是用熱圖的形式來呈現(xiàn)整體數(shù)據(jù),列為不同的cell ID师枣,行為Perturbagen怪瓶,且注釋有數(shù)據(jù)庫來/名稱/描述/ts_pc(不同score閾值條件下的占比)/不同cell score值的中位數(shù)。熱圖顏色代表score值践美,越紅值越高洗贰,越灰越低找岖。最左側(cè)是篩選區(qū),根據(jù)自己需要設(shè)置即可敛滋。
這個界面非常棒许布,選擇右側(cè)的CLUE Card,然后點擊感興趣的小分子行绎晃,還給我們提供該分子記錄的化學(xué)式結(jié)構(gòu)蜜唾,以及詳細介紹。
DETAILED LIST查看結(jié)果
得到如下結(jié)果界面庶艾,下面介紹常用的幾個參數(shù)鍵:
1-Perturbagen Type代表數(shù)據(jù)庫的分類(小分子成分袁余、敲除、過表達咱揍、CMap)颖榜,看個人分析需要選擇適合的庫,大部分用此庫的目的都在于分析與小分子藥物處理表達譜數(shù)據(jù)之間的相似性煤裙,因此Compond用的比較多掩完。
2-右側(cè)以條形圖的可視化形式呈現(xiàn)結(jié)果,有兩個篩選框积暖。"Subset by"有cell lines和Perturbagen type藤为。該功能主要用于在線可視化查看。
3.1-當(dāng)"Subset by"選擇以cell lines展示時夺刑,summary可以進一步選擇不同細胞系缅疟;
3.2-當(dāng)"Subset by"選擇以Perturbagen type展示時,summary可以進一步選擇不同類型的數(shù)據(jù)遍愿;
4-除了以上可視化呈現(xiàn)結(jié)果外存淫,還可以如下用表格形式呈現(xiàn),發(fā)現(xiàn)共計8559條信息(這是針對所有數(shù)據(jù)庫的結(jié)果)沼填。點擊1處設(shè)置按鈕桅咆,選擇所需要的列,然后點擊2處的export即可導(dǎo)出結(jié)果坞笙。
結(jié)果線下查閱
按照DETAILED LIST里的內(nèi)容岩饼,只導(dǎo)出compand的結(jié)果(共計2429條信息),本地txt文本結(jié)果如下薛夜,包含最重要的那幾個信息籍茧,Score值、compond的名稱梯澜。在很多涉及cmap的文章中寞冯,數(shù)據(jù)的呈現(xiàn)主要涉及Score值、name、MoA和Target吮龄。詳細的結(jié)果附件??export.xlsx
以上結(jié)果就展示了我上傳的基因list與這2429組小分子處理表達譜數(shù)據(jù)的相似性俭茧。相似程度以score值來評估,score的取值范圍在-100到100之間漓帚,結(jié)果按照從高到低降序排列母债,數(shù)值越靠近100說明該基因list與該條小分子處理記錄越相似;數(shù)值越靠近-100說明該基因list與該條小分子處理記錄越相反胰默。
為了方便大家理解场斑,假如我上傳的基因list是一組乳腺癌的signature,以上結(jié)果羅列了與2429個小分子的相似性牵署,排名靠前的那些說明表達相似漏隐,排名靠后的那些說明表達拮抗,這些顯示出拮抗的小分子可以是治療乳腺癌的候選藥物奴迅。
最后青责,使用過程中有疑問的話,可直接參考幫助網(wǎng)頁:https://clue.io/connectopedia/
往期回顧
miR-circ靶向關(guān)系如何批量預(yù)測取具?
Connectivity Map(cMap)的探索應(yīng)用(一)
miRNA靶標預(yù)測數(shù)據(jù)的答疑解惑脖隶!
Connectivity Map(cMap)的探索應(yīng)用(二)
Connectivity Map(cMap)的探索應(yīng)用(三)
今天的內(nèi)容就到這里,更多內(nèi)容可關(guān)注公共號“YJY技能修煉”~~~