3.12筆記GEO-常見(jiàn)圖表

本文圖片引用自生信技能樹(shù)乳怎,小潔老師的課件济似,關(guān)注微信公眾號(hào):生信技能樹(shù)嘹狞、生信星球

熱圖heatmaps

什么是熱圖

本質(zhì)上它是用顏色直觀的表現(xiàn)一個(gè)數(shù)值矩陣,圖上每一個(gè)小方格都是一個(gè)數(shù)值磺樱,按一條預(yù)設(shè)好的色彩變化尺(稱為色鍵纳猫,Color Key),來(lái)給每個(gè)數(shù)值分配顏色竹捉,雖然看起來(lái)眼花芜辕,但道理卻很簡(jiǎn)單。使用時(shí)块差,不必局限于基因鑒別上下調(diào)侵续,所有實(shí)驗(yàn)涉及矩陣數(shù)據(jù)表達(dá)都可以用熱圖可視化表達(dá)

熱圖的輸入數(shù)據(jù)必須是數(shù)值型數(shù)據(jù)框或者矩陣,顏色的變化顯示數(shù)值的大小
當(dāng)我有一個(gè)二維矩陣憾儒,例如:

image.png

這是一個(gè)TCGA肺腺癌的基因表達(dá)譜(logCPM询兴,前5個(gè)基因、5個(gè)樣本)起趾。我想以直觀的方式觀察這個(gè)二維矩陣,怎么辦警儒?

這個(gè)時(shí)候就要用到熱圖了训裆。這個(gè)矩陣的熱圖(前50個(gè)基因眶根、50個(gè)樣本):

image.png

每1個(gè)格子代表橫軸樣本名與縱軸基因?qū)?yīng)的數(shù)值,顏色顯示按照?qǐng)D右邊的色鍵標(biāo)準(zhǔn)顯示边琉。
圖中直接看很難看出什么信息属百,能不能對(duì)行和列進(jìn)行排序,把相似的排到一起 這樣不就能直觀地反應(yīng)信息了嗎变姨?當(dāng)然排序的方法有很多族扰,你可以自己排,也可以使用聚類的方法定欧。所謂聚類的方法 就是對(duì)行列(可以都聚類渔呵,也可以只對(duì)行聚類,或者只對(duì)列聚類)進(jìn)行聚類砍鸠,把聚到同一類的放到一起扩氢。 圖二 就是對(duì) 樣本和基因都進(jìn)行了層次聚類,距離較近的放到一起爷辱。聚類只是改變了數(shù)值的位置录豺,對(duì)應(yīng)的樣本和基因位置也隨著數(shù)值改變,相當(dāng)于根據(jù)數(shù)據(jù)大小把矩陣中的排列順序改變
image.png

可以只對(duì)基因進(jìn)行聚類饭弓,也可以只對(duì)樣本聚類双饥,但是注意樣本聚類后干預(yù)組和對(duì)照組的樣本可能會(huì)互相夾雜,簡(jiǎn)單來(lái)說(shuō)聚類決定了每個(gè)樣本的位置弟断,而不是分組決定了每個(gè)樣本的位置

image.png

散點(diǎn)圖和箱線圖

散點(diǎn)圖就是橫縱坐標(biāo)的對(duì)應(yīng)數(shù)值兢哭,可以根據(jù)類型區(qū)分顏色,iris中1列為例

image.png

箱線圖弱化橫坐標(biāo),強(qiáng)化分組
輸入數(shù)據(jù)是1個(gè)數(shù)值型向量和1個(gè)有重復(fù)值且不能太多的字符串向量
image.png

箱線圖中圖像的意義箱子內(nèi)包含50%的數(shù)據(jù)夫嗓,中間黑線表示數(shù)值的中位數(shù)迟螺,箱子越扁,說(shuō)明組內(nèi)差異越小舍咖,箱子越大矩父,說(shuō)明組內(nèi)差異越大。還可以在組見(jiàn)加P值對(duì)比

image.png

圖片引用自生信技能樹(shù)排霉,小潔老師的課件關(guān)注微信生信技能樹(shù)窍株、生信星球
image.png

火山圖

用來(lái)顯示limma差異分析的結(jié)果


image.png

logFC

Foldchange(FC):處理組平均值/對(duì)照組平均值


image.png

logFoldchange(logFC):FC取log2
非常羞恥的復(fù)習(xí)下初中數(shù)學(xué)

image.png
image.png

logFC的意義就是,處理組比對(duì)照組表達(dá)差別2的logFC倍攻柠,所以logFC一般為個(gè)位數(shù)球订。,logFC>0,表明處理組基因比對(duì)照組表達(dá)多瑰钮,<0冒滩,表明處理組比對(duì)照組表達(dá)少

logFC為火山圖的橫坐標(biāo),絕對(duì)值決定差異基因的數(shù)量浪谴,取閾值一般為±0.585 开睡、1因苹、1.5、1.75篇恒、2

什么是P值扶檐?

https://zhuanlan.zhihu.com/p/74698448
簡(jiǎn)單來(lái)說(shuō),對(duì)于基因表達(dá)來(lái)說(shuō)胁艰,
我們做一個(gè)假定:處理組一個(gè)基因的表達(dá)與對(duì)照組相同
P=1時(shí)款筑,無(wú)論測(cè)了幾組樣本都100%相同,差異性為0.
P=0.5時(shí)腾么,有50%的可能表達(dá)不同奈梳,差異性一般般。
P=0.05時(shí)哮翘,有95%的可能表達(dá)不同颈嚼,差異性很大。
P<0.01時(shí)饭寺,有大于99%的可能表達(dá)不同阻课,差異性顯著!

image.png

-log10(Pvalue)為火山圖的縱坐標(biāo),意義如上圖艰匙。一般P<0.01限煞,-log10(0.01)=2,一般取>2為顯著差異

image.png

主成分分析PCA

簡(jiǎn)單的了解內(nèi)容
主成分分析,旨在利用降維的思想员凝,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)(即主成分)署驻。
舉個(gè)例子:iris數(shù)據(jù)集里,每1列代表一個(gè)指標(biāo)健霹,4列就是4個(gè)指標(biāo)旺上,如果不進(jìn)行降維分析的化,我們得到的圖糖埋,就如下圖所示宣吱,可以看出a與bc,差異性大瞳别,bc有一定的交集征候。我們可以想象,如果有10000列祟敛,那么將很難分辨組間的相關(guān)性疤坝。

image.png

主成分分析就是將上圖中4個(gè)指標(biāo),降維成2個(gè)主成分馆铁,如何轉(zhuǎn)換我們以后進(jìn)一步學(xué)習(xí)跑揉,這樣就將線變成了點(diǎn),如下圖所示

image.png

圖中每個(gè)點(diǎn)代表1個(gè)樣本叼架,點(diǎn)與點(diǎn)之間的距離表示樣本間差別畔裕,中心點(diǎn)不是樣本衣撬,圈代表95%置信區(qū)間乖订,每個(gè)圈為1個(gè)組扮饶,可以看組件差異及組內(nèi)差異。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末乍构,一起剝皮案震驚了整個(gè)濱河市甜无,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌哥遮,老刑警劉巖岂丘,帶你破解...
    沈念sama閱讀 211,948評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異眠饮,居然都是意外死亡奥帘,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)寨蹋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人扔茅,你說(shuō)我怎么就攤上這事已旧。” “怎么了召娜?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,490評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵运褪,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我玖瘸,道長(zhǎng)秸讹,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,521評(píng)論 1 284
  • 正文 為了忘掉前任雅倒,我火速辦了婚禮璃诀,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘屯断。我一直安慰自己文虏,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,627評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布殖演。 她就那樣靜靜地躺著氧秘,像睡著了一般。 火紅的嫁衣襯著肌膚如雪趴久。 梳的紋絲不亂的頭發(fā)上丸相,一...
    開(kāi)封第一講書(shū)人閱讀 49,842評(píng)論 1 290
  • 那天,我揣著相機(jī)與錄音彼棍,去河邊找鬼灭忠。 笑死膳算,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的弛作。 我是一名探鬼主播涕蜂,決...
    沈念sama閱讀 38,997評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼映琳!你這毒婦竟也來(lái)了机隙?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,741評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤萨西,失蹤者是張志新(化名)和其女友劉穎有鹿,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體谎脯,經(jīng)...
    沈念sama閱讀 44,203評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡葱跋,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,534評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了源梭。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片娱俺。...
    茶點(diǎn)故事閱讀 38,673評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖咸产,靈堂內(nèi)的尸體忽然破棺而出矢否,到底是詐尸還是另有隱情,我是刑警寧澤脑溢,帶...
    沈念sama閱讀 34,339評(píng)論 4 330
  • 正文 年R本政府宣布僵朗,位于F島的核電站,受9級(jí)特大地震影響屑彻,放射性物質(zhì)發(fā)生泄漏验庙。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,955評(píng)論 3 313
  • 文/蒙蒙 一社牲、第九天 我趴在偏房一處隱蔽的房頂上張望粪薛。 院中可真熱鬧,春花似錦搏恤、人聲如沸违寿。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,770評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)藤巢。三九已至,卻和暖如春息罗,著一層夾襖步出監(jiān)牢的瞬間掂咒,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,000評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留绍刮,地道東北人温圆。 一個(gè)月前我還...
    沈念sama閱讀 46,394評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像孩革,于是被迫代替她去往敵國(guó)和親岁歉。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,562評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容

  • 注:讀懂圖片的主要方法是看懂橫軸和縱軸嫉戚。 1.1 熱圖 輸入數(shù)據(jù)是數(shù)值型矩陣刨裆、數(shù)據(jù)框顏色的深淺表示數(shù)值的大小澈圈,上方...
    阿ll閱讀 11,276評(píng)論 0 21
  • Ruizheng 的學(xué)習(xí)筆記 感謝 生信技能樹(shù) 小潔老師 長(zhǎng)腳本管理方式 分成多個(gè)腳本彬檀,每個(gè)腳本最后保存Rdat...
    Ruizheng閱讀 658評(píng)論 0 2
  • GEO數(shù)據(jù)挖掘 圖表介紹 1.熱圖 ·輸入數(shù)據(jù)是數(shù)值型矩陣\數(shù)據(jù)框·顏色的變化表示熟知的大小 2.散點(diǎn)圖和箱線圖 ...
    愛(ài)吃甜品的魚(yú)閱讀 1,073評(píng)論 0 6
  • 寫(xiě)在前面:本文為微信公眾號(hào):生信星球的數(shù)據(jù)挖掘線上班的隨堂筆記,感謝小潔老師的付出瞬女! GEO - 1.熱圖:數(shù)值是...
    沈住氣閱讀 1,755評(píng)論 0 0
  • 項(xiàng)目總覽 第一個(gè)視頻主要是項(xiàng)目總覽窍帝,介紹了整個(gè)課程的結(jié)構(gòu),每一講主要要講得東西诽偷,介紹了jimmy的github形式...
    力達(dá)兄弟閱讀 3,129評(píng)論 0 11