從學(xué)習(xí)用OncoPrint畫基因組突變的“瀑布圖”,發(fā)現(xiàn)顧博士創(chuàng)造的ComplexHeatmap是非常強(qiáng)大的一個(gè)包。
顧博士在他的GitHub上展示了這個(gè)強(qiáng)大的包在分析基因組數(shù)據(jù)時(shí)能夠呈現(xiàn)的精美絕倫的圖,我實(shí)在忍不住把它們截屏下來(lái)吠各,放在這里欣賞音同。
這促使我想要好好的拜讀一下ComplexHeatmap的full documentations。
在2.5章Seriation部分镐躲,作者非常快速的帶過(guò)了一遍如何用Seriation包reorder heatmap冬三,相比前后的章節(jié)篇幅非常短匀油。隨著修改參數(shù),heatmap的格子圖案不停的變化勾笆,似乎更順眼了敌蚜,但又說(shuō)不出個(gè)所以然。
網(wǎng)上(baidu)去搜索這個(gè)關(guān)鍵詞窝爪,得到的結(jié)果也不是很理想弛车,而且大多都是相互復(fù)制粘貼的帖子,索引出來(lái)的句子是一模一樣的蒲每。(也許優(yōu)秀的人們都用的是Google吧纷跛,可惜我不夠優(yōu)秀,爬不上去)
總之邀杏,機(jī)緣巧合搜到了一篇非常好的文章(nicolas kruchten-Make Patterns Pop Out of Heatmaps with Seriation)贫奠,介紹了Seriation這個(gè)包,也同時(shí)向讀者展示了圖像處理到底是在干嘛(妥妥是加密解密的過(guò)程呀望蜡!內(nèi)心飄過(guò)一萬(wàn)部諜戰(zhàn)劇)唤崭。
文章是英文的,簡(jiǎn)單描述一下就是:作者用一張?jiān)紙D片脖律,經(jīng)過(guò)像素畫谢肾,然后隨機(jī)重排,輸入到系統(tǒng)里小泉。利用不同的方式進(jìn)行聚類芦疏、重排冕杠。他詳細(xì)地介紹了不同法則背后的原理,已經(jīng)考量這些方法優(yōu)劣的原則酸茴。最后用TSP的方法還原了原始圖片分预,圖片的內(nèi)容非常驚喜,也是作者懸疑的噱頭薪捍,我就不劇透了噪舀。
總結(jié)一下就是,針對(duì)無(wú)序變量的聚類飘诗,傳統(tǒng)cluster的方法,對(duì)聚類到一起的兩個(gè)對(duì)象之間的順序欠缺考慮界逛。Seriation包能更加好的呈現(xiàn)數(shù)據(jù)的整體結(jié)構(gòu)(structure)昆稿,減小大區(qū)間數(shù)據(jù)對(duì)小區(qū)間數(shù)據(jù)的影響。
寫這篇筆記的另一個(gè)目的是希望增加百度上“Seriation”關(guān)鍵詞下的搜索結(jié)果息拜,讓同為我這樣不夠優(yōu)秀的人能更方便獲取有用信息溉潭。