作為一個生信工作者永脓,又或者作為一個研究者袍辞,在進行各種各樣的生信分析時,你都會接觸并使用到不同種類的生物信息學(xué)工具常摧。又或者當(dāng)算法搅吁,或者新技術(shù)的提升,新一代的工具的出現(xiàn)也會逼著你去學(xué)習(xí)使用新的工具落午。對于生信工作者來說谎懦,如何自學(xué)掌握并使用好生物信息學(xué)工具是一項最基本的本領(lǐng)。
在開始一種新的分析時溃斋,通常會聽到幾種工具/腳本/軟件以不同的方式做同樣的事情而產(chǎn)生不同的結(jié)果界拦。哪一個是最好的?我應(yīng)該使用哪個梗劫?哪一個會告訴我答案(研究的問題)享甸?不幸的是,答案可能是它們都是合理的梳侨,有些比其他更準確蛉威,而且還取決于你的數(shù)據(jù)。最后走哺,無論你選擇哪一個蚯嫌,都有可能會某個人批評你的選擇。本次內(nèi)容丙躏,我將和大家分享我的選擇工具還有學(xué)習(xí)工具的經(jīng)驗择示。
在此,請記住大多數(shù)生物信息學(xué)工具在UNIX系統(tǒng)上運行或有時作為R包運行;熟練運用命令行和或者R晒旅,將使學(xué)習(xí)新工具的過程變得更加容易栅盲。
-
明白你要做什么?
你可能聽說過那個人用了那個工具來分析微生物組數(shù)據(jù)或做轉(zhuǎn)錄組的分析敢朱。但它實際上做了什么?它會對你有用嗎摩瞎?首先拴签,了解你的研究問題是什么,您擁有什么樣的數(shù)據(jù)旗们,以及你需要對數(shù)據(jù)做些什么來解決怎樣的生物學(xué)問題蚓哩。然后,可以開始調(diào)查哪些工具可以為你提供你所需的內(nèi)容上渴。 -
尋找能用的工具
在Google上搜索你所需要進行的分析岸梨。在文獻中搜索已完成你想要做的分析(該文獻可能是應(yīng)用該分析在不同的背景或物種中)喜颁,了解他們用了什么工具?一般以好的高引用的論文為例曹阔。你不需要(也可能不應(yīng)該)在這里花費大量時間半开,但是必須掌握文章中常用的分析工具,或者思考是否需要在管道中串聯(lián)起來的幾個工具實現(xiàn)你所需要的分析赃份。 -
查看工具寂拆,看看他們是否順利運行
檢查他們的論文摘要或軟件手冊的介紹。該工具聽起來會像你想要它做的那樣嗎抓韩?此時你可能會對某些內(nèi)容進行排除纠永,因為你發(fā)現(xiàn)它們是針對不同類型的數(shù)據(jù)集而設(shè)計的,或者不會產(chǎn)生能夠回答你問題的結(jié)果谒拴。最好趁早發(fā)現(xiàn)這個尝江,并減少浪費不必要的時間! -
選擇屬于你的那個工具
你可能從文獻中發(fā)現(xiàn)英上,每個人都使用一種常用工具炭序,或者可能有幾種可供選擇的工具看起來同樣好。在這種情況下善延,基于測試的工具論文就很有用少态,其他人已經(jīng)完成了艱苦的工作并嘗試了相關(guān)的工具,并報告了每個工具的表現(xiàn)易遣。同時這樣論文也會突出一些你不常注意彼妻,不明顯的缺點。如果還有很多其它選擇豆茫,請選擇一個好的工具并測試一下侨歉。 -
學(xué)習(xí)該工具
如何自學(xué)一個工具可能存在一系列方法。從只運行它揩魂,看看會發(fā)生什么到深入理解并閱讀其算法幽邓。以我的經(jīng)驗,前者更容易做火脉,通過輸入輸出你可以快速了解該工具的特性牵舵。對于后者呢除非你是程序員或統(tǒng)計學(xué)家,才能快速理解(學(xué)霸就跳過吧)倦挂,否則任何人都會為后者煩惱畸颅。下面是我通常采用的學(xué)習(xí)新工具的方法:
- 快速瀏覽該工具的文獻如果該工具發(fā)表了,通過閱讀它對應(yīng)的文獻你可以了解到它的應(yīng)用量方援,對工具的功能及其工作原理有一個很好初步的認識没炒。這也是一個機會,可以找出由于某種原因犯戏,該工具是否實際上不適合你需要做的分析送火,文章中會有所提及拳话。
-
跟著安裝的流程
安裝好它,如果這從一開始安裝就造成太多困難种吸,你可能需要考慮一種替代工具弃衍,如果你有一些可供選擇的話。 -
跟著手冊還有教程學(xué)習(xí)
對于手冊或者教程中的每個命令骨稿,我首先想要在markdown中寫出來笨鸡,記錄我正在做的一切。接著檢查命令的可用選項坦冠,看看是否有任何我應(yīng)該更改的內(nèi)容或者參數(shù)形耗,但我的經(jīng)驗法則是,如果它沒有意義辙浑,或者你不確定是否需要更改它激涤,請將其保留為默認值。因為寫這個工具的程序員可能選擇了適合大多數(shù)情況的默認選項判呕。同時我會在Markdown文檔中記錄下每一步的作用/為什么我要運行這一步倦踢。只有通過你的筆記理解每一步,你才能真正熟練運用一個工具侠草。 -
處理好報錯的信息
當(dāng)你運行新的命令或者工具時辱挥,或多或少你都會遇到一些報錯的信息。當(dāng)你遇到錯誤時边涕,最好當(dāng)然是通過報錯的提示晤碘,去解決該問題。如果解決不了功蜓,可以通過Google园爷,看看其他人也遇到過該問題,或者還沒能解決可以聯(lián)系該工具的作者商討解決辦法式撼。理解和解決錯誤消息本身就是一項有益于工具開發(fā)還提高你對該工具工作原理的理解的過程童社。 -
檢查結(jié)果
查看文件生成的結(jié)果,看看是不是你所期望的著隆。如果出現(xiàn)任何問題扰楼,請嘗試并解決,輸出文件是否有誤美浦?僅僅因為它在沒有報出錯誤消息的情況下運行弦赖,并不意味著一切都正常工作。如果結(jié)果看起來不正確抵代,請嘗試另一個工具進行比較腾节。