3.《Bioinformatics Data Skills》之可重復性與魯棒性

創(chuàng)造有可重復與魯棒性的數(shù)據(jù)分析習慣不僅關(guān)乎個人的科學素養(yǎng),并且使得我們的科研道路更加輕松谁帕。

可重復性(建議)

測序?qū)嶒灤鷥r昂貴椰弊,難以進行重復召边,所以我們越來越多地依賴只進行計算機的重復性實驗。然而生物信息數(shù)據(jù)分析的復雜性往往阻礙我們進行實驗重復。為了進行可重復的數(shù)據(jù)分析實驗晴弃,可以采用以下的措施:

  1. 分享數(shù)據(jù)與代碼⊙攘梗現(xiàn)在很多雜志都要求或者提倡作者公開代碼,尤其是代碼作為實驗的重要組成部分的情況瘫辩》龋“Common errors are simple, simple errors are common”,公開代碼就要求我們反復確認代碼是否正確地生成了結(jié)果伐厌。
  2. 良好的記錄習慣承绸。糟糕的記錄習慣使得實驗重復難以進行。需要注意的是挣轨,除了數(shù)據(jù)與代碼军熏,數(shù)據(jù)與代碼的版本同樣非常重要,例如數(shù)據(jù)的版本與下載地址卷扮,不同的R版本下數(shù)據(jù)分析的結(jié)果可能會完全不同荡澎。額外描述數(shù)據(jù)的數(shù)據(jù)被稱為“元數(shù)據(jù)”。良好的記錄習慣也會提高實驗的魯棒性晤锹。

魯棒性(建議

生物信息數(shù)據(jù)分析不夠魯棒性的可能原因:

  1. 數(shù)據(jù)分析犯錯誤相比于濕實驗來說可能會很不明顯摩幔,并且生物信息數(shù)據(jù)分析的代碼往往只會運行一次。相對比鞭铆,游戲軟件被開發(fā)出來后大量用戶會對其進行測試以消除BUG或衡。
  2. 我們對于大規(guī)模的基因組層面分析難以形成一個強烈的先驗知識,比如說濕實驗中一個基因表達豐度高于管家基因是很明顯的異吵邓欤現(xiàn)象封断,但是在基因組層面成千上萬的數(shù)據(jù)量面前,我們很難形成一個先驗知識來判定一個結(jié)果是好結(jié)果還是壞結(jié)果
  3. 生物信息學的軟件可能只對某種情境有效舶担,比如說軟件通常只對人類有效而很少對模式生物有效坡疼,盲目使用很可能會造成錯誤。

生物信息學的一條金標準:

Never ever trust your tools (or data)

錯誤的數(shù)據(jù)只會帶來錯誤的結(jié)果衣陶,需要保持一種謹慎的態(tài)度柄瑰。當然也不要太過極端闸氮,我們在每一步處理數(shù)據(jù)后對結(jié)果進行必要的檢查,拿到數(shù)據(jù)與軟件后進行測試可以有效地減少不必要的錯誤狱意。
或許錯誤是不可避免的湖苞,所以保持一顆可能會犯錯的心態(tài)很重要。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末详囤,一起剝皮案震驚了整個濱河市财骨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌藏姐,老刑警劉巖隆箩,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異羔杨,居然都是意外死亡捌臊,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進店門兜材,熙熙樓的掌柜王于貴愁眉苦臉地迎上來理澎,“玉大人,你說我怎么就攤上這事曙寡】放溃” “怎么了?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵举庶,是天一觀的道長执隧。 經(jīng)常有香客問我,道長户侥,這世上最難降的妖魔是什么镀琉? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮蕊唐,結(jié)果婚禮上屋摔,老公的妹妹穿的比我還像新娘。我一直安慰自己刃泌,他們只是感情好凡壤,可當我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著耙替,像睡著了一般。 火紅的嫁衣襯著肌膚如雪曹体。 梳的紋絲不亂的頭發(fā)上俗扇,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天,我揣著相機與錄音箕别,去河邊找鬼铜幽。 笑死滞谢,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的除抛。 我是一名探鬼主播狮杨,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼到忽!你這毒婦竟也來了橄教?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤喘漏,失蹤者是張志新(化名)和其女友劉穎护蝶,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體翩迈,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡持灰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了负饲。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片堤魁。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖返十,靈堂內(nèi)的尸體忽然破棺而出妥泉,到底是詐尸還是另有隱情,我是刑警寧澤吧慢,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布涛漂,位于F島的核電站,受9級特大地震影響检诗,放射性物質(zhì)發(fā)生泄漏匈仗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一逢慌、第九天 我趴在偏房一處隱蔽的房頂上張望悠轩。 院中可真熱鬧,春花似錦攻泼、人聲如沸火架。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽何鸡。三九已至,卻和暖如春牛欢,著一層夾襖步出監(jiān)牢的瞬間骡男,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工傍睹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留隔盛,地道東北人犹菱。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像吮炕,于是被迫代替她去往敵國和親腊脱。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容