生物信息學(xué)入門級的常用軟件

https://www.zhihu.com/question/23566982

生物信息學(xué)是為生物學(xué)研究者提供分析工具的學(xué)科鲁猩,滲透到生物學(xué)的幾乎每一個(gè)研究領(lǐng)域粱玲。而你要做的是編寫軟件淹真,而不是學(xué)用別人的軟件。

十年前的生物信息

  • 做一個(gè) CLUSTALW 序列比對吭从,
  • 用 PHYLIP 算一個(gè)進(jìn)化樹纤子,
  • 上 NCBI 做一個(gè) BLAST,

最常用的東西:

  • 1睡蟋,你需要會用 Linux踏幻,會使用 bash
  • 2,高于入門級的統(tǒng)計(jì)學(xué)知識戳杀,以及一門統(tǒng)計(jì)語言该面,比如 R
  • 3,至少一門編程語言信卡,一般來講 C++, Perl, Python, Java 這幾種中的一種隔缀。
  • 4,對于你工作的領(lǐng)域傍菇,需要懂這方面的生物學(xué)知識猾瘸,也需要知道目前人們在這個(gè)領(lǐng)域里都用什么其他軟件。
    以上四點(diǎn)必不可少丢习。

其他的知識則取決于你是什么領(lǐng)域牵触。

  • 比如如果你要研發(fā)高性能的序列比對軟件,則算法和并行計(jì)算的知識必不可少咐低±克迹——本人自己算法很渣,所以沒有把算啊列在以上必備的知識里见擦。
  • 如果要頻繁存取大量數(shù)據(jù)绰更,則懂得一種數(shù)據(jù)庫必不可少瞧挤,比如MySQL。

遺傳學(xué)領(lǐng)域里儡湾,目前大部分的生物信息學(xué)研究集中在二代測序(High-throughput sequencing)數(shù)據(jù)的分析工具上特恬。另外做二代基因測序的序列比對(Alignment),現(xiàn)在軟件多如牛毛徐钠,但最常用的基本還是 bowtie, bwa 等少數(shù)幾種癌刽。

這種數(shù)據(jù)和大規(guī)模運(yùn)算一般只能在大型服務(wù)器上運(yùn)行,毫無疑問的需要會 Linux 和 bash尝丐,以及一些分布式計(jì)算的基礎(chǔ)知識显拜。

做生物信息的人主要是研究方法學(xué),需要把自己的方法寫成軟件發(fā)表爹袁。用生物信息學(xué)工具的人則只是用別人的工具而已远荠,發(fā)表的文章也就并不是生物信息學(xué)的文章,而是你自己領(lǐng)域里的文章失息,比如群體遺傳學(xué)譬淳。到現(xiàn)在生物的絕大多數(shù)領(lǐng)域都需要用其他人寫的軟件處理大量數(shù)據(jù),如果把所有這樣的文章都算在生物信息里面盹兢,那 80% 的生物學(xué)文章得都是生物信息學(xué)文章了邻梆。

作者:周杰
鏈接:https://www.zhihu.com/question/23566982/answer/25192621
來源:知乎
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán)绎秒,非商業(yè)轉(zhuǎn)載請注明出處浦妄。

學(xué)習(xí)使用新軟件時(shí),先粗略地把Manual见芹、Readme剂娄、軟件涉及的文章(包括附件里的內(nèi)容,往往會提供可用的細(xì)節(jié))都過一遍玄呛,然后使用樣例數(shù)據(jù)跑跑看宜咒。遇到問題不要慌張,善用搜索工具進(jìn)行檢索(英文)把鉴,你能遇到的大部分別人都遇到過故黑,看看別人的求助貼和討論內(nèi)容一般都能解決問題。搜索解決不了問題還可以考慮給作者寫郵件庭砍,注意清晰描述遇到的情況(描述問題本身就是理清思路的過程)场晶,寫郵件或者發(fā)帖問問題盡量具體、明確一點(diǎn)怠缸,同時(shí)注意提問的條理和內(nèi)容的可讀性诗轻。

作者:王理中
鏈接:https://www.zhihu.com/question/23566982/answer/25220599
來源:知乎
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán)揭北,非商業(yè)轉(zhuǎn)載請注明出處扳炬。

必學(xué):1吏颖、計(jì)算機(jī)基礎(chǔ)(linux+perl+R 或者 python+matlab) 2、生信基礎(chǔ)知識(測序+數(shù)據(jù)庫+數(shù)據(jù)格式) 3恨樟、生信研究領(lǐng)域(全基因組半醉,全轉(zhuǎn)錄組,全外顯子組劝术,捕獲目標(biāo)區(qū)域測序) 4缩多、生信應(yīng)用領(lǐng)域(腫瘤篩查,產(chǎn)前診斷养晋,流行病學(xué)衬吆,個(gè)性化醫(yī)療)分而治之:一、計(jì)算機(jī)基礎(chǔ)绳泉,需要看三本書逊抡,一步步的學(xué)會學(xué)通,不需要刻意去找哪個(gè)書零酪,一般linux是鳥哥私房菜冒嫡,perl是小駱駝咯,R是R in action蛾娶,但是看一本書只能入門灯谣,真正想成為菜鳥潜秋,必須每個(gè)要看五本書以上蛔琅!我云盤里面有這基本上的高清打印版,大家可以去淘寶打印一下才幾十塊錢還包郵峻呛,對書比較講究的也可以買正版罗售,也不過是一百多塊錢而已!二钩述、生信基礎(chǔ)知識寨躁,測序方面,在百度文庫找十幾篇一代二代三代測序儀資料仔細(xì)研讀牙勘,然后去優(yōu)酷下載各大主流測序儀的動畫講解职恳,再看看陳巍學(xué)基因的講解;數(shù)據(jù)庫先看看三大主流數(shù)據(jù)庫——NCBI,ENSEMBL,UCSC方面,還有一些也可以了解一些(uniprot,IMGT,KEGG放钦,OMIN,TIGR恭金,GO)同樣也是百度文庫自己搜索資料操禀,但是這次需要自己去官網(wǎng)一個(gè)個(gè)頁面點(diǎn)擊看,一個(gè)個(gè)翻譯成中文理解吃透横腿;數(shù)據(jù)格式講起了就多了颓屑,這個(gè)主要是在項(xiàng)目流程中慢慢學(xué)斤寂,或者你有機(jī)會去上課,不然你看來也是立馬忘記的揪惦,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等三遍搞、生信研究領(lǐng)域,各個(gè)領(lǐng)域主要是軟件繁多丹擎,合起來常用的估計(jì)有上百個(gè)軟件了尾抑,一般只有從業(yè)五六年以上的人才有可能把它們?nèi)坑眠^一遍,而且這也完全需要項(xiàng)目來訓(xùn)練蒂培,而不能僅僅是看看軟件手冊再愈,但是研究領(lǐng)域最重要的是背后的原理,需要看各大牛的綜述护戳。a) 生信基礎(chǔ)軟件(blast++套件翎冲,fastqc,flash媳荒,blast抗悍,solexaQA,NGS-QC-toolkit钳枕,SRA-toolkit缴渊,fastx-toolkit)b) snp-calling相關(guān)軟件(bwa,bowtie鱼炒,samtools衔沼,GATK,VarScan.jar昔瞧,annovar)c) 基因組相關(guān)軟件(velvet指蚁,SOAPdenovo2,repeatmasker,repeatscount,piler自晰,orthMCL凝化,inparanoid,clustw,muscle,MAFFT酬荞,quickparanoid搓劫,blast2go,RAxML混巧,phyML)d) 轉(zhuǎn)錄組相關(guān)軟件(trinity枪向,tophat,cufflinks牲剃,RseQC遣疯,RNAseq,GOseq,MISO缠犀,RSEM数苫,khmer,screed辨液,trimmomatic虐急,transDecoder,vast-tools滔迈,picard-tools止吁,htseq,cuffdiff燎悍,edgeR敬惦,DEseq,funnet谈山,davidgo俄删,wego,kobas奏路,KEGG畴椰,Amigo,go)四鸽粉、生信應(yīng)用領(lǐng)域斜脂,講這一塊其實(shí)已經(jīng)脫離了生信菜鳥的解釋范圍了,主要是想說社會上為什么需要搞生信的人才触机,全是因?yàn)樵谀[瘤篩查帚戳,產(chǎn)前診斷,流行病學(xué)威兜,個(gè)性化醫(yī)療等領(lǐng)域有所應(yīng)用销斟,可以造福人類B贰=范妗!這方面政策不確定约谈,產(chǎn)業(yè)不定型笔宿,所以也這絕對是藍(lán)海湾揽,但是也絕對不會有現(xiàn)成的資料直接培訓(xùn)人才蛉迹,我們必須關(guān)注各種微信公眾號速蕊,逛各種測序掠手,醫(yī)學(xué)相關(guān)論壇鸭廷,緊跟業(yè)界精英的腳本烫堤,同時(shí)追著大牛的文獻(xiàn)閱讀指煎,如此這般才能保住菜鳥的身份仗阅!

作者:曾健明
鏈接:https://www.zhihu.com/question/23566982/answer/41832167
來源:知乎
著作權(quán)歸作者所有靡菇。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán)重归,非商業(yè)轉(zhuǎn)載請注明出處米愿。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市鼻吮,隨后出現(xiàn)的幾起案子育苟,更是在濱河造成了極大的恐慌,老刑警劉巖椎木,帶你破解...
    沈念sama閱讀 218,858評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件违柏,死亡現(xiàn)場離奇詭異,居然都是意外死亡香椎,警方通過查閱死者的電腦和手機(jī)漱竖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,372評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來畜伐,“玉大人闲孤,你說我怎么就攤上這事】窘福” “怎么了讼积?”我有些...
    開封第一講書人閱讀 165,282評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長脚仔。 經(jīng)常有香客問我勤众,道長,這世上最難降的妖魔是什么鲤脏? 我笑而不...
    開封第一講書人閱讀 58,842評論 1 295
  • 正文 為了忘掉前任们颜,我火速辦了婚禮,結(jié)果婚禮上猎醇,老公的妹妹穿的比我還像新娘窥突。我一直安慰自己,他們只是感情好硫嘶,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,857評論 6 392
  • 文/花漫 我一把揭開白布阻问。 她就那樣靜靜地躺著,像睡著了一般沦疾。 火紅的嫁衣襯著肌膚如雪称近。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,679評論 1 305
  • 那天哮塞,我揣著相機(jī)與錄音刨秆,去河邊找鬼。 笑死忆畅,一個(gè)胖子當(dāng)著我的面吹牛衡未,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,406評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼缓醋,長吁一口氣:“原來是場噩夢啊……” “哼剔交!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起改衩,我...
    開封第一講書人閱讀 39,311評論 0 276
  • 序言:老撾萬榮一對情侶失蹤岖常,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后葫督,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體竭鞍,經(jīng)...
    沈念sama閱讀 45,767評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年橄镜,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了偎快。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,090評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡洽胶,死狀恐怖晒夹,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情姊氓,我是刑警寧澤丐怯,帶...
    沈念sama閱讀 35,785評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站翔横,受9級特大地震影響读跷,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜禾唁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,420評論 3 331
  • 文/蒙蒙 一效览、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧荡短,春花似錦丐枉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,988評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至烫映,卻和暖如春沼本,著一層夾襖步出監(jiān)牢的瞬間噩峦,已是汗流浹背锭沟。 一陣腳步聲響...
    開封第一講書人閱讀 33,101評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留识补,地道東北人族淮。 一個(gè)月前我還...
    沈念sama閱讀 48,298評論 3 372
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親祝辣。 傳聞我的和親對象是個(gè)殘疾皇子贴妻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,033評論 2 355

推薦閱讀更多精彩內(nèi)容