這是唐海寶老師GitHub上的JCVI工具的非官方說明書奶段。
該工具集的功能非常多,但是教程資料目前看起來并不多呢铆,因此為了能讓更多人用上那么好用的工具蹲缠,我就一邊探索悠垛,一邊寫教程
fetch模塊里封裝了好幾個(gè)數(shù)據(jù)庫(kù)的下載方式
- bisect: 搜索給定accession的版本娜谊,(目前沒想到怎么用)
- ensembl: 從ENSEMBL上下載基因組和注釋
- entrez: 從ENTREZ里獲取記錄
- phytozome: 從phytozome的FTP里下載基因組和注釋
- pytozome10: 基于Globus的API從phytozome里下載基因組和注釋, 需要額外配置
- sra: 調(diào)用wget從SRA的FTP里下載數(shù)據(jù)(感覺不如直接調(diào)用prefetch)
其中ensembl
和phytozome
是我比較喜歡的工具,因?yàn)樗梢宰屛逸p松地去下載一些注釋得比較好的基因組纱皆。而且用法也很簡(jiǎn)單,直接輸入python -m jcvi.apps.fetch ensembl
或python -m jcvi.apps.fetch phytozome
就會(huì)告訴你你可以下載哪些基因組搀缠,
基因組列表