生物信息-編程練習(xí)題學(xué)習(xí)01

參考學(xué)習(xí)資料:https://mp.weixin.qq.com/s/n-C2P322ZWQyZ6-3EEKbxA
經(jīng)车醒粒看到群里會(huì)有一些題目候衍,然后都不知道怎么去做笼蛛,先來學(xué)習(xí)一下前人經(jīng)驗(yàn)

關(guān)于如何入門編程,你可能需要

以下是一些題目及答案示例

對FASTQ的操作:

  • 5,3段截掉幾個(gè)堿基
  • 序列長度分布統(tǒng)計(jì)
  • FASTQ 轉(zhuǎn)換成 FASTA
  • 統(tǒng)計(jì)堿基個(gè)數(shù)及GC%

對FASTA的操作:

  • 取互補(bǔ)序列
  • 取反向序列
  • DNA to RNA
  • 大小寫字母形式輸出
  • 每行指定長度輸出序列
  • 按照序列長度/名字排序
  • 提取指定ID的序列
  • 隨機(jī)抽取序列

高級(jí)難度:

  • 根據(jù)坐標(biāo)取序列
  • 多文件合并
  • 根據(jù)ID列表取序列
  • GTF文件探索
  • 簡并堿基的引物序列還原成多條序列
  • snp進(jìn)行注釋并格式化輸出

01 下載安裝bowtie2(內(nèi)含測試數(shù)據(jù))

先下載安裝安裝軟件的工具 Bioconda (http://bioconda.github.io
參考:https://mp.weixin.qq.com/s/FBsY8hRjTS6ih2RvY47I6Q
按照這個(gè)工具先刪除電腦原來的版本妖异,重新安裝新的版本

$ wget https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.sh
Miniconda3-latest-M 100%[===================>]  49.36M   381KB/s    in 2m 10s
$ mkdir biosoft
$ mv Miniconda3-latest-MacOSX-x86_64.sh biosoft/
$ cd biosoft/
$ ls
Miniconda3-latest-MacOSX-x86_64.sh
$ bash Miniconda3-latest-MacOSX-x86_64.sh 
Welcome to Miniconda3 4.7.12
#省略安裝過程惋戏,一路enter,yes
optional arguments:
  -h, --help     Show this help message and exit.
  -V, --version  Show the conda version number and exit.
conda commands available from other packages:
  env
#安裝完成
$ conda list
#配置鏡像:
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ 
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
$ conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
$ conda config --set show_channel_urls yes
$ conda config --add channels conda-forge
$ conda config --add channels r
$ conda config --add channels bioconda
#查看鏡像
$ conda config --get channels
$ cat ~/.condarc
#刪除鏡像
$ conda config --remove channels
#新建文件目錄安裝軟件
$ conda create -n test 
conda activate test
$ mkdir bowtie &&  cd bowtie
$ conda install -y bowtie2
#同樣是一路yes,然后如下結(jié)果顯示正確安裝
Preparing transaction: done
Verifying transaction: done
Executing transaction: done
(test) Cheng-MacBook-Pro:bowtie chelsea$ 

小知識(shí)點(diǎn):
軟件更新 : conda update 軟件名
若不確定軟件名稱他膳,可以先使用搜索: conda search fastqc
安裝特定版本軟件: ex. conda install bwa=0.7.12
軟件卸載: conda remove 軟件名
conda 卸載:
A :首先 rm -rf ~/miniconda3
B: 環(huán)境變量中去掉conda, vi ~/bash_profile 刪除conda路徑响逢,退出保存
C: 刪除隱藏的.condarc 、.conda以及.continuum文件

02 人類基因組的外顯子區(qū)域的長度

題目:下載人類外顯子的坐標(biāo)文件棕孙,編寫代碼統(tǒng)計(jì)外顯子區(qū)域的長度舔亭。
測試數(shù)據(jù):
Bioconductor的TxDb.Hsapiens.UCSC.hg19.knownGene
NCBI數(shù)據(jù)庫:ftp://ftp.ncbi.nlm.nih.gov/pub/CCDS/current_human/

這么多的內(nèi)容都要下載,我應(yīng)該需要一個(gè)批量下載的命令行

原本是想找到一個(gè)批量下載的工具蟀俊,搜索到這篇推送讓下載更方便
它首推了一個(gè)叫uGet的插件钦铺,在火狐瀏覽器里面支持使用的,下載安裝后肢预,發(fā)現(xiàn)有點(diǎn)問題:

image.png

提示不能使用矛洞,需要安裝新的支持工具
2個(gè)鏈接都去看了,發(fā)現(xiàn)沒有適合Mac終端的指令烫映,不知道是不是不支持還是怎么回事

然后去GitHub上查找了相關(guān)信息沼本,發(fā)現(xiàn)這個(gè)插件也是支持Chrome的,然后嘗試了一下發(fā)現(xiàn)可以用
添加了插件

直接右鍵點(diǎn)擊需要下載的文件就可以看到多了一個(gè)通過這個(gè)插件下載的選項(xiàng)了锭沟。
選擇uGet下載

將下載好的文件放在一個(gè)目錄下抽兆,新建一個(gè)R session

R實(shí)現(xiàn)代碼示例:拷貝了曾老師教程里面的代碼后運(yùn)行出了如下報(bào)錯(cuò),然后我以為是沒有安裝什么包冈钦,把實(shí)例數(shù)據(jù)的包TxDb.Hsapiens.UCSC.hg19.knownGene安裝了一遍郊丛,加載后仍然出現(xiàn)報(bào)錯(cuò)

> a=read.table(choose.files("ccds/CCDS_nucleotide.current.fna.gz"),sep = '  ',stringsAsFactors = F,header = T) # 選擇你下的CCDs文件
Error in choose.files("ccds/CCDS_nucleotide.current.fna.gz") : 
  could not find function "choose.files"

之后去查這個(gè)函數(shù)到底在哪里李请,發(fā)現(xiàn)是在基礎(chǔ)包里面,既然是基礎(chǔ)包厉熟,我應(yīng)該都安裝了导盅,為啥加載錯(cuò)誤呢,問號(hào)一下發(fā)現(xiàn)揍瑟,又鬧了個(gè)笑話


這是一個(gè)windows定制函數(shù)

估計(jì)這樣的函數(shù)還有很多白翻,但是有沒有對應(yīng)的mac版本可用的函數(shù)呢?我想這里應(yīng)該有個(gè)列表绢片,但是我覺得這種不同系統(tǒng)版本問題導(dǎo)致的函數(shù)不同應(yīng)該挺多的滤馍,希望開發(fā)者找到一個(gè)合理的方法去解決,如果能統(tǒng)一就好了底循。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末巢株,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子熙涤,更是在濱河造成了極大的恐慌阁苞,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,968評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件祠挫,死亡現(xiàn)場離奇詭異那槽,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)等舔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門骚灸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人慌植,你說我怎么就攤上這事甚牲。” “怎么了涤浇?”我有些...
    開封第一講書人閱讀 153,220評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵鳖藕,是天一觀的道長。 經(jīng)常有香客問我只锭,道長著恩,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評(píng)論 1 279
  • 正文 為了忘掉前任蜻展,我火速辦了婚禮喉誊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘纵顾。我一直安慰自己伍茄,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評(píng)論 5 374
  • 文/花漫 我一把揭開白布施逾。 她就那樣靜靜地躺著敷矫,像睡著了一般例获。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上曹仗,一...
    開封第一講書人閱讀 49,144評(píng)論 1 285
  • 那天榨汤,我揣著相機(jī)與錄音,去河邊找鬼怎茫。 笑死收壕,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的轨蛤。 我是一名探鬼主播蜜宪,決...
    沈念sama閱讀 38,432評(píng)論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼祥山!你這毒婦竟也來了圃验?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評(píng)論 0 261
  • 序言:老撾萬榮一對情侶失蹤枪蘑,失蹤者是張志新(化名)和其女友劉穎损谦,沒想到半個(gè)月后岖免,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體岳颇,經(jīng)...
    沈念sama閱讀 43,586評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評(píng)論 2 325
  • 正文 我和宋清朗相戀三年颅湘,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了话侧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,137評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡闯参,死狀恐怖瞻鹏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鹿寨,我是刑警寧澤新博,帶...
    沈念sama閱讀 33,783評(píng)論 4 324
  • 正文 年R本政府宣布,位于F島的核電站脚草,受9級(jí)特大地震影響赫悄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜馏慨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評(píng)論 3 307
  • 文/蒙蒙 一埂淮、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧写隶,春花似錦倔撞、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鄙陡。三九已至,卻和暖如春躏啰,著一層夾襖步出監(jiān)牢的瞬間柔吼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評(píng)論 1 262
  • 我被黑心中介騙來泰國打工丙唧, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留愈魏,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,595評(píng)論 2 355
  • 正文 我出身青樓想际,卻偏偏與公主長得像培漏,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子胡本,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • wes定義: 全外顯子組測序牌柄,是利用目標(biāo)序列捕獲技術(shù), 將全基因組編碼基因外顯子區(qū)域的DNA捕獲并富集后侧甫,進(jìn)行高通...
    鳳凰_0949閱讀 4,149評(píng)論 0 7
  • 這是我聽B站鯪魚不會(huì)飛視頻(R與Bioconductor的入門課)里的筆記哦~ 介紹AnnotationHub包 ...
    黃晶_id閱讀 9,365評(píng)論 1 37
  • RNAseq實(shí)際操作(實(shí)戰(zhàn)) 首先聲明珊佣,雖然是實(shí)戰(zhàn),但是其實(shí)是學(xué)習(xí)筆記而已披粟,初學(xué)咒锻,參考了大量大神的博客和帖子,還有...
    zd200572閱讀 4,390評(píng)論 0 29
  • 有人說,小時(shí)候的愛情是操場上的白襯衫守屉。如花的年紀(jì)惑艇,天真、單純拇泛。少不經(jīng)事的臉上散發(fā)著年少的光滨巴,對于愛情,是他...
    批判哥哥閱讀 225評(píng)論 0 0
  • 親愛的小鹿家人們: 你們好俺叭!伴著春天的腳步恭取,我們迎來了新的學(xué)期,新學(xué)期熄守,我們都期待著孩子有新的形象蜈垮,發(fā)生新...
    Royar閱讀 533評(píng)論 0 1