生信入門之初級(jí)作業(yè)及答案

1. 在任意文件夾下面創(chuàng)建形如 1/2/3/4/5/6/7/8/9 格式的文件夾系列锣尉。

mkdir -p 1/2/3/4/5/6/7/8/9

2. 在創(chuàng)建好的文件夾下面盛霎,比如我的是 /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9 岭粤,里面創(chuàng)建文本文件 me.txt

touch /Users/jimmy/tmp/1/2/3/4/5/6/7/8/9/me.txt

3. 在文本文件 me.txt 里面輸入內(nèi)容:

Go to: http://www.biotrainee.com/
I love bioinfomatics.
And you ?

方法一:

vi me.txt
Go to: http://www.biotrainee.com/
I love bioinfomatics.
And you ?
:wq

方法二:

cat> me.txt
Go to: http://www.biotrainee.com/
I love bioinfomatics.
And you ?
##按ctrl + d保存退出

4.刪除上面創(chuàng)建的文件夾 1/2/3/4/5/6/7/8/9 及文本文件 me.txt

rm -r 1/2/3/4/5/6/7/8/9/me.txt

5.在任意文件夾下面創(chuàng)建 folder1~5這5個(gè)文件夾,然后每個(gè)文件夾下面繼續(xù)創(chuàng)建 folder1~5這5個(gè)文件夾

mkdir -p  folder{1..5}/folder{1..5}

6.在第五題創(chuàng)建的每一個(gè)文件夾下面都創(chuàng)建第二題文本文件 me.txt 组题,內(nèi)容也要一樣云矫。

cat >me.txt 
Go to: http://www.biotrainee.com/
I love bioinfomatics.
And you ?
#按ctrl + d保存退出

for a in {1..5};do
     cd ~/folder$a
            for b in {1..5};do
                    cd ~/folder$a/folder$b
  cp ./me.txt  ~/folder$a/folder$b
     done
done

7.再次刪除掉前面幾個(gè)步驟建立的文件夾及文件

rm -r folder{1..5}

8. 下載 http://www.biotrainee.com/jmzeng/igv/test.bed 文件,后在里面選擇含有 H3K4me3 的那一行是第幾行矫渔,該文件總共有幾行彤蔽。

wget  -c http://www.biotrainee.com/jmzeng/igv/test.bed
grep -n  'H3K4me3'  test.bed
wc -l test.bed

9.下載 http://www.biotrainee.com/jmzeng/rmDuplicate.zip 文件,并且解壓庙洼,查看里面的文件夾結(jié)構(gòu)

wget -c http://www.biotrainee.com/jmzeng/rmDuplicate.zip
unzip rmDuplicate.zip
tree rmDuplicate

10.打開第九題解壓的文件顿痪,進(jìn)入 rmDuplicate/samtools/single 文件夾里面涩堤,查看后綴為 .sam 的文件毯炮,搞清楚生物信息學(xué)里面的SAM/BAM 定義是什么。

cd rmDuplicate/samtools/single
ls *.sam

SAM(Sequence Alignment/Map)格式是一種通用的比對(duì)格式阱当,用來存儲(chǔ)reads到參考序列的比對(duì)信息石咬。
BAM是SAM的二進(jìn)制格式揩悄,因此兩者格式相同,只是BAM文件占用儲(chǔ)存空間更小鬼悠,運(yùn)算更快删性。

11.安裝 samtools 軟件

利用conda安裝

source ~/miniconda3/bin/activate
conda search samtools
conda install samtools

12.打開后綴為BAM 的文件亏娜,找到產(chǎn)生該文件的命令。

#查看一個(gè)文件名叫做SRR1039510.sort.bam文件的產(chǎn)生命令
samtools view -h SRR1039510.sort.bam |grep '^@PG'|awk 'BEGIN{FS="\t"}{print $5}'|cut -d: -f2

13.根據(jù)上面的命令蹬挺,找到我使用的參考基因組 /home/jianmingzeng/reference/index/bowtie/hg38 具體有多少條染色體维贺。

#查看   注:此處用的文件為SRR1039510.sort.bam文件
samtools view -h SRR1039510.sort.bam |egrep '^@S.*?(chr[XYM]\s+.*|chr[1-9]?[0-9]\s+).*'|less
#計(jì)數(shù)
samtools view -h SRR1039510.sort.bam |egrep '^@S.*?(chr[XYM]\s+.*|chr[1-9]?[0-9]\s+).*'|wc -l

14.上面的后綴為BAM 的文件的第二列,只有 0 和 16 兩個(gè)數(shù)字巴帮,用 cut/sort/uniq等命令統(tǒng)計(jì)它們的個(gè)數(shù)幸缕。

samtools view SRR1039510.sort.bam |cut -f2|sort |uniq -c

15. 重新打開 rmDuplicate/samtools/paired 文件夾下面的后綴為BAM 的文件,再次查看第二列晰韵,并且統(tǒng)計(jì)

samtools view SRR1039510.sort.bam|cut -f2 |sort |uniq -c|sort -t' ' -nrk1,1

16.下載 http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip 文件发乔,并且解壓,查看里面的文件夾結(jié)構(gòu)雪猪, 這個(gè)文件有2.3M栏尚,注意留心下載時(shí)間及下載速度。

wget http://www.biotrainee.com/jmzeng/sickle/sickle-results.zip
unzip sickle-results
tree

17.解壓 sickle-results/single_tmp_fastqc.zip 文件只恨,并且進(jìn)入解壓后的文件夾译仗,找到 fastqc_data.txt 文件,并且搜索該文本文件以 >>開頭的有多少行官觅?

cd sickle-results
unzip single_tmp_fastqc.zip
cd single_tmp_fastqc
search  '^>>'  fastqc_data.txt |wc -l

18.下載 http://www.biotrainee.com/jmzeng/tmp/hg38.tss 文件纵菌,去NCBI找到TP53/BRCA1等自己感興趣的基因?qū)?yīng)的 refseq數(shù)據(jù)庫 ID,然后找到它們的hg38.tss 文件的哪一行休涤。

wget http://www.biotrainee.com/jmzeng/tmp/hg38.tss
grep 'NM_000546' hg38.tss 
grep 'NM_001126113' hg38.tss 

19.解析hg38.tss文件咱圆,統(tǒng)計(jì)每條染色體的基因個(gè)數(shù)。

cat hg38.tss |cut -f2|sort|uniq -c

20.解析hg38.tss 文件功氨,統(tǒng)計(jì)NM和NR開頭的序列序苏,了解NM和NR開頭的含義。

grep '^NM' hg38.tss |wc -l
grep '^NR' hg38.tss |wc -l

grep -oE '^(NM|NR)' hg38.tss |sort|uniq -c

NM:轉(zhuǎn)錄組產(chǎn)物的序列mRNA
NR:非編碼的轉(zhuǎn)錄組序列ncRNA

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末捷凄,一起剝皮案震驚了整個(gè)濱河市忱详,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌跺涤,老刑警劉巖匈睁,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異桶错,居然都是意外死亡航唆,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門牛曹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來佛点,“玉大人醇滥,你說我怎么就攤上這事黎比〕” “怎么了?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵阅虫,是天一觀的道長(zhǎng)演闭。 經(jīng)常有香客問我,道長(zhǎng)颓帝,這世上最難降的妖魔是什么米碰? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮购城,結(jié)果婚禮上吕座,老公的妹妹穿的比我還像新娘。我一直安慰自己瘪板,他們只是感情好吴趴,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著侮攀,像睡著了一般锣枝。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上兰英,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天撇叁,我揣著相機(jī)與錄音,去河邊找鬼畦贸。 笑死陨闹,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的薄坏。 我是一名探鬼主播正林,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼颤殴!你這毒婦竟也來了觅廓?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤涵但,失蹤者是張志新(化名)和其女友劉穎杈绸,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體矮瘟,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡瞳脓,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了澈侠。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片劫侧。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出烧栋,到底是詐尸還是另有隱情写妥,我是刑警寧澤,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布审姓,位于F島的核電站珍特,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏魔吐。R本人自食惡果不足惜扎筒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望酬姆。 院中可真熱鬧嗜桌,春花似錦、人聲如沸辞色。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽淫僻。三九已至诱篷,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間雳灵,已是汗流浹背棕所。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留悯辙,地道東北人琳省。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像躲撰,于是被迫代替她去往敵國(guó)和親针贬。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 一拢蛋、在任意文件夾下面創(chuàng)建形如 1/2/3/4/5/6/7/8/9 格式的文件夾系列桦他。 2、在創(chuàng)建好的文件夾下面谆棱,比...
    labrador1986閱讀 770評(píng)論 0 0
  • 一快压、在任意文件夾下面創(chuàng)建形如 1/2/3/4/5/6/7/8/9 格式的文件夾系列。 mkdir –p 1/2/3...
    Hocchan_7閱讀 4,223評(píng)論 1 50
  • 生信人的linux考試20題 一垃瞧、 在任意文件夾下面創(chuàng)建形如 1/2/3/4/5/6/7/8/9 格式的文件夾系列...
    泥人吳閱讀 2,008評(píng)論 0 27
  • 1.在任意文件夾下創(chuàng)建型如1/2/3/4/5/6/7/8/9格式的文件夾系列答案:mkdir -p 1/2/3/4...
    冰淇琳的琳閱讀 773評(píng)論 0 1
  • 1蔫劣、創(chuàng)建文件夾: 2、3个从、創(chuàng)建.txt文件并往文件內(nèi)寫東西 :兩種方法:第一種方法: 第二種辦法: 4脉幢、刪除所有創(chuàng)...
    看遠(yuǎn)方的星閱讀 1,748評(píng)論 2 21