概念:
BAM is the compressed binary version of the Sequence Alignment/Map (SAM) format. 生物信息中的二進(jìn)制文件主要是為了節(jié)約空間七咧,計(jì)算機(jī)機(jī)可讀〉平冢可以用samtools工具實(shí)現(xiàn)sam和bam文件之間的轉(zhuǎn)化雇盖。
peaks注釋: 就是想看看該peaks在基因組的哪一個(gè)區(qū)段摄职,看看它們?cè)诟鞣N基因組區(qū)域(基因上下游绿贞,5,3端UTR油昂,啟動(dòng)子殴玛,內(nèi)含子菜循,外顯子翘地,基因間區(qū)域,microRNA區(qū)域)分布情況,但是一般的peaks都有近萬(wàn)個(gè)衙耕,所以需要批量注釋昧穿,
.bw文件:BigWig文件是壓縮的,索引的二進(jìn)制格式橙喘,用于全基因組信號(hào)數(shù)據(jù)的計(jì)算(例如GC百分比)或?qū)嶒?yàn)(例如ChIP-seq / RNA-seq讀取深度)时鸵。
sam/bam格式文件: 就是把測(cè)序reads比對(duì)到參考基因組后的文件。bam或者bed格式的文件主要是為了追蹤我們的reads到底比對(duì)到了參加基因組的什么區(qū)域厅瞎。
ChIP-Seq : 染色質(zhì)免疫共沉淀技術(shù)(chip)是研究體內(nèi)蛋白質(zhì)與DNA相互作用的有力工具饰潜。ChIP-Seq 結(jié)合了ChIP技術(shù)和高通量測(cè)序技術(shù),首先通過chip特異性地富集目的蛋白結(jié)合的DNA片段和簸,并對(duì)其進(jìn)行純化與文庫(kù)構(gòu)建彭雾,然后對(duì)富集得到的DNA片段進(jìn)行高通量測(cè)序。
高通量測(cè)序技術(shù)(High-throughput sequencing):又稱“下一代”測(cè)序技術(shù)("Next-generation" sequencing technology锁保,NGS)薯酝,以能一次并行對(duì)幾十萬(wàn)到幾百萬(wàn)條DNA分子進(jìn)行序列測(cè)定和一般讀長(zhǎng)較短等為標(biāo)志。
index(索引):在關(guān)系數(shù)據(jù)庫(kù)中爽柒,索引是一種單獨(dú)的吴菠、物理的對(duì)數(shù)據(jù)庫(kù)表中一列或多列的值進(jìn)行排序的一種存儲(chǔ)結(jié)構(gòu),它是某個(gè)表中一列或若干列值的集合和相應(yīng)的指向表中物理標(biāo)識(shí)這些值的數(shù)據(jù)頁(yè)的邏輯指針清單浩村。索引的作用相當(dāng)于圖書的目錄橄务,可以根據(jù)目錄中的頁(yè)碼快速找到所需的內(nèi)容。
echo : 字符串輸出穴亏。
xargs 與管道的區(qū)別 :
1)echo '--help' | cat 該命令輸出的是echo的內(nèi)容,也就是說將echo的內(nèi)容當(dāng)作cat處理的文件內(nèi)容了重挑,實(shí)際上就是echo命令的輸出通過管道定向到cat的輸入了嗓化。然后cat從其標(biāo)準(zhǔn)輸入中讀取待處理的文本內(nèi)容。這等價(jià)于在test.txt文件中有一行字符 '--help' 然后運(yùn)行 cat test.txt 的效果谬哀。
2)echo '--help' | xargs cat 等價(jià)于 cat --help 什么意思呢刺覆,就是xargs將其接受的字符串--help 做成cat的一個(gè)命令參數(shù)來運(yùn)行cat命令,同樣 echo 'test.c test.cpp' | xargs cat 等價(jià)于 cat test.c test.cpp 此時(shí)會(huì)將test.c和test.cpp的內(nèi)容都顯示出來史煎。參考文章(https://www.cnblogs.com/wangqiguo/p/6464234.html)bw文件方便查看測(cè)序深度谦屑。
IGV最佳可視化工具,deeptools也是不錯(cuò)的可視化工具
操作:
- 安裝atac:
2018-10-26_224415.png
- 下載samtools : 2018-10-26_232533.png
samtools常用命令:參考文章:https://www.cnblogs.com/emanlee/p/4316581.html - 根據(jù)此方法下載bowtie2:
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zip
unzip bowtie2-2.3.4.3-linux-x86_64.zip
-
運(yùn)用bowtie2 把fastqc轉(zhuǎn)換成.sam文件篇梭,再用samtools將.sam文件轉(zhuǎn)換成.bam文件:
image.png 建立.bw文件:
ls tmp.bam |while read id;do
nohup bamCoverage --normalizeUsing CPM -b id -o ${id%%.}.tmp.bw &
done
- cat nohup.out 發(fā)現(xiàn)錯(cuò)誤:
問題解決方案:1)運(yùn)用所學(xué)知識(shí)分析氢橙。 2)網(wǎng)上查找是否有解決方案 。3)對(duì)比正確的環(huán)境找出問題的根源恬偷,從而改變環(huán)境解決問題悍手。
-
找到問題根源numpy版本過低,重新下載版本較高的numpy :
image.png
image.png -
bamcoverage 正常可用坦康,問題解決:
image.png
友情閱讀推薦:
- 強(qiáng)烈推薦參加生信技能樹(爆款入門培訓(xùn)課)全國(guó)巡講 竣付,課程詳情見:https://mp.weixin.qq.com/s/Z9sdxgvFj0XJjYaW_5yHXg 各大城市均有開課,隨時(shí)隨地報(bào)名滞欠。
- 生信技能樹公益視頻合輯:學(xué)習(xí)順序是linux古胆,r,軟件安裝筛璧,geo逸绎,小技巧,ngs組學(xué)隧哮!
B站鏈接:https://m.bilibili.com/space/338686099 - 學(xué)徒培養(yǎng)詳見:https://mp.weixin.qq.com/s/3jw3_PgZXYd7FomxEMxFmw