2020-02-19

Chip-seq 流程

sra-tools 下載安裝

#加壓包
tar zxf sra-tools.tar.gz

#將來(lái)需要調(diào)用的命令都在bin文件夾中,更改環(huán)境變量(全局),>>的意思是追加不是覆蓋欢顷,以下路徑需要自己主動(dòng)變更捉蚤,因?yàn)槭俏易约旱南到y(tǒng)布持,你只要找到你存放sratoolkit的路徑替換掉/home......ubuntu64/之間的內(nèi)容即可题暖。
export PATH=$PATH:/home/decen/software/sratoolkit.2.9.2-ubuntu64/bin >> ~/.bashrc
source ~/.bashrc
#調(diào)用一下命令試試看胧卤,prefetch SRR6819004,立即關(guān)閉終端,文件太大
#但是我嘗試幾次好像都是臨時(shí)生效惜纸,關(guān)閉終端還是要重新配置變量
export PATH=$PATH:/share/home/chenli-lyo/soft/sratoolkit.2.9.6-1-ubuntu64/bin >> ~/.bashrc
export PATH="/share/home/chenli-lyo/soft/sratoolkit.2.9.6-1-ubuntu64/bin:$PATH"
export PATH="share/home/chenli-lyo/soft/FastQC/fastqc$PATH"
#方法二:第二個(gè)方法更有效
vi ~/.bashrc  #用vi/vim編輯器修改bashrc文件
i  #開(kāi)始插入內(nèi)容堪簿,移動(dòng)光標(biāo)到最底部哪审,不管前面有任何內(nèi)容,都要重啟一行錄入以下虑瀑,并且你要找到你存放sratoolkit的路徑替換掉/home......ubuntu64/之間的內(nèi)容即可滴须。
export PATH=$PATH:/home/username/local/app/sratoolkit/bin
ESC, :wq  #退出vi編輯器并保存文件
source ~/.bashrc  #讓配置生效
#關(guān)閉linux扔水,重啟動(dòng)
--------------------- 


fastqc 下載安裝

#在下列網(wǎng)站上下載對(duì)應(yīng)的fastqc壓縮包:http://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc
#解壓縮:
unzip fastqc.zip
#解壓縮后生成了一個(gè)名為:fastqc的文件
cd FastQC #進(jìn)入fastqc文件魔市,可以看到里面有一個(gè)fastqc執(zhí)行文件,
chmod 755 fastqc(將fastqc設(shè)置為可執(zhí)行程序)
 ./fastqc #即可運(yùn)行fastqc程序待德。如想要在任何目錄下運(yùn)行fastqc程序枫夺,則需將fastqc程序的路徑添加至環(huán)境變量.bashrc中即可较坛。
echo 'export PATH=~/soft/FastQC:$PATH'  >>~/.bashrc
source ~/.bashrc
#檢測(cè)是否安裝成功
fastqc -h 
#開(kāi)始質(zhì)控
fastqc SRR4034951.fastq.gz 

lsf集群提交作業(yè)

#使用bsub提交命令丑勤,例如提交shell 腳本
bsub bash -i xxx.sh

fastqc質(zhì)控結(jié)果解讀

Per tile sequence quality

Position specific failures of flowcells

介紹

當(dāng)Per tile sequence quality顯示fail或者warning确封,表明測(cè)序的lane或某個(gè)run中出現(xiàn)出現(xiàn)了部分故障爪喘,從而影響一些特定的區(qū)域和循環(huán),進(jìn)而使測(cè)序數(shù)據(jù)的質(zhì)量下降稠诲。另外侦鹏,如果read的3’端的質(zhì)量是好的略水,就意味著存在瞬時(shí)質(zhì)量損失(Transient quality loss)的區(qū)域難以被剪切處理。

質(zhì)控過(guò)濾

#過(guò)濾
java -jar /share/home/chenli-lyo/soft/Trimmomatic-0.39/trimmomatic-0.39.jar SE -phred33 SRR3085650.fastq.gz TrimmedSRR3085650.fastq.gz ILLUMINACLIP:TruSeq3-SE:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:50

samtools的安裝

參考http://www.reibang.com/p/6b7a442d293f

#解壓samtools
tar -xjf *.tar.bz2
#進(jìn)入samtools文件夾
cd samtools-1.9
#編譯渊涝,安裝
make
make prefix=/share/home/chenli-lyo/soft/samtools-1.9 install
#加入環(huán)境變量
echo 'export PATH=/share/home/chenli-lyo/soft/samtools-1.9/bin:$PATH' >>~/.bashrc
source ~/.bashrc

比對(duì)

  • HISAT2/STAR/Tophat: suitable for transcriptome based or RNA-seq alignment (splice-aware aligner)

  • Bowtie/Bowtie2/bwa: suitable for genome based alignment (ChIP-seq/WGS)

    使用Bowtie2 進(jìn)行比對(duì)

    #在bowtie2的文件夾里跨释,輸入:
    gmake NO_TBB=1 
    
    echo 'PATH=/share/home/chenli-lyo/soft/bowtie2-2.3.5.1:$PATH' >>~/.bashrc
    source ~/.bashrc
    #bowtie2安裝完成
    #需要注意的是:
    #這條命令把bowtie2 生成的sam文件通過(guò)管道|傳遞到samtools胸私,將sam轉(zhuǎn)換為bam文件岁疼,省去中間sam文件的空間占用
    #genome_index 指的是用于bowtie2的索引文件(如下圖),而不是參考基因組本身缆娃,構(gòu)建過(guò)程參考后文疙驾。
    #genome_index 需要指定路徑及其共用文件名函荣,比如我的索引文件放在/data/ref/bowtie2/mm10目錄下傻挂,但是需要輸入的參數(shù)為/data/ref/bowtie2/mm10/mm10。最后一個(gè)mm10指的是共用文件名金拒。
    #參數(shù)說(shuō)明
    #-q: 輸入文件為fastq
    #--phred33: 測(cè)序堿基的質(zhì)量體系兽肤,現(xiàn)在基本都是33
    #-p: 線程數(shù)
    #--no-unal:不保留未必對(duì)上的記錄
    #-x:索引前綴
    #-S:sam格式輸出
    bowtie2 -p 16 -3 5 --local -x /share/home/chenli-lyo/soft/mm9/mm9 -U SRR4034952.fastq.gz | samtools sort -O bam -o /share/home/chenli-lyo/ChipEpop/SRR4034952.bam
    #參考https://blog.csdn.net/u011262253/article/details/79833969
    

Call Peaks

用MACS2 call peak

需要Python 2.7

#安裝Python 2.7
#參考 https://blog.csdn.net/qq_23113053/article/details/61203557

#安裝numpy
python2 pip install numpyXXX
#numpy下載要注意版本號(hào)x86
#安裝之前需前置numpy幢码,numpy要前置Django
#解壓Django python2.Django-1.11之前的
python2.7 -m pip install --user Django-1.11.22-py2.py3-none-any.whl
 #同樣安裝pillow
python2.7 -m pip install --user Pillow-6.1.0-cp27-cp27mu-manylinux1_x86_64.whl
#安裝numpy
python2 -m pip install --user numpy-1.16.4-cp27-cp27mu-manylinux1_x86_64.whl

#MACS2安裝
#參考http://www.mamicode.com/info-detail-1658533.html
cd 進(jìn)入macs2 文件夾
#沒(méi)有sudo權(quán)限,所以用prefix安裝辕坝,參考https://blog.csdn.net/yuan_lo/article/details/48289317
##參考此博客,解決所有問(wèn)題https://blog.csdn.net/Zephyr_Hu/article/details/81836347


cd soft/MACS2-2.1.2/
export PYTHONPATH=$PYTHONPATH:/share/home/chenli-lyo/soft/softbin
export PYTHONPATH=$PYTHONPATH:/share/home/chenli-lyo/soft/softbin/lib64/python2.7/site-packages/
python2.7 setup.py install --prefix=/share/home/chenli-lyo/soft/softbin
echo 'PATH=/shareshare/home/chenli-lyo/soft/softbin/masc2:$PATH' >>~/.bashrc
echo 'PATH=/shareshare/home/chenli-lyo/soft/softbin/bin/masc2:$PATH' >>~/.bashrc
source ~/.bashrc

#需離線安裝python-devel
#下載python-devel-2.7.5-76.el7.x86_64.rpm
#解壓python-devel-2.7.5-76.el7.x86_64.rpm
rpm2cpio python-devel-2.7.5-76.el7.x86_64.rpm | cpio -idvm
vim  ~/.bashrc
export PATH=$PATH:$share/home/chenli-lyo/soft/usr/bin/
:wq
source ~/.bashrc
echo 'PATH=/share/home/chenli-lyo/soft/bowtie2-2.3.5.1:$PATH' >>~/.bashrc
source ~/.bashrc

callpeak用法

# 常規(guī)的peak calling
macs2 callpeak -t ChIP.bam -c Control.bam -f BAM -g hs -n test -B -q 0.01
# 較寬的peak calling
macs2 callpeak -t ChIP.bam -c Control.bam --broad -g hs --broad-cutoff 0.1

--- 這次用的代碼

macs2 callpeak -t SRR4034951.bam -c SRR3085650.bam -f BAM -g hs -n test -B -q 0.01

macs2 callpeak -t /share/home/chenli-lyo/ChipEpop/SRR4034951.bam? -c SRR3085650.bam? BAM -g hs -n test -B -q 0.01
macs2 callpeak -t /share/home/chenli-lyo/ChipEpop/SRR4034951.bam? -c SRR3085650.bam? -g hs -n test -B -q 0.01 #BAM 系統(tǒng)無(wú)法識(shí)別,故刪除,不知其影響

注釋 Rstudio中用ChIPseeker

下載ChIPseeker顾画,配置工作環(huán)境

#下載ChIPseeker
source ("https://bioconductor.org/biocLite.R")
biocLite("ChIPseeker")
# 下載人的基因和lincRNA的TxDb對(duì)象
biocLite("GenomicFeatures")
biocLite("GenomeInfoDb")
biocLite("GenomicRanges")
biocLite("org.Mm.eg.db")
biocLite("TxDb.Mmusculus.UCSC.mm9.knownGene")
biocLite("clusterProfiler")
biocLite("ReactomePA")
biocLite("DOSE")
#loading packages
library("ChIPseeker")
library("GenomicFeatures")
library("GenomeInfoDb")
library("GenomicRanges")
library("org.Mm.eg.db")
library("TxDb.Mmusculus.UCSC.mm9.knownGene")
txdb <- TxDb.Mmusculus.UCSC.mm9.knownGene
library("clusterProfiler")


#讀取文件
usp7 <- readPeakFile("./usp7callpeak/test_summits.bed")
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末取劫,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子研侣,更是在濱河造成了極大的恐慌谱邪,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件义辕,死亡現(xiàn)場(chǎng)離奇詭異虾标,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)灌砖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門璧函,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人基显,你說(shuō)我怎么就攤上這事蘸吓。” “怎么了撩幽?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵库继,是天一觀的道長(zhǎng)箩艺。 經(jīng)常有香客問(wèn)我,道長(zhǎng)宪萄,這世上最難降的妖魔是什么艺谆? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮拜英,結(jié)果婚禮上静汤,老公的妹妹穿的比我還像新娘。我一直安慰自己居凶,他們只是感情好虫给,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著侠碧,像睡著了一般抹估。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上弄兜,一...
    開(kāi)封第一講書(shū)人閱讀 48,970評(píng)論 1 284
  • 那天药蜻,我揣著相機(jī)與錄音,去河邊找鬼替饿。 笑死谷暮,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的盛垦。 我是一名探鬼主播,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼瓤漏,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼腾夯!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起蔬充,我...
    開(kāi)封第一講書(shū)人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤蝶俱,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后饥漫,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體榨呆,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年庸队,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了积蜻。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡彻消,死狀恐怖竿拆,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情宾尚,我是刑警寧澤丙笋,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布谢澈,位于F島的核電站,受9級(jí)特大地震影響御板,放射性物質(zhì)發(fā)生泄漏锥忿。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一怠肋、第九天 我趴在偏房一處隱蔽的房頂上張望敬鬓。 院中可真熱鬧,春花似錦灶似、人聲如沸列林。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)希痴。三九已至,卻和暖如春春感,著一層夾襖步出監(jiān)牢的瞬間砌创,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工鲫懒, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嫩实,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓窥岩,卻偏偏與公主長(zhǎng)得像甲献,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子颂翼,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • Introduction What is Bowtie 2? Bowtie 2 is an ultrafast a...
    wzz閱讀 5,565評(píng)論 0 5
  • Microsoft Windows [版本 10.0.17763.1039] (c) 2018 Microsoft...
    Stansonlee閱讀 1,250評(píng)論 0 1
  • 2019-08-16仁澤法師∣易明講堂 第一點(diǎn):學(xué)佛不是求佛朦乏,是要學(xué)會(huì)懺悔 我們現(xiàn)在要轉(zhuǎn)變一個(gè)觀念:我們學(xué)佛不是求...
    河流兒閱讀 1,622評(píng)論 0 1
  • 聽(tīng)球及,枝頭的第一個(gè)音符 和陌上翠綠的足音…… 玉蘭花,以精美的杯盞 盛滿初逢的喜悅 細(xì)柳臨風(fēng) 歷經(jīng)寒冬的思念 在綠芽...
    思陽(yáng)F閱讀 882評(píng)論 5 22
  • 臨界畢業(yè)了呻疹,熱衷于學(xué)術(shù)的同學(xué)保了研吃引,家里有錢的出了國(guó),還想在學(xué)校茍兩年的在準(zhǔn)備考研刽锤,而我镊尺,在找工作的路上,疲于奔命...
    奶茶上癮的阿宅閱讀 269評(píng)論 0 1