ChIP-seq(一)

Homo sapiens啥供,neuron神經(jīng)元細(xì)胞的數(shù)據(jù)分析;

1. rawdata數(shù)據(jù)處理

了解ChIP-seq的實(shí)驗(yàn)流程 (qq.com)

下載數(shù)據(jù)

vim download_data.sh
#!/bin/bash
for i in 806 807 809 810 811 812 813 817 
do
  prefetch-orig.2.10.8 `srapath-orig.2.10.8 SRR13764${i}`
done
qsub -N download -cwd download.sh -q g5.q 

sra2fastq

single end 75 bp

vim sra2fastq.sh
#!/bin/bash
for i in 806 807 809 810 811 812 813 817 
do
  fastq-dump-orig.2.10.8 --split-3 -O fastq --gzip SRR13764${i}/SRR13764${i}.sra
done
qsub -N fastq -cwd sra2fastq.sh

fastqc

vim fastqc.sh
#!bin/bash
for i in 806 807 809 810 811 812 813 817
do
  fastqc SRR13764${i}.fastq.gz -o fastqc
done
qsub -N fastqc -cwd fastqc.sh -q g5.q

trim_galore

vim trim_galore.sh
#!bin/bash
for i in 806 807 809 810 811 812 813 817
do
  trim_galore --output_dir clean_data -q 25 --phred33 --length 36  SRR13764${i}.fastq.gz 
done
qsub -N trim_galore -cwd trim_galore.sh -q g5.q

2. Bowtie2 比對(duì)

介紹:生信軟件 | bowtie2(測(cè)序序列與參考序列比對(duì)) - 云+社區(qū) - 騰訊云 (tencent.com)
下載基因組hg19

wget -t 0 -c -b https://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz

-c :如果下載一半斷網(wǎng)中斷了库糠,wget -c +網(wǎng)址 可以續(xù)下載伙狐;
-t 0 :如果網(wǎng)速很慢, 總斷開(kāi)重新連接,“-t 0 ”會(huì)讓他一直重試瞬欧,直到把文件下載完成贷屎;
-b:后臺(tái)下載;
檢查下載數(shù)據(jù)的完整性

$md5sum hg19.fa.gz
806c02398f5ac5da8ffd6da2d1d5d1a9  hg19.fa.gz
$echo "806c02398f5ac5da8ffd6da2d1d5d1a9  hg19.fa.gz" > check_md5sum.txt
#將數(shù)據(jù)寫(xiě)入check_md5sum.txt文件
$md5sum -c check_md5sum.txt
#檢測(cè)數(shù)據(jù)是否一致
hg19.fa.gz: OK

構(gòu)建bowtie2索引文件

vim index.sh
#!/bin/bash
bowtie2-build hg19.fa hg19
qsub -N index -cwd index.sh

生成6個(gè)文件:
926M Apr 14 17:41 hg19.1.bt2
691M Apr 14 17:41 hg19.2.bt2
4.8K Apr 14 17:18 hg19.3.bt2
691M Apr 14 17:18 hg19.4.bt2
926M Apr 14 18:01 hg19.rev.1.bt2
691M Apr 14 18:01 hg19.rev.2.bt2

bowtie2比對(duì) 一步完成

vim bowtie2.sh
for i in 806 807 809 810 811 812 813 817
do
  bowtie2 -p 10 -x ~/chipseq/genome/index/bowtie_index/hg19 -U SRR13764${i}_trimmed.fq | samtools sort -O bam -@ 10 -o - > SRR13764${i}.bam
done
#循環(huán)生成bam文件

sort:對(duì)bam文件進(jìn)行排序(不能對(duì)sam文件進(jìn)行排序)
-O:--output format (SAM, BAM)
-@:samtools中設(shè)置排序和壓縮的線程數(shù)艘虎,默認(rèn)單線程
分兩步完成的步驟:(1)運(yùn)行bowtie2 獲取 SAM 文件

nohup bowtie2 -p 10 -x ~/chipseq/genome/index/bowtie_index/hg19 -U SRR13764809_trimmed.fq -S CTCF_ChIP-seq.hg19.sam&

-S:write hits in SAM format唉侄;-q:query input files are fastq
(2) samtools轉(zhuǎn)換排序?yàn)閎am格式

samtools view -bS CTCF_ChIP-seq.hg19.sam  > CTCF_ChIP-seq.hg19.bam
#sam轉(zhuǎn)bam
samtools sort -@ 10 CTCF_ChIP-seq.hg19.bam > CTCF_ChIP-seq.hg19.sorted.bam
#排序

sam格式詳解:SAM文件的每一行代表一個(gè)reads的比對(duì)情況,包含12列(tab分割)野建,從左往右属划,每一列的含義不同。
第一列:測(cè)序出來(lái)的reads序列數(shù)據(jù)名
第二列:flag之和
第三列:參考基因組的染色體名
第四列:比對(duì)到這個(gè)染色的具體位置(從1'端開(kāi)始)如9486878
第五列:比對(duì)質(zhì)量贬墩,是一個(gè)衡量比對(duì)好壞的打分結(jié)果榴嗅,越高越好
第六列:比對(duì)具體信息的表達(dá)式 CIGAR字符串,M:完全比配陶舞;D:缺失嗽测。如49M表示連續(xù)49個(gè)完全匹配
第七列:=表示參考序列與reads一模一樣,*表示沒(méi)有完全一模一樣的參考序列

第十列:reads堿基序列。
第十一列:ASCII 編碼的read堿基質(zhì)量
參考講解:BOWTIE2 進(jìn)行基因組比對(duì) - 簡(jiǎn)書(shū) (jianshu.com)
第二列flag的含義 :(1唠粥,2疏魏,4,8晤愧,16大莫,32…)每個(gè)整數(shù)代表不同的含義。參考講解:(5條消息) 2019/2/20_*.bam 與 *.sam文件中的flag的含義和統(tǒng)計(jì)結(jié)果_super_qun的博客-CSDN博客_bam flag

圖片2.jpg

第六列GIGAR的含義

圖片1.jpg

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末官份,一起剝皮案震驚了整個(gè)濱河市只厘,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌舅巷,老刑警劉巖羔味,帶你破解...
    沈念sama閱讀 218,682評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異钠右,居然都是意外死亡赋元,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)飒房,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)搁凸,“玉大人,你說(shuō)我怎么就攤上這事狠毯』ぬ牵” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,083評(píng)論 0 355
  • 文/不壞的土叔 我叫張陵垃你,是天一觀的道長(zhǎng)椅文。 經(jīng)常有香客問(wèn)我,道長(zhǎng)惜颇,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,763評(píng)論 1 295
  • 正文 為了忘掉前任少辣,我火速辦了婚禮凌摄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘漓帅。我一直安慰自己锨亏,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,785評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布忙干。 她就那樣靜靜地躺著器予,像睡著了一般。 火紅的嫁衣襯著肌膚如雪捐迫。 梳的紋絲不亂的頭發(fā)上乾翔,一...
    開(kāi)封第一講書(shū)人閱讀 51,624評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼反浓。 笑死萌丈,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的雷则。 我是一名探鬼主播辆雾,決...
    沈念sama閱讀 40,358評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼月劈!你這毒婦竟也來(lái)了度迂?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,261評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤猜揪,失蹤者是張志新(化名)和其女友劉穎英岭,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體湿右,經(jīng)...
    沈念sama閱讀 45,722評(píng)論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡诅妹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,900評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了毅人。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片吭狡。...
    茶點(diǎn)故事閱讀 40,030評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖丈莺,靈堂內(nèi)的尸體忽然破棺而出划煮,到底是詐尸還是另有隱情,我是刑警寧澤缔俄,帶...
    沈念sama閱讀 35,737評(píng)論 5 346
  • 正文 年R本政府宣布弛秋,位于F島的核電站,受9級(jí)特大地震影響俐载,放射性物質(zhì)發(fā)生泄漏蟹略。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,360評(píng)論 3 330
  • 文/蒙蒙 一遏佣、第九天 我趴在偏房一處隱蔽的房頂上張望挖炬。 院中可真熱鬧,春花似錦状婶、人聲如沸意敛。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,941評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)草姻。三九已至,卻和暖如春稍刀,著一層夾襖步出監(jiān)牢的瞬間撩独,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,057評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留跌榔,地道東北人异雁。 一個(gè)月前我還...
    沈念sama閱讀 48,237評(píng)論 3 371
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像僧须,于是被迫代替她去往敵國(guó)和親纲刀。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,976評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容