single cell dna note

第一:mapping record

https://www.biostars.org/p/138116/


maping num 大于 reads num


18839435 – 146997 = 18692438 #clean_read

18726872 – 146997 = 18579875 #exclude segmentunmapped and secondary alignment

即samtools flagstat 統(tǒng)計中的得到的mapping read 包含secondary alignment and supplementary,因此可能大于read num

samtools flagstat mapped = pysam.mapped


第二:比對

samtools view -F 256(過濾掉secondary alignment)

samtools view? -F 2048 (過濾掉supplementary alignment)

1徐伐、-M與-Y比較

bwa mem -M -K 100000000 -t 10 -R @RG\tID:havem\tSM:havem\tPL:illumina\tPU:illumina\tLB:illumina ref fq1 fq2 > sam

bwa mem -Y -K 100000000 -t 10 -R @RG\tID:havem\tSM:havem\tPL:illumina\tPU:illumina\tLB:illumina ref fq1 fq2 > sam

bwa mem 與bwa mem -Y 結(jié)果一致 呈現(xiàn)于samtools flagstat 中的 146997 + 0 supplementary

bwa mem -M 與 bwa mem -M -Y 結(jié)果一致 呈現(xiàn)于samtools flagstat 中的 146997 + 0 secondary

2嗜傅、bwa mem -M

3、bwa mem -Y

bwa mem -p 忽略輸入中的reads2菩混,如果雙端reads PE比對,如果加上-p 則bam文件中相同reads只有一條記錄(reads1)


4、bwa mem -K?

https://gatkforums.broadinstitute.org/gatk/discussion/11554/bwa-parameters-in-gatk4-data-processing-workflow


默認(rèn)情況下德崭,bwa-mem會將一批reads操作加載到RAM中進(jìn)行處理常潮。加載的基數(shù)的數(shù)量與線程的數(shù)量成比例弟胀,因此使用不同數(shù)量的線程可能會產(chǎn)生稍微不同的映射結(jié)果。K參數(shù)要求工具將固定數(shù)量的堿基加載到RAM中喊式,從而實現(xiàn)可再現(xiàn)性孵户。

第三:bam文件格式解釋

1、術(shù)語和概念

鏈接:http://www.reibang.com/p/8d01019f33f2

在學(xué)習(xí)SAM格式之前岔留,請確認(rèn)自己是否對如下概念有清楚的認(rèn)識|

read: 測序儀返回的原始序列.一個read可以包括多個segment夏哭。read之間的先后順序表示被測序儀讀到的時間前后關(guān)系.

segment:? 一段連續(xù)的序列或子序列

linear alignment: 線性聯(lián)配表示一個read比對到單個參考序列,可以存在插入献联,缺失竖配,跳過(skip),剪切(clip), 但是不存在方向改變的情況(比如說一部分和正向鏈聯(lián)配,另一個位置則是和負(fù)向鏈聯(lián)配)里逆。最簡單的判斷的方式就是进胯,一個linear alignment只用一行記錄。

chimeric alignment: 嵌合聯(lián)配需要多行記錄原押。比如說r003第一個記錄是后6個匹配胁镐,第二個記錄則是反向序列的后5個匹配。第一個被稱之為"representative",其他都是"supplementary"

read alignment: 無論是linear alignment, 還是chimeric alignment, 只要能完整表示一個read,都成為是read alignment

multiple mapping: 由于存在重復(fù)區(qū)盯漂,一個read 可能比對到參考基因組的不同區(qū)域颇玷。其中一個被認(rèn)為是primary,其他都是secondary.

兩個系統(tǒng)|1-based coordinate system(SAM,VCF,GFF,wiggle)和0-based coordinate system(BAM, BCFv2, BED, PSL).自行用R和Python感受一下兩者的不同就缆。

chimeric alignment 可能是結(jié)構(gòu)變異帖渠,基因融合,參考序列誤組裝违崇,RNA-Seq阿弃,實驗protocol等因素造成。對于chimeric alignment的里面每一個linear alignment而言羞延,由于相互之前不存在重疊渣淳,故而聯(lián)配質(zhì)量較高,適合用于SNP/INDEL calling.相反, multiple mapping則是因為重復(fù)造成(read越長出現(xiàn)的概率越低), 相互之間存在重疊伴箩,僅有其中一條有最優(yōu)的匹配入愧,其他聯(lián)配質(zhì)量過低會被SNP/INDEL caller忽略。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嗤谚,一起剝皮案震驚了整個濱河市棺蛛,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌巩步,老刑警劉巖旁赊,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異椅野,居然都是意外死亡终畅,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門竟闪,熙熙樓的掌柜王于貴愁眉苦臉地迎上來离福,“玉大人,你說我怎么就攤上這事炼蛤⊙” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵理朋,是天一觀的道長絮识。 經(jīng)常有香客問我,道長嗽上,這世上最難降的妖魔是什么笋除? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮炸裆,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘鲜屏。我一直安慰自己烹看,他們只是感情好国拇,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著惯殊,像睡著了一般酱吝。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上土思,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天务热,我揣著相機(jī)與錄音,去河邊找鬼己儒。 笑死崎岂,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的闪湾。 我是一名探鬼主播冲甘,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼途样!你這毒婦竟也來了江醇?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤何暇,失蹤者是張志新(化名)和其女友劉穎陶夜,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體裆站,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡条辟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了遏插。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捂贿。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖胳嘲,靈堂內(nèi)的尸體忽然破棺而出厂僧,到底是詐尸還是另有隱情,我是刑警寧澤了牛,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布颜屠,位于F島的核電站,受9級特大地震影響鹰祸,放射性物質(zhì)發(fā)生泄漏甫窟。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一蛙婴、第九天 我趴在偏房一處隱蔽的房頂上張望粗井。 院中可真熱鬧,春花似錦、人聲如沸浇衬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽耘擂。三九已至胆剧,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間醉冤,已是汗流浹背秩霍。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留蚁阳,地道東北人铃绒。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像韵吨,于是被迫代替她去往敵國和親匿垄。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容