NGS檢測中效扫,如何根據(jù)陽判值選擇測序深度

在我們產(chǎn)品開發(fā)中,經(jīng)常會(huì)遇到一個(gè)問題(來自產(chǎn)品的靈魂拷問)直砂,我到底要測多少數(shù)據(jù)量菌仁,才夠呢?這直接決定了產(chǎn)品的成本和競爭力静暂。大部門時(shí)候济丘,似乎“憑經(jīng)驗(yàn)”,成了一個(gè)通用的回答籍嘹。然而闪盔,具體測多少數(shù)據(jù)量夠用,絕不是一個(gè)經(jīng)驗(yàn)的問題辱士,而是一個(gè)數(shù)學(xué)問題泪掀。具體是一個(gè)什么樣的數(shù)學(xué)問題呢?暫時(shí)列下不表颂碘,講一個(gè)看似不相關(guān)的問題:投硬幣异赫。

一枚1圓的鋼镚,我們每投一次头岔,硬幣落地只可能出現(xiàn)兩種結(jié)果塔拳,正面朝上或者負(fù)面朝上,這兩種結(jié)果是不會(huì)同時(shí)出現(xiàn)的峡竣。這種現(xiàn)象被數(shù)學(xué)家稱之為伯努利實(shí)驗(yàn)靠抑。當(dāng)我們連續(xù)投100次硬幣,硬幣出現(xiàn)正面和反面的次數(shù)相加适掰,肯定等于100颂碧,這也是多重伯努利實(shí)驗(yàn)荠列。數(shù)學(xué)家通過統(tǒng)計(jì)發(fā)現(xiàn),多重伯努利實(shí)驗(yàn)下载城,正面朝上這種現(xiàn)象發(fā)生的次數(shù)及其概率肌似,服從二項(xiàng)分布:

公式的解釋為,在n次伯努利實(shí)驗(yàn)中诉瓦,正面朝上這一事件川队,發(fā)生x次的概率為P(x),一次實(shí)驗(yàn)中正面朝上的發(fā)生幾率為p睬澡。

回到題目開始的數(shù)學(xué)問題固额。我們開發(fā)一個(gè)產(chǎn)品,問數(shù)據(jù)量的原因在于猴贰,我們需要保證我們檢測的準(zhǔn)確性对雪。對(duì)于檢測SNP突變來說,其“準(zhǔn)確性”翻譯一下就是米绕,對(duì)于某一突變頻率的SNP瑟捣,我要盡可能保證陽性位點(diǎn)都能檢出(盡可能低假陰性),陰性位點(diǎn)盡可能被過濾掉(盡可能低假陽性)栅干,常見案例如下:一個(gè)SNP位點(diǎn)迈套,其突變頻率為1%,當(dāng)測序深度為800X碱鳞,陽性判斷值為4(即檢測到4條及以上的突變r(jià)eads)桑李,我們出現(xiàn)假陽性和假陽性的概率分別是多少?

首先窿给,我們討論假陰性的問題贵白。所謂假陰性,即當(dāng)我們檢測到的突變r(jià)eads數(shù)量小于4的概率崩泡;對(duì)于上述二項(xiàng)分布而言禁荒,p=0.01;x=0,1,2,3角撞;n=800

????????????????????????????????????????????????????????????????P(x<4)=P(0)+P(1)+P(2)+P(3)= 0.041

然后呛伴,我們討論假陽性的問題。而這也是我們?yōu)槭裁匆O(shè)置陽判值為4而不是1的原因谒所。測序本身會(huì)存在一定的錯(cuò)誤率热康,這里取0.1%;所謂假陽性劣领,即即便我們檢出4條以上的reads姐军,通過了陽判值,也存在這4條reads都是測序錯(cuò)誤造成的可能性。這種概率有多大呢奕锌?對(duì)于上述二項(xiàng)分布而言衫贬,這時(shí)候,p=0.001歇攻;n=4,5,6,... 800

? ???????????????????????????????????????????????????????????P(x>=4)=1- P(0)- P(1)- P(2)- P(3)= 0.009

所以梆造,這個(gè)案例的答案就一目了然了缴守。但很多時(shí)候,我們的訴求不是算假陽性和假陰性镇辉,而是給定突變頻率屡穗,假陽性,假陰性以及陽判值的要求忽肛,需要我們給出測序深度村砂,也就是上述的二項(xiàng)分布中的n;而這個(gè)計(jì)算屹逛,從上述公式我們也很容易得出础废,合適的最低測序深度要求;簡單來說罕模,就是設(shè)置不同測序深度梯度评腺,去計(jì)算不同測試深度下,假陽性和假陰性概率淑掌,找到最合適的深度即可蒿讥。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市抛腕,隨后出現(xiàn)的幾起案子芋绸,更是在濱河造成了極大的恐慌,老刑警劉巖担敌,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件摔敛,死亡現(xiàn)場離奇詭異,居然都是意外死亡柄错,警方通過查閱死者的電腦和手機(jī)舷夺,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來售貌,“玉大人给猾,你說我怎么就攤上這事∷炭纾” “怎么了敢伸?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長恒削。 經(jīng)常有香客問我池颈,道長尾序,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任躯砰,我火速辦了婚禮每币,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘琢歇。我一直安慰自己兰怠,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布李茫。 她就那樣靜靜地躺著揭保,像睡著了一般。 火紅的嫁衣襯著肌膚如雪魄宏。 梳的紋絲不亂的頭發(fā)上秸侣,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音宠互,去河邊找鬼味榛。 笑死,一個(gè)胖子當(dāng)著我的面吹牛名秀,可吹牛的內(nèi)容都是我干的励负。 我是一名探鬼主播,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼匕得,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼继榆!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起汁掠,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤略吨,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后考阱,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體翠忠,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年乞榨,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了秽之。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡吃既,死狀恐怖考榨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情鹦倚,我是刑警寧澤河质,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響掀鹅,放射性物質(zhì)發(fā)生泄漏散休。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一乐尊、第九天 我趴在偏房一處隱蔽的房頂上張望戚丸。 院中可真熱鬧,春花似錦扔嵌、人聲如沸昏滴。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至拂共,卻和暖如春牺弄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背宜狐。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國打工势告, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人抚恒。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓咱台,卻偏偏與公主長得像,于是被迫代替她去往敵國和親俭驮。 傳聞我的和親對(duì)象是個(gè)殘疾皇子回溺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容