不知道為什么锚烦,文章寫點(diǎn)東西就會(huì)自動(dòng)白屏,瀏覽器顯示一直在刷新帝雇。手動(dòng)刷新后東西倒是沒丟涮俄,就是體驗(yàn)極其不好。清除cookie也沒用尸闸,難道還能是我的edge的問題彻亲?
這號(hào)算是爛尾了,只能把最近搗鼓的一點(diǎn)東西隨便發(fā)發(fā)吮廉。本來是想記錄下自己搞生信的技術(shù)上的成長(zhǎng)苞尝,但是人確實(shí)是越來越懶了,而且做生信就這點(diǎn)技術(shù)宦芦,講真其實(shí)微不足道宙址,和運(yùn)維差不多。還是得靠講故事调卑。只是自己學(xué)歷擺在這里抡砂,只能算打打雜了。
ichorCNA相關(guān)
方法0:
這個(gè)方法并未在官方wiki提及恬涧,但是conda上確實(shí)有注益,并且指向一個(gè)分支
conda install -c bioconda r-ichorcna
似乎是官方維護(hù)者開的分支,conda和docker都能裝溯捆?但是conda我安裝還是失敗了聊浅,docker沒試
R Ichorcna :: Anaconda.org
方法一(放棄):
install.packages("devtools")
library(devtools)
install_github("broadinstitute/ichorCNA")
報(bào)錯(cuò):
fatal error: hb-ft.h: No such file or directory
似乎是devtools依賴的一個(gè)包,用conda安裝的R裝包時(shí)现使,會(huì)找不到系統(tǒng)底層啥文件
error in install.packages('textshaping'):fatal error: hb-ft.h: No such file or directory · Issue #31 · r-lib/textshaping (github.com)
方法二:
Checkout the latest release of ichorCNA from GitHub
git clone git@github.com:broadinstitute/ichorCNA.git
install from CRAN
install.packages("plyr")
install packages from
source("https://bioconductor.org/biocLite.R")
BiocManager::install("HMMcopy")
BiocManager::install("GenomeInfoDb")
BiocManager::install("GenomicRanges")
Install the ichorCNA R package
from the command line and in the directory where ichorCNA github was cloned.
R CMD INSTALL ichorCNA
https://zhuanlan.zhihu.com/p/454666519
室間質(zhì)評(píng)——HGVS格式轉(zhuǎn)換與調(diào)整
室間質(zhì)評(píng)結(jié)果上傳時(shí)低匙,發(fā)現(xiàn)一個(gè)突變的填寫比較特別
(EGFR p.Leu747_Ala750delinsPro)。
由于比對(duì)軟件的del都是左對(duì)齊碳锈,即默認(rèn)的表示如下
------轉(zhuǎn)錄本方向--->
REF:GGAATTAAGAGAAG
ALT:G---------GAAC
而根據(jù)hgvs(NCCL上報(bào)原則)的表示原則顽冶,所有的del都應(yīng)該認(rèn)為發(fā)生在轉(zhuǎn)錄本的3’。即:
------轉(zhuǎn)錄本方向--->
REF:GGAATTAAGAGAAG
ALT:GGAA---------C
這使得兩個(gè)突變合并為一個(gè)售碳。對(duì)于這種情況强重,在github找了下,沒找到有工具能完全地自動(dòng)完成此轉(zhuǎn)換贸人。估計(jì)间景,只可能做一個(gè)字典,用遇見一個(gè)艺智,改一個(gè)的做法倘要。(或者自己寫個(gè)blast,從選擇的轉(zhuǎn)錄本的5'到3',重新比對(duì)十拣。也是挺麻煩的)
詳細(xì)問題在github的bcftools提了issue封拧,希望bcftool的大佬能早日實(shí)現(xiàn)
github
熱點(diǎn)突變探究
DoCM是一個(gè)高度策劃的已知致病突變數(shù)據(jù)庫志鹃,它提供了易于探索的變體列表,并直接鏈接到源引文以便于驗(yàn)證泽西。這個(gè)數(shù)據(jù)庫(http://www.docm.info/downloads)收集了網(wǎng)上各種開源數(shù)據(jù)庫的突變信息及其對(duì)應(yīng)的支持文獻(xiàn)(不包括cosmic/onckb這些商用付費(fèi)數(shù)據(jù)庫)曹铃。應(yīng)該可以作為熱點(diǎn)突變的位點(diǎn)的集合。但此數(shù)據(jù)庫并不包含用藥指導(dǎo)等相關(guān)信息(如FDA是否批準(zhǔn)捧杉,是否有指南提示陕见。)并且邏輯上,如果一個(gè)位點(diǎn)是用藥靶點(diǎn)味抖,但是并不致病淳玩,該數(shù)據(jù)庫可能也沒有。
DoCM數(shù)據(jù)來源有
- Kin-Driver
- WashU hematologic malignancy mutation list
- Literature
- Drug Gene Knowledge Database
- CIViC Knowledgebase
- Pan-cancer recurrent hotspots
- My Cancer Genome
- Oncomap Variants
使用mutect2的一些建議
Single-sample Mutect2 optimization recommendation – GATK --- 單樣本Mutect 2優(yōu)化建議- GATK (broadinstitute.org)
(slippage非竿,haplotype蜕着,clustered_events 即使是室間質(zhì)評(píng)樣本去除這三個(gè)標(biāo)簽的變異也會(huì)造成假陰性)