前面介紹了 QTL 分析的一般流程:包括數據輸入撰筷,數據質量檢查,單 QTL 分析抬闯。對這個過程已經比較了解了。
R/qtl 定位分析(三)Single-QTL analysis
接下來幾部分將會更全面地介紹 QTL 定位中可能出現(xiàn)的問題掘剪。
但在?R/qtl 定位分析(三)Single-QTL analysis?中的分析奈虾,一個前提假設就是表型都是正態(tài)分布的。在不存在很大效應的 QTL 時匾鸥,表型分布通常會接近正態(tài)分布:單峰且合理對稱碉纳。但很多時候,表型也可能表現(xiàn)出二分奴愉、偏態(tài)铁孵、存在峰值的分布。
一般來說檀头,應用 standard interval mapping 都可以得到一個合理結果岖沛,尤其是表型近似正態(tài),或者通過取對數之類的方法轉換為近似正態(tài)廊镜。
即使是二分的表型唉俗,只要不存在 low genotype information 造成的假 LOD 值的情況下,通過?permutation test 建立起統(tǒng)計顯著性即可播赁。
但是吼渡,同樣可以采取一些方法來提高檢測效力。比如:Nonparametric interval mapping 考慮表型的 ranks坎背;為?binary traits 也有單獨的方法;等等陨献。
本文介紹 3 種在區(qū)間作圖中常用到的方法懂更。以 listeria 數據集中的 phe 為例:
data(listeria)
plotPheno(listeria, pheno.col=1)
1.?Nonparametric interval mapping
這是一種 rank-based methods?for interval mapping 的擴展沮协。
listeria <- calc.genoprob(listeria, step=1, error.prob=0.001)
out.np <- operm.np <- scanone(listeria, model="np", n.perm=1000, perm.Xsp=TRUE)
summary(out.np, perms=operm.np, alpha=0.05, pvalues=TRUE)
2.?Binary traits
顧名思義慷暂,這是一種針對類似質量性狀的分析方法。將上述表型的死活分為兩類(上圖是統(tǒng)計了一定時間內菌類死亡的情況奸腺,最后一根柱子是到那個時候還沒死的)血久。
binphe <- as.numeric(pull.pheno(listeria, 1) > 250)
listeria$pheno <- cbind(listeria$pheno, binary=binphe)
plotPheno(listeria, pheno.col=3)
operm.bin <- scanone(listeria, pheno.col="binary", model="binary", n.perm=1000, perm.Xsp=TRUE)
plot(out.np, out.bin, col=c("blue", "red"), ylab="LOD score", alternate.chrid=TRUE)
summary(out.bin, perms=operm.bin, alpha=0.05, pvalues=TRUE)
3.?Two-part model
如果表型是存在一個 spike 的洋魂,比如最高值或者最低值副砍。默認為最低值庄岖,可以用 upper=TRUE 指定最高值。
y <- log(pull.pheno(listeria, 1))
listeria$pheno <- cbind(listeria$pheno, logsurv=y)
operm.2p <- scanone(listeria, model="2part", upper=TRUE, pheno.col="logsurv", n.perm=1000, perm.Xsp=TRUE)
summary(out.2p, perms=operm.2p, alpha=0.05, pvalues=TRUE)
這一部分相對簡單心剥,就是針對非正態(tài)分布表型背桐,檢測 QTL 的時候,適當使用一些其它參數畦娄。