R/qtl 定位分析(一)Data input

不同于以往的 makers删顶,現(xiàn)在定位通常是基于重測(cè)序數(shù)據(jù)雹舀。但是由于測(cè)序數(shù)據(jù)基因組覆蓋率的問題著恩,并不是群體內(nèi)所有個(gè)體在每個(gè)標(biāo)記都有位點(diǎn)信息洒嗤;而且由于測(cè)序數(shù)據(jù)準(zhǔn)確性的問題,單個(gè)的 SNP 位點(diǎn)不再像過去的傳統(tǒng)標(biāo)記那么可靠魁亦。

所以渔隶,在定位之前,可能需要對(duì)數(shù)據(jù)進(jìn)行一些處理洁奈。常規(guī)的 mapping 和 call SNP 不多說(shuō)间唉,我之前介紹了一個(gè)方法,是關(guān)于構(gòu)建 bin 標(biāo)記的利术,有興趣的可以移步看一下:SNPbinner 構(gòu)建定位群體的基因組 bin 圖譜呈野。


說(shuō)在前面

參數(shù)資料:

1.A guide to QTL mapping with R/qtl

2.qtl-manual


首先是安裝包的安裝和調(diào)用:

install.packages("qtl")

library(qtl)

一、數(shù)據(jù)格式

軟件支持多種格式輸入印叁,http://www.rqtl.org/sampledata 提供了各種文件格式示例被冒。

讀取數(shù)據(jù)的函數(shù)為read.cross?。

args(read.cross)

function (format = c("csv", "csvr", "csvs", "csvsr", "mm", "qtx", "qtlcart", "gary", "karl", "mapqtl", "tidy"),

? ? dir = "", file, genfile, mapfile, phefile, chridfile, mnamesfile, pnamesfile,

????na.strings = c("-", "NA"),

? ? genotypes = c("A", "H", "B", "D", "C"), alleles = c("A", "B"),

????estimate.map = FALSE,

? ? convertXdata = TRUE, error.prob = 1e-04, map.function = c("haldane", "kosambi", "c-f", "morgan"),

????BC.gen = 0, F.gen = 0, crosstype = NULL, ...)

以上各參數(shù)顧名思義轮蜕;

file, genfile, mapfile, phefile, chridfile, mnamesfile, pnamesfile??

# 為不同輸入文件昨悼,file 指的是 csv 或 csvr 或 mm 格式的輸入文件,genfile 指基因型文件跃洛;mapfile 為遺傳圖譜率触;chridfile 為每個(gè)標(biāo)記的染色體信息;mnamesfile 為 markers 的名字信息汇竭;pnamesfile 為表型名字信息葱蝗。

genotypes? ? ? ? # 基因型信息,即文件中 marker 處的基因型是什么字母指定的细燎;

alleles? ? ? ? ? ? ? ? # 用于標(biāo)記兩個(gè)等位基因两曼;

estimate.map? ? # 在 TRUE 的情況下,如果輸入文件中不包含遺傳圖譜玻驻,則使用函數(shù) est.map 進(jìn)行計(jì)算合愈;

crosstype? ? ? ? # 可選,指定特定的雜交類型;

在指定基因型或者缺失字符時(shí)佛析,注意區(qū)分大小寫益老,相同字母的大小寫分別會(huì)代表不同的含義;若文件給出了 genetic map寸莫,則?estimate.map 參數(shù)選用 FALSE 即可捺萌;

常用的是逗號(hào)分割的 csv 格式文件,文件格式示例如下:

起始的列為表型數(shù)據(jù)膘茎,隨后的列是標(biāo)記的信息桃纯;

第一行包含表型和標(biāo)記的名字;

第二行在每個(gè)表型下面必須是空字段披坏,基因型的列下面必須是染色體名稱(最好是純數(shù)字态坦,帶字母也不是不行,后續(xù)可能會(huì)造成麻煩)棒拂,X 染色體就用 X 或 x 表示伞梯;

第三行是可選的,沒有也行帚屉,是每個(gè)標(biāo)記遺傳圖譜上的位置信息(cM position)谜诫;

再往下的行就是每個(gè)個(gè)體的表型,以及遺傳標(biāo)記的信息攻旦,缺失用 NA 或 - 表示喻旷。

其中,染色體標(biāo)識(shí)和遺傳圖譜位置處不允許有缺失值牢屋。

表型列如果存在“id”且预、“ID”、“Id”的名字烙无,則會(huì)被認(rèn)為這一列為個(gè)體標(biāo)識(shí)符辣之。

在實(shí)際使用時(shí),最少需要指定的參數(shù)只有兩個(gè)皱炉,其余都可以使用默認(rèn)參數(shù):

> mydata <- read.cross(format="csv", file="mydata.csv")

值得提一下的是怀估,如果是按上述文件格式生成的 csv file,那?genfile, mapfile, phefile, chridfile, mnamesfile, pnamesfile 這一系列是不需要的合搅;

二多搀、示例

以軟件自帶文件為例,sug.csv 文件部分內(nèi)容見下圖

sug <- read.cross("csv", "https://rqtl.org", "sug.csv", genotypes=c("CC", "CB", "BB"), alleles=c("C", "B"))

以上直接從官網(wǎng)上讀取文件灾部,而后可以簡(jiǎn)單檢查一下讀入的數(shù)據(jù):

summary(sug)

plot(sug)

結(jié)果這里就不展示了康铭,會(huì)對(duì)表中數(shù)據(jù)指標(biāo)進(jìn)行總結(jié)和簡(jiǎn)單的繪圖。


數(shù)據(jù)導(dǎo)入之后赌髓,最好對(duì)數(shù)據(jù)的基本概況進(jìn)行一個(gè)檢查从藤,后面有一章會(huì)單獨(dú)介紹數(shù)據(jù)質(zhì)量檢查催跪,有興趣的話可以移步:

R/qtl 定位分析(二)Data Check

R/qtl 定位分析(二)Data Check

R/qtl 定位分析(三)Single-QTL analysis

R/qtl 定位分析(四)Non-normal phenotypes

對(duì) QTL 定位有興趣的話可以看看我建的一個(gè)文集:QTL 定位。要是覺得有用可以登錄一下賬號(hào)夷野,點(diǎn)個(gè)贊懊蒸,以表支持!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末悯搔,一起剝皮案震驚了整個(gè)濱河市骑丸,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌妒貌,老刑警劉巖通危,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異灌曙,居然都是意外死亡菊碟,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門在刺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)逆害,“玉大人,你說(shuō)我怎么就攤上這事增炭。” “怎么了拧晕?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵隙姿,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我厂捞,道長(zhǎng)输玷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任靡馁,我火速辦了婚禮欲鹏,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘臭墨。我一直安慰自己赔嚎,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布胧弛。 她就那樣靜靜地躺著尤误,像睡著了一般。 火紅的嫁衣襯著肌膚如雪结缚。 梳的紋絲不亂的頭發(fā)上损晤,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音红竭,去河邊找鬼尤勋。 笑死喘落,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的最冰。 我是一名探鬼主播瘦棋,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼锌奴!你這毒婦竟也來(lái)了兽狭?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤鹿蜀,失蹤者是張志新(化名)和其女友劉穎箕慧,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體茴恰,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡颠焦,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了往枣。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片伐庭。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖分冈,靈堂內(nèi)的尸體忽然破棺而出圾另,到底是詐尸還是另有隱情,我是刑警寧澤雕沉,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布集乔,位于F島的核電站,受9級(jí)特大地震影響坡椒,放射性物質(zhì)發(fā)生泄漏扰路。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一倔叼、第九天 我趴在偏房一處隱蔽的房頂上張望汗唱。 院中可真熱鬧,春花似錦丈攒、人聲如沸哩罪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)识椰。三九已至,卻和暖如春深碱,著一層夾襖步出監(jiān)牢的瞬間腹鹉,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來(lái)泰國(guó)打工敷硅, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留功咒,地道東北人愉阎。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像力奋,于是被迫代替她去往敵國(guó)和親榜旦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容