分別是中國人群和東北亞人群的填充參考胶台,測試了下沥阳,中國人群的參考注冊還是相對友好的,沒有像有些網(wǎng)站一樣嚴格限制。東北亞的沒有測試遂赠,兩個數(shù)據(jù)庫的特點都是包含了少數(shù)民族久妆,研究朝鮮或蒙古族或其他民族的同學,研究的填充效果會更好跷睦,可以測試下筷弦!
CHN100K
哈工大王亞東教授團隊發(fā)表的迄今最大規(guī)模的中國人群遺傳變異圖譜數(shù)據(jù)資源。從我國的13個樣本庫中總共收集到26326份樣本抑诸。研究人員的選取標準為①在當?shù)鼐幼〕^3年烂琴;②沒有重大疾病蜕乡;③沒有精神障礙或喪失溝通能力奸绷。研究過程中有592份樣本的數(shù)據(jù)質(zhì)控不合格,所以最終結(jié)果只來自25734份樣本的數(shù)據(jù)层玲。這25734份的樣本群體涵蓋了中國七個地理區(qū)域的8個民族(漢族和回号醉、滿、藏辛块、蒙古畔派、朝鮮、白润绵、彝族)线椰。
http://bioinformatics.hit.edu.cn/chnpop/#/help
在線基因型填充工具(http://bioinformatics.hit.edu.cn/imputation/)
NARD
韓國團隊做的東北亞參考數(shù)據(jù)庫(NARD),包括來自韓國授药、蒙古士嚎、日本、中國和香港的1779個個體的全基因組測序數(shù)據(jù)悔叽。NARD提供了千人基因組項目第3階段(1KGP3)中不存在的朝鮮族(n=850)和蒙古族(n=384)祖先的遺傳多樣性莱衩。我們將NARD和1KGP3的基因型組合并重新分階段,構(gòu)建了一組聯(lián)合單倍型娇澎。該方法為東北亞人群建立了一個穩(wěn)健的插補參考面板笨蚁,與現(xiàn)有面板相比,該面板對罕見和低頻變異的插補精度最高趟庄。NARD插補面板在:https://nard.macrogen.com/