單體型基因組的組裝分類

目前熱門的單體型基因組組裝，以下內(nèi)容來源于安諾的單體型基因組組裝新品發(fā)布會(huì)
單體型也稱為單倍型康愤。二倍體有兩套染色體單體儡循，一套來自父本，一套來自母本征冷。在父本和母本之間會(huì)存在一些差異择膝。特別是一些雜合度比較高的基因組，survey的雜合度超過1.2%检激，甚至達(dá)到2%的肴捉，可能就需要進(jìn)行單體型組裝踊赠。

單體型組裝后可以大大降低重測(cè)序比對(duì)的SNP數(shù)量，同時(shí)增加indel數(shù)量每庆】鸫可以進(jìn)行基因印跡或母體遺傳分析。
在農(nóng)作物的遺傳育種方面缤灵，通過單體型基因組伦籍，可以挖掘優(yōu)異的關(guān)聯(lián)的等位基因變異，探索雜種優(yōu)勢(shì)理論腮出；
在群體遺傳學(xué)上通過分析等位基因間差異帖鸦，更精確的追蹤個(gè)體親緣關(guān)系，了解生物遷移模式和進(jìn)化歷史等生物學(xué)問題胚嘲。

ADPA(有親本二倍體單體型)

ADPA

雙親本分別進(jìn)行二代測(cè)序作儿，計(jì)算k-mer,Pacbio的Hifi的數(shù)據(jù)根據(jù)親本的序列來分型，同時(shí)Hic用來掛載染色體馋劈。

AUPPA(無親本單體型)

AUPPA

無親本的單體型的分型工作相比于有親本的會(huì)比較差攻锰，有些block內(nèi)會(huì)存在嵌合型。

ATPA（同源四倍體單體型）

ATPA

對(duì)于異源四倍體可以按照二倍體來處理妓雾。但是同源四倍體需要特殊處理娶吞。可以同時(shí)提供雙親本的二代序列或近緣二倍體的基因組序列械姻，然后用于變異檢測(cè)和分型妒蛇。

二倍體的單體型組裝流程

鑒定：識(shí)別基礎(chǔ)組裝的contig中組裝出的單體型區(qū)塊；
拆分：將contig按照可拆分單體型的基因組區(qū)域和不可拆分單體型的基因組區(qū)域進(jìn)行拆分打斷楷拳；
比對(duì)：將Hi-C reads比對(duì)到打斷后的contig上绣夺，構(gòu)建標(biāo)準(zhǔn)化的互作矩陣；
掛載：經(jīng)過Hi-C輔助組裝掛載獲得單條染色體長(zhǎng)度的單體型基因組組裝欢揖。

測(cè)序策略：

適當(dāng)覆蓋度的父母本高質(zhì)量二代數(shù)據(jù)（Illumina ≥30X）陶耍，用于鑒定親本特異性來源的K-mers，在子代中分開兩個(gè)單體型浸颓；
子代中足夠覆蓋每個(gè)單體型基因組的長(zhǎng)讀長(zhǎng)測(cè)序數(shù)據(jù)（Pacbio ≥80X物臂，每組染色體的覆蓋度≥40X），用于組裝單體型基因組产上。

下面2條的內(nèi)容轉(zhuǎn)載自鏈接：https://blog.csdn.net/u010608296/article/details/120630947

01 基于親本數(shù)據(jù)的主流單體型組裝思路

一類是在組裝過程中棵磷，基于親本的二代測(cè)序數(shù)據(jù)、HiC數(shù)據(jù)或者10X linked reads測(cè)序數(shù)據(jù)等晋涣，對(duì)組裝進(jìn)行分型輸出仪媒，如李恒他們開發(fā)的hifiasm軟件。當(dāng)沒有親本數(shù)據(jù)，會(huì)將區(qū)分不開的buble數(shù)據(jù)全部輸出到一個(gè)主要的組裝輸出結(jié)果中算吩，即primary assembly留凭，而另外一個(gè)結(jié)果為Alternate assembly，這樣primary assembly會(huì)存在一些無法區(qū)分的冗余或嵌合序列偎巢；而當(dāng)有其他輔助數(shù)據(jù)時(shí)蔼夜，會(huì)以此為參考對(duì)buble數(shù)據(jù)進(jìn)行分型輸出，其結(jié)果相對(duì)準(zhǔn)確压昼。
另外一種基于親本的單體型組裝思路為trio binning的策略求冷，直接利用親本的數(shù)據(jù)將子代的測(cè)序數(shù)據(jù)進(jìn)行拆分，拆分成父系遺傳的序列和母系遺傳的序列窍霞，然后分別進(jìn)行組裝匠题，組裝遺傳自母本和父本的基因組。

02 不基于親本數(shù)據(jù)的主流單體型組裝思路

當(dāng)沒有親本數(shù)據(jù)時(shí)但金，單體型組裝思路為韭山，首先按照常規(guī)組裝方法組裝出未分型的scaffolds數(shù)據(jù)，然后再使用PacBio的hifi數(shù)據(jù)或者ONT的長(zhǎng)reads數(shù)據(jù)回比到組裝的基因組上冷溃，call SNPs ,然后再利用分型軟件如Whatshap或者HapCut2等钱磅，對(duì)SNPs進(jìn)行分型，基于分型的數(shù)據(jù)將原始的長(zhǎng)reads測(cè)序數(shù)據(jù)分開兩堆秃诵，再分別進(jìn)行組裝续搀，從而得到兩套獨(dú)立的單體型基因組塞琼。

已發(fā)表的文獻(xiàn)的策略
2021 Nature Genetic 茶樹基因組
2022 Nature Genetic 同源四倍體馬鈴薯基因組

茶樹的方法（安諾）

基因組雜合度為2.31%菠净，雜合率比較高。
測(cè)序數(shù)據(jù)深度：114x Pacbio 和 58X illumina
先使用CANU組裝彪杉，然后使用Khaper 計(jì)算二倍體單倍型的K-mer毅往，主要是用來過濾冗余序列。ALLHic來輔助基因組組裝.
后續(xù)使用重測(cè)序派近，進(jìn)行了漸滲分析攀唯。

同源四倍體馬鈴薯基因組

測(cè)序數(shù)據(jù)量:
基因組survey

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市渴丸，隨后出現(xiàn)的幾起案子侯嘀，更是在濱河造成了極大的恐慌，老刑警劉巖谱轨，帶你破解...
沈念sama閱讀 218,941評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件戒幔，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡土童，警方通過查閱死者的電腦和手機(jī)诗茎，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,397評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來献汗，“玉大人敢订，你說我怎么就攤上這事王污。” “怎么了楚午？”我有些...
開封第一講書人閱讀 165,345評(píng)論 0贊 356
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵昭齐，是天一觀的道長(zhǎng)。經(jīng)常有香客問我矾柜，道長(zhǎng)司浪，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,851評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任把沼，我火速辦了婚禮啊易，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘饮睬。我一直安慰自己租谈，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,868評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布捆愁。她就那樣靜靜地躺著割去，像睡著了一般。火紅的嫁衣襯著肌膚如雪昼丑。梳的紋絲不亂的頭發(fā)上呻逆，一...
開封第一講書人閱讀 51,688評(píng)論 1贊 305
城市分裂傳說
那天，我揣著相機(jī)與錄音菩帝，去河邊找鬼咖城。笑死，一個(gè)胖子當(dāng)著我的面吹牛呼奢，可吹牛的內(nèi)容都是我干的宜雀。我是一名探鬼主播，決...
沈念sama閱讀 40,414評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼握础，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼辐董！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起禀综，我...
開封第一講書人閱讀 39,319評(píng)論 0贊 276
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤简烘，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后定枷，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體孤澎，經(jīng)...
沈念sama閱讀 45,775評(píng)論 1贊 315
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,945評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年依鸥，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了亥至。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 40,096評(píng)論 1贊 350
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖姐扮，靈堂內(nèi)的尸體忽然破棺而出絮供，到底是詐尸還是另有隱情，我是刑警寧澤茶敏，帶...
沈念sama閱讀 35,789評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布壤靶，位于F島的核電站，受9級(jí)特大地震影響惊搏，放射性物質(zhì)發(fā)生泄漏贮乳。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,437評(píng)論 3贊 331
男人毒藥：我在死后第九天來索命
文/蒙蒙一恬惯、第九天我趴在偏房一處隱蔽的房頂上張望向拆。院中可真熱鬧，春花似錦酪耳、人聲如沸浓恳。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,993評(píng)論 0贊 22
一樁弒父案碗暗，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽颈将。三九已至，卻和暖如春言疗，著一層夾襖步出監(jiān)牢的瞬間晴圾，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,107評(píng)論 1贊 271
情欲美人皮
我被黑心中介騙來泰國(guó)打工噪奄，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留死姚，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,308評(píng)論 3贊 372
代替公主和親
正文我出身青樓梗醇，卻偏偏與公主長(zhǎng)得像知允，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子叙谨，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,037評(píng)論 2贊 355