A Single-Cell RNA Sequencing Profiles the Developmental Landscape of Arabidopsis Root
DOI(url): https://doi.org/10.1016/j.molp.2019.04.004
發(fā)表日期:April 17, 2019
關(guān)鍵點(diǎn)
國內(nèi)首篇植物相關(guān)單細(xì)胞文章曲楚,兩個(gè)一作還都很熟。
參考意義
植物單細(xì)胞的階段要開啟了,今天提到的這篇文章是國內(nèi)首篇,也是世界范圍內(nèi)的第四篇植物單細(xì)胞文章。除此之外蔫巩,還有幾篇已經(jīng)在bioRxiv上上線了,不過還沒有正式發(fā)表。這些文章都不約而同選擇了植物中研究最廣的模式之物擬南芥追他,而且全部研究的是根尖。后面在發(fā)展就要看看其它組織和物種的情況了岛蚤。
如果一個(gè)東西在植物里已經(jīng)出現(xiàn)要快速增長的趨勢邑狸,那么它在人和動(dòng)物里應(yīng)該也就已經(jīng)相對比較成熟了。此時(shí)涤妒,即便暫時(shí)還用不到单雾,但是相關(guān)的技術(shù)和方法就需要留意和學(xué)習(xí)起來。
在這篇文章中她紫,作者在單細(xì)胞水平揭示了擬南芥根尖細(xì)胞的異質(zhì)性重構(gòu)了根尖分生組織細(xì)胞的發(fā)育軌跡硅堆。按照文章的說法,成功拿到了 7695 個(gè)根單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)贿讹。聚類后根細(xì)胞被劃分為24個(gè)細(xì)胞類群渐逃,細(xì)胞類群注釋分析鑒定了一些潛在的新細(xì)胞類型,并找到了一批細(xì)胞類型標(biāo)記基因民褂。
用 t-SNE 和 UMAP 重構(gòu)了根發(fā)育的基本軌跡茄菊,實(shí)現(xiàn)了根分生組織細(xì)胞分裂和分化在單細(xì)胞水平上的準(zhǔn)確投影。進(jìn)一步利用偽時(shí)間(pseudo-time)分析赊堪,捕獲了根尖分生組織細(xì)胞的分化軌跡和過渡態(tài)細(xì)胞面殖,解析了根分生組織細(xì)胞如何通過協(xié)調(diào)細(xì)胞分裂和分化進(jìn)程逐步形成根尖不同細(xì)胞類型的分子機(jī)理。此外哭廉,通過分析細(xì)胞類群對離子吸收和激素響應(yīng)情況畜普,揭示了不同根細(xì)胞類群的響應(yīng)熱圖。該研究加深了我們對擬南芥根細(xì)胞組成和發(fā)育軌跡的認(rèn)識群叶,將根發(fā)育生物學(xué)從原先的組織器官水平提升到了單細(xì)胞水平吃挑。
(上面這一段話主要來自官方報(bào)道,具體的細(xì)節(jié)需要仔細(xì)讀完文章在分享)
相關(guān)內(nèi)容
目前已經(jīng)正式發(fā)表的其它三篇植物單細(xì)胞文章街立,看下來會發(fā)現(xiàn)分析思路和figure都異曲同工舶衬。
- Single-Cell RNA Sequencing Resolves Molecular Relationships Among Individual Plant Cells
[圖片上傳失敗...(image-834067-1555641827144)]
- Spatiotemporal Developmental Trajectories in the Arabidopsis Root Revealed Using High-Throughput Single-Cell RNA Sequencing
- Open Access Dynamics of gene expression in single root cells of A. thaliana
Benchmarking of alignment-free sequence comparison methods
DOI(url): https://doi.org/10.1101/611137
發(fā)表日期:April 16, 2019.
關(guān)鍵點(diǎn)
有哪些 alignment-free (AF) 相關(guān)的工具,以及如何評價(jià)赎离。
參考意義
AF 類的工具逛犹,在轉(zhuǎn)錄組分析層面使用最多的是定量分析。例如 salmon 和 kallisto,主要原理就是基于對kmer的各種操作虽画。其實(shí)除了轉(zhuǎn)錄組的快速定量
這篇文章比較詳細(xì)的介紹了目前主要 AF 相關(guān)工具的原理和工具舞蔽。同時(shí),作者使用了24個(gè)相關(guān)軟件的74種方法码撰,測試了五種應(yīng)用場景渗柿,分別是:
- protein sequence classification
- gene tree inference
- regulatory element detection
- genome-based phylogenetic inference
- reconstruction of species trees under horizontal gene transfer and recombination events
作者還提供了一個(gè)在線工具,用來展示這些結(jié)果脖岛。
相關(guān)內(nèi)容
Bazam: a rapid method for read extraction and realignment of high-throughput sequencing data
DOI(url): https://doi.org/10.1186/s13059-019-1688-1
發(fā)表日期:18 April 2019
關(guān)鍵點(diǎn)
bam 文件似乎可以方便的回滾了
參考意義
隨著參考基因組的更新和比對方法的更新朵栖,很多之前的bam文件似乎就變得過時(shí)了。除了找出原始的fastq文件再重新來過一次柴梆,現(xiàn)在有了另一個(gè)選擇陨溅。
bazam 首先可以從bam或者cram文件直接找到pair reads 在比對回其它參考基因組而不需要中間步驟; 也可以按需要提取過濾后的reads绍在,例如與特定基因位置有overlap的reads门扇。結(jié)果可以直接傳到下游工具,或以fastq格式存儲以供進(jìn)一步處理偿渡。另外還從read 這個(gè)input層面提供了多線程比對的思路悯嗓。加快了比對速度。
整體而言卸察,和目前已有的一些可以轉(zhuǎn)換bam文件的工具相比,其在內(nèi)存和存儲占用铅祸,已經(jīng)方便程度上都有優(yōu)勢坑质。
目前我的問題是很多時(shí)候會對原始bam文件進(jìn)行一波過濾,這個(gè)時(shí)候已經(jīng)丟掉了很多fastq的reads临梗。
相關(guān)內(nèi)容
其它幾個(gè)已有工具的比較
Tool | Storage used | Memory | Effective Cores | Time |
---|---|---|---|---|
Sort-Extract-Realign | 282 GB | 20 GB | 16 | 13?h, 15?min |
Picard SamToFastq | 148 GB | 78 GB | 16 | 16?h, 14?min |
Biobambam bamtofastq | 149 GB | 30 GB | 16 | 15?h 30?min |
Bazam (no sharding) | 68 GB | 28 GB | 16 | 14?h, 55?min |
Bazam 10-way sharding | 102 GB | 20 GB | 160 | 1?h, 11?min |
Evolutionary Origins of Pseudogenes and Their Association with Regulatory Sequences in Plants
DOI(url): https://doi.org/10.1105/tpc.18.00601
發(fā)表日期:March 2019
關(guān)鍵點(diǎn)
在我看來涡扼,假基因和lncRNA這類非編碼RNA其實(shí)大多數(shù)是定義方式不同,重合度不低盟庞。
參考意義
假基因(Ψs)一般是和功能基因的序列相近的非功能性基因吃沪,通過復(fù)制或逆轉(zhuǎn)錄方式形成,通常會含有各種突變導(dǎo)致基因功能的喪失什猖。在這篇文章中票彪,作者檢查了七種被子植物(擬南芥,短柄草不狮,大豆降铸,苜蓿,水稻摇零,楊樹和高粱)假基因的起源推掸,進(jìn)化和表達(dá)模式及其與非編碼序列的關(guān)系。作者鑒定了大約 250,000 個(gè)假基因,發(fā)現(xiàn)非常大比例的非轉(zhuǎn)座因子調(diào)控非編碼RNA(microRNA和lncRNA)起源于假基因近端上游區(qū)域的轉(zhuǎn)錄谅畅。 還發(fā)現(xiàn)與隨機(jī)基因間區(qū)相比轉(zhuǎn)錄因子結(jié)合位點(diǎn)優(yōu)先發(fā)生在假基因近端上游區(qū)域登渣,這表明假基因可能通過提供用作啟動(dòng)子和增強(qiáng)子的轉(zhuǎn)錄因子結(jié)合位點(diǎn)來調(diào)節(jié)基因組進(jìn)化。
假基因定義流程:
假基因鑒定情況
相關(guān)內(nèi)容
主要鑒定步驟
- (1) identify intergenic regions (masked genic and transposon regions) with sequence similarity to known proteins using exonerate;
- (2) quality control, identity ≥ 20%, match length ≥ 30 amino acids, match length ≥ 5% of the query sequence, and only the best match is retained;
- exonerate
--model protein2genome --showquerygff no --showtargetgff yes --maxintron 5000 --showvulgar yes --ryo \"%ti\\t%qi\\t%tS\\t%qS\\t%tl\\t%ql\\t%tab\\t%tae\\t%tal\\t%qab\\t%qae\\t%qal\\t%pi\\n\".
- exonerate
- (3) link homologous segments into contigs (set I Ψs);
- (4) realign using tfasty to identify features that disrupt contiguous protein sequences
- tfasty34, with parameters
-A -m 3 q
- tfasty34, with parameters
- (5) distinguish WGD-derived Ψs and set II Ψs.
- MCScanX
-k 50 -g -1 -s 5 -m 25
- MCScanX
以及