轉(zhuǎn)座子是一類在細(xì)菌染色體类垫、質(zhì)了竟猓或噬菌體之間自行移動的遺傳成分,是基因組中一段特異的具有轉(zhuǎn)位特性的獨立的DNA序列悉患。最簡單的轉(zhuǎn)座子除專座相關(guān)的轉(zhuǎn)座酶外不含有其他功能残家,稱為插入序列(IS),它們是細(xì)菌染色體或質(zhì)粒DNA的正常組成部分购撼。復(fù)合型的轉(zhuǎn)座因子稱為轉(zhuǎn)座子(transposon跪削,Tn)。這種轉(zhuǎn)座子除轉(zhuǎn)座相關(guān)的基因外還攜帶其他功能基因迂求,如抗藥性基因碾盐,它的兩端就是IS,構(gòu)成了“左臂”和“右臂”揩局。兩端的重復(fù)序列可以作為Tn的一部分隨同Tn轉(zhuǎn)座毫玖,也可以單獨作為IS轉(zhuǎn)座。Tn兩端的IS有的是完全相同的,有的則有差別付枫。當(dāng)兩端的IS完全相同時烹玉,每一個IS都可使轉(zhuǎn)座子轉(zhuǎn)座阐滩;當(dāng)兩端是不同的IS時,則轉(zhuǎn)座子的轉(zhuǎn)座取決于其中的一個IS继效。Tn有抗生素的抗性基因装获,而Tn很容易從細(xì)菌染色體轉(zhuǎn)座到噬菌體基因組或是接合型的質(zhì)粒上穴豫。因此,Tn可以很快地傳播到其他細(xì)菌細(xì)胞秤涩,這是自然界中細(xì)菌產(chǎn)生抗藥性的重要來源溉仑。
Q2:為什么要進(jìn)行CAZy分析状植?
A2:碳水化合物是廣泛分布在自然界中津畸,可作為碳儲備必怜,也可調(diào)節(jié)多種生理功能或者作為內(nèi)部識別和細(xì)胞間的截至作用于生物體和生物體之間梳庆。
Q3:CAZy數(shù)據(jù)庫將碳水化合物活性酶分為哪幾個家族?
A3:CAZy數(shù)據(jù)庫目前包括六大類家族驻售,分別是:
1. Glycoside Hydrolases (GHs) 糖苷水解酶
2. Glycosyl Transferases (GTs)糖基轉(zhuǎn)移酶
3. Polysaccharide Lyases (PLs) 多糖裂合酶
4. Carbohydrate Esterases (CEs) 碳水化合物酯酶
5. Auxiliary Activities (AAs) 輔助氧化還原酶
Carbohydrate-Binding Modules (CBMs)碳水化合物結(jié)合模塊欺栗。
Q4:CAZy數(shù)據(jù)庫有哪些功能?
A4:
a. 反應(yīng)碳水化合物酶的結(jié)構(gòu)特征消请,序列注釋臊泰。
b. 揭示酶與酶之間的進(jìn)化關(guān)系蚜枢,家族分類。
c. 提供序列功能信息察滑。
Q5:簡述基因注釋贺辰?
A5:基因注釋包括DNA結(jié)構(gòu)注釋和功能注釋嵌施,DNA結(jié)構(gòu)注釋,包括基因預(yù)測吃靠、重復(fù)序列和非編碼RNA預(yù)測等巢块,功能注釋即通過各個功能數(shù)據(jù)庫預(yù)測基因的功能巧号,例如GO注釋等。
Q6:細(xì)菌基因組注釋常用的數(shù)據(jù)庫有哪些越走?
A6:常用以下5個數(shù)據(jù)庫進(jìn)行注釋:Nr廊敌、Swiss-prot门怪、COG、GO秧廉、KEGG。
Q7:COG 的注釋和統(tǒng)計有什么意義嚼锄?
A7:COG是Clusters of Orthologous Groups of proteins的縮寫(http://www.ncbi.nlm.nih.gov/COG/)蔽豺。COG是在對已完成基因組測序的物種的蛋白質(zhì)序列進(jìn)行相互比較的基礎(chǔ)上構(gòu)建的,COG數(shù)據(jù)庫選取的物種包括各個主要的系統(tǒng)進(jìn)化譜系沧侥。每個COG家族至少由來自3個系統(tǒng)進(jìn)化譜系的物種的蛋白所組成魄鸦,所以一個COG對應(yīng)于一個古老的保守結(jié)構(gòu)域宴杀。構(gòu)成每個COG的蛋白被假定來自于同一個祖先蛋白旺罢。進(jìn)行COG數(shù)據(jù)庫比對可以對預(yù)測蛋白進(jìn)行功能注釋扁达、歸類以及蛋白進(jìn)化分析蠢熄。
通過與string數(shù)據(jù)庫進(jìn)行blastp比對,可以獲得基因所對應(yīng)的COG 注釋結(jié)果签孔,并根據(jù)COG 注釋結(jié)果對蛋白進(jìn)行功能歸類饥追。
Q8:GO 數(shù)據(jù)庫是什么?做GO注釋有什么意義?
A8:GO是基因本體論Gene Ontology的縮寫(詳情請見:http://www.geneontology.org/)壁熄。由于不同物種、不同數(shù)據(jù)庫中的關(guān)于基因和基因產(chǎn)物等生物學(xué)術(shù)語的描述存在差異草丧,當(dāng)查詢某個研究領(lǐng)域的相關(guān)信息時昌执,生物學(xué)家需要花費大量的時間和精力去分析生物學(xué)術(shù)語之間的聯(lián)系,而Gene Ontology項目的目的就是為了標(biāo)準(zhǔn)化這些生物學(xué)術(shù)語煤禽,方便生物學(xué)家之間的相互交流岖赋。GO注釋包括3個方面的內(nèi)容:
Cellular component:the parts of a cell or its extracellular environment;
Molecular function:the elemental activities of a gene product at the molecular level, such as binding or catalysis;
Biological process:operations or sets of molecular events with a defined beginning and end, pertinent to the functioning of integrated living units: cells, tissues, organs, and organisms.
因此GO注釋更加便于我們理解基因背后所代表的生物學(xué)意義。
Q9:KEGG 數(shù)據(jù)庫是什么选脊,注釋有什么意義恳啥?
A9:KEGG(Kyoto Encyclopedia of Genes and Genomes丹诀,?http://www.genome.jp/kegg/)是基因組研究方面的公共數(shù)據(jù)庫。KEGG將從NCBI等數(shù)據(jù)庫中獲得的包括完整和部分測序的基因組序列及其基因序列存儲于KEGG genes數(shù)據(jù)庫中扁藕;將各種生物學(xué)通路信息存儲在PATHWAY數(shù)據(jù)庫中亿柑,包括各種代謝通路棍弄、合成通路呼畸、膜轉(zhuǎn)運、信號傳遞蛮原、細(xì)胞周期以及疾病相關(guān)通路等儒陨。可以運用BLAST算法將所獲得的預(yù)測基因與KEGG的基因數(shù)據(jù)庫(GENES)進(jìn)行比對蹦漠,尋找代謝通路笛园,以此更加便于我們理解基因背后所代表的生物學(xué)意義侍芝。
Q10:KEGG數(shù)據(jù)庫序列來源是哪里州叠?通過什么進(jìn)行KO分配(基因注釋)?
A10:KEGG GENES是從公共可用資源(主要是NCBI RefSeq和GenBank)生成的所有完整基因組的基因目錄的集合留量。metagenomes是通過 GhostKOALA來對metagenomes數(shù)據(jù)進(jìn)行KO分配的楼熄,其他動植物微生物等是通過 KOALA工具進(jìn)行SSDB計算和KO分配(基因注釋)。
更多案例解答:
微生物基因組重測序得到的SNP可岂、indel缕粹、sv等分析結(jié)果如何進(jìn)行后續(xù)的實驗驗證平斩?mp.weixin.qq.com對于含有質(zhì)粒的細(xì)菌基因組項目咽块,如何進(jìn)行分析比較好?mp.weixin.qq.com有2株大腸桿菌(細(xì)菌)揭璃,如何通過測序的方法知道二者的差異瘦馍?mp.weixin.qq.comSNP分析得到的SNP位點與預(yù)期不符应役,是什么原因?mp.weixin.qq.com