基因的一大家子-Gene Family

劉小澤寫于18.9.25

今天接觸到一個(gè)新名詞——基因家族分析,不搜不知道,一搜嚇一跳。2018年關(guān)于基因家族分析的文章已經(jīng)超過了180篇俏险,并且門檻不高,甚至用公共數(shù)據(jù)庫就能做扬绪。

什么是基因家族竖独?

想想我們?nèi)说募易澹隙ㄊ且淮蠹易蛹放#粋€(gè)共同的祖先的后代莹痢。盡管子子孫孫長相各異,但是血緣關(guān)系維持著我們的親疏遠(yuǎn)近

基因家族墓赴,當(dāng)然也是來源一個(gè)祖先竞膳,經(jīng)過基因重復(fù)和突變而產(chǎn)生的一組具有序列結(jié)構(gòu)與功能相似性的基因,它們編碼相似的蛋白質(zhì)產(chǎn)物诫硕。當(dāng)然同一個(gè)家族的可以緊密排列在一起坦辟,構(gòu)成一個(gè)大“宗親”(基因簇)。但更多時(shí)候章办,“人各有志”(子孫基因也各有作用)锉走,同一個(gè)家族的基因們分散在同一個(gè)染色體的不同位置,或者在不同染色體(相當(dāng)于我們和周圍的親人都身處各行各業(yè))藕届,每個(gè)基因有著自己不同的表達(dá)調(diào)控模式挪蹭。

重復(fù)主要分為:基因片段復(fù)制、串聯(lián)重復(fù)休偶、逆轉(zhuǎn)錄轉(zhuǎn)座【一般拷貝數(shù)會(huì)增加】

突變主要有:核苷酸插入梁厉、缺失、轉(zhuǎn)換椅贱、顛換懂算;基因重組;基因轉(zhuǎn)換庇麦。這些因素再加上后來群體的遺傳漂變、自然選擇過程將這種趨勢進(jìn)行擴(kuò)散喜德,并逐步確定下來突變【一般拷貝數(shù)不增加山橄,基因重復(fù)性比較小】

簡而言之,基因家族就是一組功能相似舍悯、序列具有同源性的基因

因此航棱,如果不從“共同祖先”的角度出發(fā)睡雇,考慮“結(jié)構(gòu)域”的話:對于一個(gè)基因家族,它的特點(diǎn)就是編碼蛋白都有同一個(gè)結(jié)構(gòu)域饮醇,因?yàn)橐话銇碇v它抱,結(jié)構(gòu)域決定某種功能,保守的結(jié)構(gòu)域序列朴艰,容易形成穩(wěn)定的三維結(jié)構(gòu)【結(jié)構(gòu)域:Protein domain观蓄,是構(gòu)成蛋白質(zhì)(三級)結(jié)構(gòu)的基本單元,Pfam和InterPro都是結(jié)構(gòu)域網(wǎng)站】

為什么做基因家族祠墅?

  • 一個(gè)基因家族侮穿,一般存在于多個(gè)物種(不同物種中的叫亞家族基因),并且很多基因家族都是轉(zhuǎn)錄因子毁嗦,可以對家族內(nèi)基因啟動(dòng)子區(qū)域進(jìn)行分析亲茅;還能找?guī)讉€(gè)物種,分析同源基因的基因結(jié)構(gòu)狗准、motif分析克锣,找到保守的motif;還可以結(jié)合濕實(shí)驗(yàn)QRT-PCR腔长,找出(二)十幾個(gè)基因做不同組織的表達(dá)量袭祟,看哪些基因具有較強(qiáng)的組織特異性表達(dá)性
  • 對于剛有基因組的但注釋不全的物種,基因家族待挖掘資源較多

基因的遠(yuǎn)近

我們?nèi)祟惣幢闶峭粋€(gè)祖先饼酿,在長期繁衍過程中榕酒,也會(huì)產(chǎn)生親疏遠(yuǎn)近,所以才有了“遠(yuǎn)親不如近鄰”這樣的俗語故俐,那么基因呢想鹰?

Homolog: A gene related to a second gene by descent from a common ancestral DNA sequence. The term, homolog, may apply to the relationship between genes separated by the event of speciation (see ortholog) or to the relationship betwen genes separated by the event of genetic duplication (see paralog).
同源基因:來自共同祖先DNA序列的基因,包括了物種間的同源“ortholog”药版、物種內(nèi)的因基因復(fù)制導(dǎo)致的同源"paralog")

出自 https://homepage.usask.ca/~ctl271/857/def_homolog.shtml

  • Ortholog:Orthologs are genes in different species that evolved from a common ancestral gene by speciation. Normally, orthologs retain the same function in the course of evolution. Identification of orthologs is critical for reliable prediction of gene function in newly sequenced genomes
    直系/垂直同源基因: 同一祖先但后來形成了不同物種辑舷,它們之間的基因集。一般從進(jìn)化上來講槽片,有相同的功能何缓,但這個(gè)并不絕對,可能在新測序的物種中又會(huì)發(fā)現(xiàn)新的基因功能)
  • Paralog:Paralogs are genes related by duplication within a genome. Orthologs retain the same function in the course of evolution, whereas paralogs evolve new functions, even if these are related to the original one
    旁系/平行同源基因: 某個(gè)特定基因組中由于基因復(fù)制產(chǎn)生的同源基因还栓,直系基因在進(jìn)化中一般會(huì)保持相同的功能碌廓,但是旁系基因會(huì)發(fā)生進(jìn)化,可能已經(jīng)有了新的功能剩盒,或者成為了假基因)

一般來講谷婆,在描述同源性和相似性時(shí),可以理解成:同源性為“質(zhì)”,即有沒有同源性纪挎;相似性為“量”期贫,即相似性有80%、90%

同源异袄、直系通砍、旁系基因
直系與旁系的差異

基因家族能做的事

  • 鑒定基因家族的成員

    先要準(zhǔn)備好:CDS.fa、protein.fa烤蜕、xxx.gff3和genome.fa

    NCBI 導(dǎo)出目標(biāo)基因編碼蛋白序列=》
    數(shù)據(jù)庫Pfam封孙,設(shè)定e-value 閾值=〉
    得到domain名稱和Pfam ID,如PFxxxxx =》
    查看該P(yáng)fam ID玖绿,左側(cè)欄選擇Curation&model敛瓷,下載Stockholm格式的HMM文件 *.hmm =》
    使用hmmsearch *.hmm protein.fa > result =>
    批量獲取gene ID,然后根據(jù)ID獲得protein.fa中的基因家族成員蛋白序列=》

    最后在SMART網(wǎng)站進(jìn)行鑒定=〉

    接下來得到CDS斑匪、genome信息(需要染色體編號呐籽、起始終止位點(diǎn)、基因ID蚀瘸、序列)

  • 構(gòu)建這些成員的進(jìn)化樹狡蝶,進(jìn)行同源基因聚類分析
    將篩選的基因家族的蛋白序列進(jìn)行多序列比對,還可以加入相關(guān)的模式物種贮勃,將基因們分成幾個(gè)大類和幾個(gè)亞類

  • 染色體位置分布和加倍復(fù)制分析
    可以用MCScanX軟件http://chibba.pgml.uga.edu/mcscan2/

    染色體位置分布和加倍復(fù)制分析

圖片來自文章:Genome-wide investigation of WRKY gene family in pineapple: evolution and expression profiles during development and stress
紅色表示基因家族成對復(fù)制贪惹,灰色表示共線性關(guān)系

  • 基因結(jié)構(gòu)、motif分析
基因結(jié)構(gòu)寂嘉、motif分析
  • 結(jié)合轉(zhuǎn)錄組進(jìn)行家族內(nèi)基因表達(dá)定量(可以結(jié)合不同處理或不同組織)奏瞬,表達(dá)定量的方法可以用轉(zhuǎn)錄組、表達(dá)譜泉孩、芯片硼端、qRT-PCR,這里可以讓之前的轉(zhuǎn)錄組數(shù)據(jù)重復(fù)利用寓搬,因此要做的話珍昨,純濕實(shí)驗(yàn)也就是熒光定量

歡迎關(guān)注我們的公眾號~_~  
我們是兩個(gè)農(nóng)轉(zhuǎn)生信的小碩,打造生信星球句喷,想讓它成為一個(gè)不拽術(shù)語镣典、通俗易懂的生信知識平臺。需要幫助或提出意見請后臺留言或發(fā)送郵件到Bioplanet520@outlook.com

Welcome to our bioinfoplanet!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末唾琼,一起剝皮案震驚了整個(gè)濱河市兄春,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌锡溯,老刑警劉巖神郊,帶你破解...
    沈念sama閱讀 211,423評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件肴裙,死亡現(xiàn)場離奇詭異趾唱,居然都是意外死亡涌乳,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,147評論 2 385
  • 文/潘曉璐 我一進(jìn)店門甜癞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來夕晓,“玉大人,你說我怎么就攤上這事悠咱≌袅荆” “怎么了?”我有些...
    開封第一講書人閱讀 157,019評論 0 348
  • 文/不壞的土叔 我叫張陵析既,是天一觀的道長躬贡。 經(jīng)常有香客問我,道長眼坏,這世上最難降的妖魔是什么拂玻? 我笑而不...
    開封第一講書人閱讀 56,443評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮宰译,結(jié)果婚禮上檐蚜,老公的妹妹穿的比我還像新娘。我一直安慰自己沿侈,他們只是感情好闯第,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,535評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著缀拭,像睡著了一般咳短。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上蛛淋,一...
    開封第一講書人閱讀 49,798評論 1 290
  • 那天咙好,我揣著相機(jī)與錄音,去河邊找鬼铣鹏。 笑死敷扫,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的诚卸。 我是一名探鬼主播葵第,決...
    沈念sama閱讀 38,941評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼合溺!你這毒婦竟也來了卒密?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,704評論 0 266
  • 序言:老撾萬榮一對情侶失蹤棠赛,失蹤者是張志新(化名)和其女友劉穎哮奇,沒想到半個(gè)月后膛腐,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,152評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡鼎俘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,494評論 2 327
  • 正文 我和宋清朗相戀三年哲身,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贸伐。...
    茶點(diǎn)故事閱讀 38,629評論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡勘天,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出捉邢,到底是詐尸還是另有隱情脯丝,我是刑警寧澤,帶...
    沈念sama閱讀 34,295評論 4 329
  • 正文 年R本政府宣布伏伐,位于F島的核電站宠进,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏藐翎。R本人自食惡果不足惜材蹬,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,901評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望阱高。 院中可真熱鬧赚导,春花似錦、人聲如沸赤惊。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽未舟。三九已至圈暗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間裕膀,已是汗流浹背员串。 一陣腳步聲響...
    開封第一講書人閱讀 31,978評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留昼扛,地道東北人寸齐。 一個(gè)月前我還...
    沈念sama閱讀 46,333評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像抄谐,于是被迫代替她去往敵國和親渺鹦。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,499評論 2 348

推薦閱讀更多精彩內(nèi)容