感謝CJ大神的反復(fù)修改,這個功能越變越好了象迎!
本文旨在復(fù)現(xiàn)CJ大神推文內(nèi)容丹擎,具體請參考“省心炸雞”,手動狗頭(http://www.reibang.com/p/b9034ce82ec2)
首先需要獲取的是染色體位置刽宪,我的辦法是在GFF3文件里取得。
復(fù)制出來的文件都在同一個單元格里,這個時候只需要使用分列功能就能把信息分開瓜富。
保存為txt文件
Chr | Length |
---|---|
1A | 594102056 |
1B | 689851870 |
1D | 495453186 |
2A | 780798557 |
2B | 801256715 |
2D | 651852609 |
3A | 750843639 |
3B | 830829764 |
3D | 615552423 |
4A | 744588157 |
4B | 673617499 |
4D | 509857067 |
5A | 709773743 |
5B | 713149757 |
5D | 566080677 |
6A | 618079260 |
6B | 720988478 |
6D | 473592718 |
7A | 736706236 |
7B | 750620385 |
7D | 638686055 |
之后需要準(zhǔn)備基因位置文件,首先用tbtools提取所有基因的ID和位置降盹。這里使用GFF3 gene position parse与柑。正經(jīng)的IOS(input,output,start)流程沒什么可說的价捧。
之后再input之前獲得的文件丑念。在set condition text填入需要提取的gene ID。模式選擇包含(contain)干旧,過濾模式選擇提惹邸(extract)。
需要注意的是椎眯,提取出來的文件行列不能直接使用挠将,需要設(shè)置table行列。
第一列g(shù)ene或者transcript ID编整,第二列chromosome舔稀,第三列起始位置,第四列結(jié)束為止掌测,第五列圖形分組(從0開始排起内贮,目前只試過四種最多幾種不清楚)。需要注意的是汞斧,該功能里merge會把不同顏色的基因堆疊在一起夜郁,而如果ID來自不同的圖形分組(第五列信息)則不會。
填入對應(yīng)信息即可
默認(rèn)全部分成一組的話粘勒,你就能得到
顯然沒什么意義竞端,分成三組,再加入顏色信息庙睡。
說個題外話事富,關(guān)于顏色的批量填充,在excel里按照組分類可以寫個if套娃乘陪,例如下面這樣
=if(c1=0,"253,180,98",if(c1=1,"228,26,28","31,120,180"))
也可以寫個index统台,然后用match去返回需要的顏色標(biāo)簽(R,G,B)
=INDEX({"253,180,98","228,26,28","31,120,180"},MATCH(C1,{0,1,2},0))
同理,你可以用類似方法給自己的基因批量分類啡邑。
最后的最后贱勃,一定要換形狀,否則merge的時候信息會出錯谣拣。
哦對了 基因密度信息請參考這里:http://www.reibang.com/p/801807865864
最后募寨,祝大家磕鹽順利