之前偶然的一次機(jī)會(huì)暖侨,感覺修改代碼畫基因圖譜入門比較困難剧蚣,入MapChart和MapDraw提前。這兩個(gè)工具吗货,如果你會(huì)修改代碼了,使用起來還是非常方便狈网,個(gè)性化修改圖譜也是非常好用的宙搬。
單純想讓畫基因圖譜變的簡(jiǎn)單一些,自己就用Perl+SVG的方式開放了一個(gè)軟件拓哺。最初的軟件功能非常簡(jiǎn)單勇垛,有基因位置信息和染色體長度,直接就把圖譜標(biāo)注出來也沒有刻度尺士鸥。
在使用過程中闲孤,發(fā)現(xiàn)這些功能還不夠,需要再增加點(diǎn)烤礁,再增加點(diǎn)崭放,最后就形成了MG2C 2.0(http://mg2c.iask.in/mg2c_v2.0/)和2.1(http://mg2c.iask.in/mg2c_v2.1/).?直接使用最新版,網(wǎng)址可使用http://mg2c.iask.in鸽凶,會(huì)自動(dòng)跳轉(zhuǎn)至最新版。
2.0和2.1的區(qū)別就在于建峭,2.1可以對(duì)基因進(jìn)行簡(jiǎn)單的顏色標(biāo)注玻侥;2.0則無此模塊。
下面這張圖是MG2C 2.0的效果圖
下面這張圖是MG2C 2.1的效果圖
下面針對(duì)2.1版本軟件的參數(shù)如何調(diào)整亿蒸,碰到哪些情況如何解決凑兰。
(1)令我意外的是,大家問的最多的問題是“如何將做好的SVG圖保存到本地電腦边锁?”姑食。
(2)如何理解SVG container與single chromosome container ?
答:SVG container的參數(shù)預(yù)先設(shè)定了整個(gè)基因圖譜的最大尺寸茅坛,若基因圖譜出現(xiàn)染色體過界的情況音半,適當(dāng)增加SVG container的height和width即可解決;而single chromosome container預(yù)先定義了單個(gè)染色體的最大尺寸贡蓖,如果染色體顯示不完整的情況曹鸠,可通過增加該部分的height和width來解決。
(3)如何理解gene?lines下的type參數(shù)斥铺?
答:type這里是指基因線標(biāo)注的位置類型彻桃,可設(shè)為1或2,其中1代表基因線標(biāo)注在基因開始與結(jié)束位置的正中間晾蜘;2代表基因的開始位置與結(jié)束位置同時(shí)顯示邻眷。
(4)如何理解gene?lines下的gene_display_type?參數(shù)眠屎?
答:該參數(shù)預(yù)設(shè)了五種基因位置信息展示樣式:1,基因在染色體兩側(cè)等量交錯(cuò)顯示肆饶,奇數(shù)在左邊改衩,偶數(shù)在右邊;2. 所有基因顯示在左側(cè)抖拴,且不顯示基因位置信息燎字;3.所有基因顯示在右側(cè),且不顯示基因位置信息阿宅;4. 所有基因在左側(cè)候衍,在右側(cè)顯示基因位置信息;5.所有基因展示在右側(cè)洒放,基因位置信息展示在左側(cè)蛉鹿。默認(rèn)值為1,即基因在染色體兩側(cè)交錯(cuò)顯示⊥現(xiàn)在回頭看一下妖异,這一參數(shù)放在gene lines下不是很妥當(dāng),應(yīng)該放在gene id下更為合適领追。他膳。
(5)如何為不同基因標(biāo)注顏色?
答:這個(gè)功能只在MG2C-2.1中可以用绒窑∽厮铮可以通過基因位置信息文件中的第5列字段添加顏色信息來實(shí)現(xiàn)。支持類似“black”“red”“gray”等顏色單詞或者網(wǎng)頁顏色代碼“#00dd00”些膨。
(6)若gene id與染色體之間的空隙感覺有點(diǎn)大了蟀俊,如何減少?可通過增加或減少?gene id下方的margin參數(shù)進(jìn)行調(diào)整订雾。
(7)若基因名稱過于密集肢预,黑乎乎一片,出現(xiàn)了重疊洼哎,如何解決烫映?軟件已設(shè)定了一些參數(shù),可以避免gene id之間的重疊谱净。若依然出現(xiàn)了重疊窑邦,可以通過增加chromosome下的height參數(shù)值。注意:single chromosome container中的height始終要大于chromosome的height值壕探,建議>=100冈钦。這里涉及尺寸的單位,均為像素pix李请。所以調(diào)整了chromosome的height瞧筛,記得同時(shí)調(diào)整chromosome container中的height值厉熟,否則可能 出現(xiàn)部分染色體不顯示的情況。
上面說了一些緊要的事情较幌,后面再說一下在線工具的每一項(xiàng)參數(shù)的具體意義揍瑟,如果上面就能解決您所碰到的問題,下面的內(nèi)容完全可以省略乍炉。
首先對(duì)高頻次的長單詞進(jìn)行簡(jiǎn)化:染色體=Chr=chromosome;
連線= connection between gene id and gene line绢片,這是基因名稱與基因位置線之間的連線。
到這里岛琼,軟件的相關(guān)介紹就結(jié)束了底循。
題外話:MG2C的工具功能很簡(jiǎn)單,就是在線畫圖槐瑞,沒想到這么受大家的歡迎熙涤。目前軟件已穩(wěn)定運(yùn)行超過3年了,有效使用記錄近4萬困檩,獨(dú)立IP已有2萬多祠挫,以國內(nèi)為主,還有不少國外的朋友悼沿。謝謝大家的捧場(chǎng)等舔。
寫軟件純粹是個(gè)愛好,把工作碰到的問題記錄下來糟趾,閑下來就在想看能不能用程序的方式解決软瞎,是否值得與大家共享。零零散散寫了幾十個(gè)工具拉讯,多數(shù)都是自己能用,沒空單獨(dú)整理鳖藕。
下一步計(jì)劃魔慷,工作中碰到基因在不同時(shí)間段有基因表達(dá)變化,如何將每個(gè)基因的變化趨勢(shì)用一張小圖表示出來著恩,且能批量展示院尔。EXCEL可以放在一張圖里展示所有基因的變化趨勢(shì),不是自己想要的喉誊。用Perl+SVG也做了一個(gè)工具邀摆,可以實(shí)現(xiàn),看后期是整理成在線工具伍茄,還是單機(jī)工具栋盹。先看下效果圖吧,目前只是第一版敷矫,還在完善中例获,后續(xù)會(huì)整理出來進(jìn)行分享汉额。