#軟件下載
# TFs_1718.tsv??All_genes_25489.tsv使用軟件自帶的測試數(shù)據(jù)漏峰。
#確定分界值
Cutoff 13 13 example_data/TFs_1718.tsv example_data/All_genes_25489.tsv
***********這里的13是樣本數(shù)量
在構(gòu)建GCN時,您需要在兩種情況下的皮爾遜相關(guān)系數(shù)(PCCs)的正值和負值。我們的方法是計算每個TF-基因?qū)υ诿總€條件下的所有PCC值。利用所有的PCC值,我們生成概率密度函數(shù)(PDF)和累積密度函數(shù)(CDF)的分布脉课。根據(jù)CDF,我們可以為你建議每種情況下的正負臨界值品腹,p<0.05馒索。要運行截斷程序莹妒,您必須提供4個參數(shù):條件1下的樣本數(shù)量、條件2下的樣本數(shù)量绰上、TF基因的數(shù)據(jù)文件和所有基因的數(shù)據(jù)文件旨怠。
除了建議的截止值外,程序還將生成.tsv格式的PCC值分布文件蜈块。您可以使用該文件通過Microsoft Excel或R程序生成直方圖條形圖鉴腻。
#構(gòu)建不同類型的八個GCN
GCN 13 13 example_data/TFs_1718.tsv example_data/TFs_1718.tsv 0.84 0.84 -0.75 -0.75
注意: 0.84 0.84 -0.75 -0.75在運行程序的過程中百揭。
過程:
結(jié)果產(chǎn)生八個csv文件
在第二步中爽哎,我們想要在兩個條件(C1和C2)下構(gòu)建八種GCN的共表達類型:C2、C1C20器一、C2-课锌、C10C2、C1-C2-祈秕、C1-C20和C10C2-渺贤,其中,-请毛、0分別表示正志鞍、負和不共表達。每個GCN的輸出文件都以逗號分隔值(.csv)格式列出获印。這五列分別代表TF基因ID述雾、共表達類型、基因ID兼丰、條件1下的PCC玻孟、條件2下的PCC。您可以將這些基因?qū)?dǎo)入到網(wǎng)絡(luò)生成工具中鳍征,如Cytoscape黍翎,以獲得GCN的可視化。要運行GCN程序艳丛,您必須再提供4個參數(shù)(總共8個參數(shù))匣掸,以指示條件1和2的正分界值以及條件1和2的負分界值。
#確定感興趣的GCN中的時序級別
最后一步是確定GCN中節(jié)點的時間順序(級別)氮双。時間順序由廣度優(yōu)先搜索(BFS)算法指定碰酝,從您選擇的一組種子節(jié)點開始(在seeds.txt中列出)。在大多數(shù)情況下戴差,我們會選擇一些在第一個時間點高表達送爸,在接下來的時間點低表達的基因作為種子。在我們的研究中,我們選擇了一個ID為Zm00001d041056的基因袭厂,并運行To-GCN程序來分配C1C2GCN中節(jié)點的時間順序(水平)墨吓。因此,我們只需要條件1和2的正截止纹磺,以及另外兩個指示種子節(jié)點基因ID和共表達類型(0帖烘、1或2)的參數(shù),其中0橄杨、1和2分別表示C1C2秘症、C1C20和C10C2。每個節(jié)點的級別和GCN讥珍。
TO-GCN 13 13 example_data/TFs_1718.tsv example_data/TFs_1718.tsv 0.84 0.84 example_data/seeds.txt 0
過程:
結(jié)果產(chǎn)生一個level文件历极,根據(jù)此文件及第二步產(chǎn)生的csv數(shù)據(jù),用Cytoscape畫圖衷佃。