前言
1.1948 年伐割,香農(nóng)提出了“信息熵”(shāng);
2.信息量的度量就等于不確定性的多少刃唤。即:要搞懂一個(gè)非常非常不確定(gaoleng)的女孩(或是說(shuō)我們一無(wú)所知的女神)隔心,就需要了解大量的信息(喜歡吃啥,衣品尚胞,喜歡的偶像)硬霍。相反,如果我們對(duì)某件事已經(jīng)有了較多的了解(女閨蜜/青梅竹馬的)笼裳,我們不需要太多的信息就能把它搞清楚唯卖。(我盡力了~)
不多說(shuō)了,自己查資料躬柬,直接上重點(diǎn):
如何用“R”計(jì)算基因的香農(nóng)熵拜轨?
1.首先,你要有一個(gè)基因表達(dá)的表:
2.然后,“手動(dòng)”把第一列刪去(方便下一步導(dǎo)入到R中)
3. 打開R studio颠锉,導(dǎo)入數(shù)據(jù)(cd到數(shù)據(jù)所在的目錄就不說(shuō)了哈~):
forentropy=read.table("ForEntropy1.txt",header=TRUE,sep="\t",check.names=F,quote="",stringsAsFactors = FALSE)
4.調(diào)動(dòng)Entropy包法牲,具體參數(shù)請(qǐng)看說(shuō)明。
library(entropy)
5.發(fā)動(dòng)“寫輪眼”(for循環(huán)):
因?yàn)槲业臄?shù)據(jù)集有683個(gè)基因皆串,所以每一行計(jì)算香農(nóng)熵共683次
y=rep(0,683)
for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}
這時(shí)候已經(jīng)變成是你想要的數(shù)據(jù)了~
6.輸出數(shù)據(jù):
write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)
7.整理數(shù)據(jù)笨辦法
就是Excel打開這個(gè)香農(nóng)熵值的表格,復(fù)制黏貼到原來(lái)的Excel表格中(高端操作就是用cbind到原來(lái)的數(shù)據(jù)集中)
8.全部代碼:
forentropy=read.table("ForEntropy1.txt",header=TRUE,sep="\t",check.names=F,quote="",stringsAsFactors = FALSE)
library(entropy)
for (i in 1:683){ y[i]=entropy(forentropy[i,],method=c("CS"))}
write.table(y, file ="CS_Entropy.txt", sep =",", row.names =FALSE, col.names =FALSE)
后記:
能夠解決問(wèn)題的方法眉枕,就是好方法~
這個(gè)操作恶复,其實(shí)基本上可以用于對(duì)任何“感興趣”函數(shù),對(duì)自己的數(shù)據(jù)集“操作”一下~
不打賞速挑,不點(diǎn)贊谤牡,你們還想不想我寫了,嗚嗚嗚~~~
參考文獻(xiàn):
1.百度百科香農(nóng)熵:https://baike.baidu.com/item/香農(nóng)熵姥宝;