信息量
-
定義
概率越低信息量越大
概率越高信息量越低
-
公式
例如
事件 概率 信息量 電腦炸了 0.1 電腦無法開機(jī) 0.2 電腦開機(jī) 0.7
熵
-
定義
是指所有信息量的期望值
-
公式
為概率,為信息量
相對熵(KL離散度)
-
公式
n為所有可能滚局, 則q分布和p分布越接近
交叉熵
- 推導(dǎo)公式
?
?
? 由 可以得出
-
公式
?
? 為交叉熵
定義
概率越低信息量越大
概率越高信息量越低
公式
例如
事件 | 概率 | 信息量 |
---|---|---|
電腦炸了 | 0.1 | |
電腦無法開機(jī) | 0.2 | |
電腦開機(jī) | 0.7 |
定義
是指所有信息量的期望值
公式
為概率,為信息量
公式
n為所有可能滚局, 則q分布和p分布越接近
?
?
? 由 可以得出
公式
?
? 為交叉熵