以下三項基本假設(shè)闡明了泛化:
- 我們從分布中隨機(jī)抽取獨(dú)立同分布 (i.i.d) 的樣本易猫。換言之耻煤,樣本之間不會互相影響。(另一種解釋:i.i.d. 是表示變量隨機(jī)性的一種方式)准颓。
- 分布是平穩(wěn)的哈蝇;即分布在數(shù)據(jù)集內(nèi)不會發(fā)生變化。
- 我們從同一分布的數(shù)據(jù)劃分中抽取樣本攘已。
在實(shí)踐中炮赦,我們有時會違背這些假設(shè)。例如:
- 想象有一個選擇要展示的廣告的模型样勃。如果該模型在某種程度上根據(jù)用戶以前看過的廣告選擇廣告吠勘,則會違背 i.i.d. 假設(shè)。
- 想象有一個包含一年零售信息的數(shù)據(jù)集峡眶。用戶的購買行為會出現(xiàn)季節(jié)性變化剧防,這會違反平穩(wěn)性。
如果違背了上述三項基本假設(shè)中的任何一項辫樱,那么我們就必須密切注意指標(biāo)诵姜。