問(wèn)題1: 支持度與置信度閥值(取前50%)定得太低, 導(dǎo)致規(guī)則不是很相關(guān)(連衣裙->阿拉伯服飾 lift最高), 會(huì)出現(xiàn)在美國(guó)站下首推阿拉伯服飾.
解決方法: 將支持度與置信度閥值調(diào)高到取每個(gè)類(lèi)目的前5%數(shù)據(jù)
結(jié)論: 提升度在支持度, 置信度在一定閥值上才更有意義. 不然會(huì)出現(xiàn)提升度很高, 但相關(guān)性不明顯的結(jié)果.?
問(wèn)題2: 若只不限定AB類(lèi)目的支持度, 會(huì)出現(xiàn)相似類(lèi)目為極小眾, 導(dǎo)致相關(guān)性不高
Lift(A, B) = p(AB) / p(A)*p(B), 若B類(lèi)目只出現(xiàn)了一單, 那Lift(A, B) 會(huì)很高, B會(huì)出現(xiàn)在A相似類(lèi)目很靠前的位置.?
問(wèn)題3: 若用置信度作為衡量相關(guān)性, 會(huì)出現(xiàn)所有類(lèi)目的相似類(lèi)目都為熱門(mén)類(lèi)目.
Conf(A->B) = P(B|A) = P(AB)/P(A), B越熱門(mén),??Conf(A->B) 越高.
問(wèn)題4: 若不限定A->B的置信度, 會(huì)出現(xiàn)這個(gè)規(guī)則效果提升很好,? 但這個(gè)規(guī)則出現(xiàn)概率并不高.
比如 Lift(A, B) =?P(B|A) / P(B)? 若P(B|A)=0.00001,?P(B)=0.000001,??則Lift(A, B)=10, 但P(B|A)太低顯的沒(méi)意義, 寧愿選擇P(B|A)高點(diǎn), 但提升相對(duì)低點(diǎn)的模式