1. 基于常見數(shù)據(jù)集的模型天梯
2. 混淆矩陣(confusion matrix)
在機器學習領域,混淆矩陣(confusion matrix)茵烈,又稱為可能性表格或是錯誤矩陣它褪。它是一種特定的矩陣用來呈現(xiàn)算法性能的可視化效果榛了,通常是監(jiān)督學習(非監(jiān)督學習凡桥,通常用匹配矩陣:matching matrix)。其每一列代表預測值僵闯,每一行代表的是實際的類別。這個名字來源于它可以非常容易的表明多個類別是否有混淆(也就是一個class被預測成另一個class)藤滥。
-
例子:
假設有一個用來對貓(cats)鳖粟、狗(dogs)、兔子(rabbits)進行分類的系統(tǒng)拙绊,混淆矩陣就是為了進一步分析性能而對該算法測試結(jié)果做出的總結(jié)牺弹。假設總共有 27 只動物:8只貓, 6條狗时呀, 13只兔子张漂。結(jié)果的混淆矩陣如下圖:
在這個混淆矩陣中,實際有 8只貓谨娜,但是系統(tǒng)將其中3只預測成了狗航攒;對于 6條狗,其中有 1條被預測成了兔子趴梢,2條被預測成了貓漠畜。從混淆矩陣中我們可以看出系統(tǒng)對于區(qū)分貓和狗存在一些問題,但是區(qū)分兔子和其他動物的效果還是不錯的坞靶。所有正確的預測結(jié)果都在對角線上憔狞,所以從混淆矩陣中可以很方便直觀的看出哪里有錯誤,因為他們呈現(xiàn)在對角線外面彰阴。
- 參考資料: