在可解釋AI領域伟阔,存在兩個術語良拼,分別是Interpretable和Explainable丽涩,這兩個術語在英文里本身就是同義詞桐腌,表示“capable of being understood”拄显。不同文獻對這兩個詞的定義都各有不同,有一些文獻不區(qū)分這兩個詞案站。
Interpretability表示模型固有的性質躬审,是否一個模型能夠解釋因果關系,這是一個更加抽象蟆盐、宏偉的先驗概念(也就是在事情發(fā)生之前我就知道)承边。“有因必有果石挂,你的報應就是我博助。”
Explainability可以理解為具體的某一個模型中痹愚,模型結構富岳、模型參數(shù)、數(shù)據(jù)輸入等是如何得到數(shù)據(jù)輸出的拯腮。這是一個更加形象窖式、具體的后驗概念(也就是事情發(fā)生之后,我想著怎么去解釋动壤,讓別人理解我)萝喘。