在學(xué)習(xí)機器學(xué)習(xí)與深度學(xué)習(xí)之前、和AI相關(guān)的技術(shù)伙伴交流時婉宰,我們必須能聽懂或看懂相關(guān)的名詞:
樣本
樣本是指一條數(shù)據(jù)咳促。為深度學(xué)習(xí)訓(xùn)練模型用的衅斩,可以是已標注的也可以是未標注的數(shù)據(jù),來源可以是線上的也可以是線下的诬像。
特征
特征是指:被觀測對象中可測量特性屋群,例如西瓜的顏色住闯、瓜蒂煌珊、紋路、敲擊聲等宪巨;
特征向量
用一個 d 維向量表征一個樣本的所有或部分特征降狠;
標簽(label)/真實值
樣本特征對應(yīng)的真實類型或者真實取值对竣,即正確答案;
數(shù)據(jù)集(dataset)
多條樣本組成的集合榜配,是樣本的集合否纬。一般用于機器學(xué)習(xí)的數(shù)據(jù)集會分為:訓(xùn)練集、評估集蛋褥、測試型临燃。
訓(xùn)練集(train)
已指定用于模型訓(xùn)練的數(shù)據(jù)集;
評估集(eval)
用于在訓(xùn)練過程中周期性評估模型效果的數(shù)據(jù)集合烙心;
測試集(test)
用于在訓(xùn)練完成后評估最終模型效果的數(shù)據(jù)集合膜廊;
模型
可以從數(shù)據(jù)中學(xué)習(xí)到的,可以實現(xiàn)特定功能/映射的函數(shù)淫茵;
誤差/損失
樣本真實值與預(yù)測值之間的誤差爪瓜;
預(yù)測值
樣本輸入模型后輸出的結(jié)果;
模型訓(xùn)練
使用訓(xùn)練數(shù)據(jù)集對模型參數(shù)進行迭代更新的過程匙瘪;
模型收斂
任意輸入樣本對應(yīng)的預(yù)測結(jié)果與真實標簽之間的誤差穩(wěn)定钥勋;
模型評估
使用測試數(shù)據(jù)和評估指標對訓(xùn)練完成的模型的效果進行評估的過程炬转;
模型推理/預(yù)測
使用訓(xùn)練好的模型對數(shù)據(jù)進行預(yù)測的過程;
模型部署
使用服務(wù)加載訓(xùn)練好的模型算灸,對外提供推理服務(wù);