1. 準(zhǔn)確性
在分類中,準(zhǔn)確性是正確分類的項(xiàng)數(shù)目除以測(cè)試集內(nèi)的項(xiàng)總數(shù)槐臀。 范圍從 0(最不準(zhǔn)確)到 1(最準(zhǔn)確)锄蹂。 準(zhǔn)確性是模型性能的評(píng)估指標(biāo)之一。
2. 曲線下面積
二元分類中的一項(xiàng)評(píng)估指標(biāo)水慨,即曲線下面積值得糜,它繪制真陽(yáng)性率(y軸)與誤報(bào)率(x軸)進(jìn)行對(duì)照。范圍從0.5(最差)到1(最好)晰洒。也稱為ROC曲線下面積朝抖。即,接受者操作特征曲線欢顷。
3. 二元分類
一個(gè)分類事例,其中標(biāo)簽僅為兩個(gè)類中的一個(gè)
4. 分類
當(dāng)使用這些數(shù)據(jù)來(lái)預(yù)測(cè)某一類別捉蚤,監(jiān)管式機(jī)器學(xué)習(xí)任務(wù)被稱為“分類”抬驴。 二元分類指的是僅預(yù)測(cè)兩個(gè)類別(例如,將圖像劃分為“貓”或“狗”圖片)缆巧。 多類分類指的是預(yù)測(cè)多個(gè)類別(例如布持,當(dāng)將圖像劃分為特定品種狗的圖片)
5. 決定系數(shù)
回歸中的一項(xiàng)評(píng)估指標(biāo),表明數(shù)據(jù)與模型的匹配程度陕悬。 范圍從 0 到 1题暖。 值 0 表示數(shù)據(jù)是隨機(jī)的,否則就無(wú)法與模型相匹配。 值 1 表示模型與數(shù)據(jù)完全匹配胧卤。 這通常稱為 2唯绍、R2 或 r 平方值。
6. 特征
正在對(duì)其進(jìn)行度量的現(xiàn)象的一個(gè)可度量屬性枝誊,通常是一個(gè)數(shù)(雙精度)值况芒。 多個(gè)特征被稱為“特征向量”且通常存儲(chǔ)為 double[]。 這些特征定義所度量現(xiàn)象的重要特性
7. 特征工程
特征工程是涉及定義一組特征和開(kāi)發(fā)軟件以從可用現(xiàn)象數(shù)據(jù)中生成特征向量(即特征提纫度觥)的過(guò)程绝骚。 有關(guān)詳細(xì)信息,請(qǐng)參閱 Wikipedia 上的特征工程一文祠够。
8. F分?jǐn)?shù)
分類中的一項(xiàng)評(píng)估指標(biāo)压汪,它平衡精度和撤回。
9. 超參數(shù)
機(jī)器學(xué)習(xí)算法的參數(shù)古瓤。 示例包括在決策林中學(xué)習(xí)的樹(shù)的數(shù)量止剖,或者梯度下降算法中的步長(zhǎng)。 在對(duì)模型進(jìn)行定型之前湿滓,先設(shè)置超參數(shù)的值滴须,并控制查找預(yù)測(cè)函數(shù)參數(shù)的過(guò)程,例如叽奥,決策樹(shù)中的比較點(diǎn)或線性回歸模型中的權(quán)重扔水。 Wikipedia 上的超參數(shù)一文。
10. Label
使用機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測(cè)的元素朝氓。 例如魔市,狗的品種或?qū)?lái)的股票價(jià)格。
11. 對(duì)數(shù)損失
在分類中赵哲,描述分類器準(zhǔn)確性的評(píng)估指標(biāo)待德。 對(duì)數(shù)損失越小,分類器越準(zhǔn)確枫夺。
相關(guān) ML.NET API:BinaryClassificationMetrics.LogLoss将宪。
12. 平均絕對(duì)誤差 (MAE)
回歸中的一項(xiàng)評(píng)估指標(biāo),即所有模型誤差的平均值橡庞,其中模型誤差是預(yù)測(cè)標(biāo)簽值和正確標(biāo)簽值之間的差距较坛。
相關(guān) ML.NET API:RegressionMetrics.L1。
13. 模型
就傳統(tǒng)意義而言扒最,它是預(yù)測(cè)函數(shù)的參數(shù)丑勤。 例如,線性回歸模型中的權(quán)重或決策樹(shù)中的拆分點(diǎn)吧趣。 在 ML.NET 中法竞,一個(gè)模型包含預(yù)測(cè)域?qū)ο?a target="_blank" rel="nofollow">標(biāo)簽所需的所有信息(例如耙厚,圖像或文本)。 這意味著 ML.NET 模型包括所需的特征化步驟以及預(yù)測(cè)函數(shù)參數(shù)岔霸。
14. 多類分類
一個(gè)分類事例薛躬,其中標(biāo)簽是三個(gè)或更多類中的一個(gè)。 有關(guān)詳細(xì)信息秉剑,請(qǐng)參閱機(jī)器學(xué)習(xí)任務(wù)主題的多類分類部分泛豪。
15. N 元語(yǔ)法
文本數(shù)據(jù)的特征提取方案:N 個(gè)單詞的任何序列都將轉(zhuǎn)變?yōu)?a target="_blank" rel="nofollow">特征值。
16. 數(shù)字特征向量
只包含數(shù)值的特征向量侦鹏。 這與 double[]
非常類似诡曙。
17. 管道
要將模型與數(shù)據(jù)集相匹配所需的所有操作。 管道由數(shù)據(jù)導(dǎo)入略水、轉(zhuǎn)換价卤、特征化和學(xué)習(xí)步驟組成。 對(duì)管道進(jìn)行定型后渊涝,它會(huì)轉(zhuǎn)變?yōu)槟P汀?/p>
18. 精度
在分類中慎璧,類的精度是正確預(yù)測(cè)為屬于該類的項(xiàng)目的數(shù)量,除以預(yù)測(cè)為屬于該類的項(xiàng)目的總數(shù)跨释。
相關(guān) ML.NET API:BinaryClassificationMetrics.NegativePrecision胸私、BinaryClassificationMetrics.PositivePrecision。
19. 撤回
在分類中鳖谈,類的撤回是正確預(yù)測(cè)為屬于該類的項(xiàng)目的數(shù)量岁疼,除以實(shí)際屬于該類的項(xiàng)目的總數(shù)。
相關(guān) ML.NET API:BinaryClassificationMetrics.NegativeRecall缆娃、BinaryClassificationMetrics.PositiveRecall捷绒。
20. 回歸
監(jiān)管式機(jī)器學(xué)習(xí)任務(wù),其中輸出是一個(gè)實(shí)際值贯要,例如暖侨,雙精度值。 示例包括預(yù)測(cè)股票價(jià)格崇渗。 有關(guān)詳細(xì)信息字逗,請(qǐng)參閱機(jī)器學(xué)習(xí)任務(wù)主題的回歸部分。
21. 相對(duì)絕對(duì)誤差
回歸中的一項(xiàng)評(píng)估指標(biāo)宅广,即所有絕對(duì)誤差總和除以正確標(biāo)簽值和所有正確標(biāo)簽值的平均值之間的差值總和葫掉。
22. 相對(duì)平方誤差
回歸中的一項(xiàng)評(píng)估指標(biāo),即所有絕對(duì)平方誤差總和除以正確標(biāo)簽值和所有正確標(biāo)簽值的平均值之間的平方差值總和乘碑。
23. 均方誤差根 (RMSE)
回歸中的一項(xiàng)評(píng)估指標(biāo)挖息,即誤差平方平均值的平方根金拒。
相關(guān) ML.NET API:RegressionMetrics.Rms兽肤。
24. 監(jiān)管式機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)的一個(gè)子類套腹,其中所需的模型預(yù)測(cè)尚不可見(jiàn)的數(shù)據(jù)標(biāo)簽。 示例包括分類资铡、回歸以及結(jié)構(gòu)化預(yù)測(cè)电禀。 有關(guān)詳細(xì)信息,請(qǐng)參閱 Wikipedia 上的監(jiān)管式學(xué)習(xí)一文笤休。
25. 培訓(xùn)
識(shí)別給定定型數(shù)據(jù)集模型的過(guò)程尖飞。 對(duì)于線性模型,這意味著查找權(quán)重店雅。 有關(guān)樹(shù)信息政基,這涉及到標(biāo)識(shí)拆分點(diǎn)。
26. Transform
轉(zhuǎn)換數(shù)據(jù)的管道組件闹啦。 例如沮明,從文本到數(shù)字向量。
27. 非監(jiān)管式機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)的子類窍奋,其中所需的模型查找數(shù)據(jù)中的隱藏(或潛在)結(jié)構(gòu)荐健。 示例包括聚類分析、主題建模和維數(shù)約簡(jiǎn)琳袄。 有關(guān)詳細(xì)信息江场,請(qǐng)參閱 Wikipedia 上的非監(jiān)管式學(xué)習(xí)一文