1.數(shù)據(jù)集:關(guān)于某種事物記錄的集合
1.2屬性或特征:反應(yīng)對象在某方面表現(xiàn)出來的性質(zhì)悉稠;屬性的取值成為屬性值
1.3 特征向量:屬 性 張 成 的 空 間 稱 為 " 屬 性 空 間 "俏脊、 " 樣 本 空 間 " 或 " 輸 入 空 間 " 例 如 我 們 把 " 色 澤 " " 根 蒂 " " 敲 聲 " 作 為 三 個(gè) 坐 標(biāo) 軸 , 則 它 們 張 成 一 個(gè) 用 于 描 述 西 瓜 的 三 維 空 間 吊履, 每 個(gè) 西 瓜 都 可 在 這 個(gè) 空 間 中 找 到 自 己 的 坐 標(biāo) 位 置 . 由 于 空 間 中 的 每 個(gè) 點(diǎn) 對 應(yīng) 一 個(gè) 坐 標(biāo) 向 量 安皱, 因 此 我 們 也 把 一個(gè) 示 例 稱 為 一 個(gè) " 特 征 向 量 "。
1.4 訓(xùn)練集和驗(yàn)證集
1.5回歸:對連續(xù)數(shù)據(jù)的預(yù)測率翅,分類:對離散數(shù)據(jù)的預(yù)測
1.6NFL定理:在所有問題出現(xiàn)的機(jī)率相同或者所有問題都同等重要的情況下练俐,算法的期望值與算法無關(guān)袖迎、
2.模型評估與選擇
我 們 把 分 類 錯 誤 的 樣 本 數(shù) 占 樣 本 總 數(shù) 的 比 例 稱 為 " 錯 誤 率 " (error
rate) 冕臭, 即 如 果 在 m 個(gè) 樣 本 中 有 α 個(gè) 樣 本 分 類 錯 誤 腺晾, 則 錯 誤 率 E = α /m ; 相 應(yīng) 的 ,
1 一 α / m 稱 為 " 精 度 "
2.1 我 們 把學(xué) 習(xí) 器 的 實(shí) 際 預(yù) 測 輸 出 與 樣 本 的 真 實(shí) 輸 出 之 間 的 差 異 稱 為 " 誤 差 " (error),
學(xué) 習(xí) 器 在 訓(xùn) 練 集 上 的 誤 差 稱 為 " 訓(xùn) 練 誤 差 " (training e r r o r ) 或 " 經(jīng) 驗(yàn) 誤差 " (empirical error) 辜贵, 在 新 樣 本 上 的 誤 差 稱 為 " 泛 化 誤 差 " (generalization e r r o r ) .
2.2 過擬合與欠擬合
2.3 評估方法:留一法悯蝉,交叉驗(yàn)證法,自助法
2.4 性能度量
對 學(xué) 習(xí) 器 的 泛 化 性 能 進(jìn) 行 評 估 托慨, 不 僅 需 要 有 效 可 行 的 實(shí) 驗(yàn) 估 計(jì) 方 法 , 還 需
要 有 衡 量 模 型 泛 化 能 力 的 評 價(jià) 標(biāo) 準(zhǔn) 厚棵, 這 就 是 性 能 度 量 蕉世。
2.4.2 精度與錯誤率