1. 模型的評(píng)估
- 精確率桑涎、召回率彬向;、攻冷;[宏精確率娃胆、宏召回率、微精確率等曼、微召回率]
- 里烦、、禁谦;[代碼敏感錯(cuò)誤率胁黑、代價(jià)曲線]
- 不平衡樣本的處理
- 偏差與方差、偏差與方差分解(推導(dǎo)過程)
2. 線性模型
- 的推導(dǎo)
- 平方誤差損失函數(shù)的推導(dǎo)
- 函數(shù)損失函數(shù)的推導(dǎo)
3. 支持向量機(jī)
- 拉格朗日乘子法
- 優(yōu)化目標(biāo)的推導(dǎo)(主問題)
- 優(yōu)化目標(biāo)的推導(dǎo)(對(duì)偶問題)
- 軟間隔的優(yōu)化目標(biāo)[支持向量]
- 核函數(shù)
- 支持向量回歸優(yōu)化目標(biāo)
4. 決策樹
- 熵州泊、聯(lián)合熵丧蘸、條件熵;它們之間的關(guān)系
- 相對(duì)熵遥皂、交叉熵力喷;它們之間的關(guān)系
- 節(jié)點(diǎn)劃分標(biāo)準(zhǔn)
- CART 劃分標(biāo)準(zhǔn)
- 連續(xù)值的處理流程
- 缺失值的處理流程
- 剪枝流程
5. 降維與度量學(xué)習(xí)
- 、原理推導(dǎo)
- 演训、原理推導(dǎo)
- 兩者之間的異同
- KNN的優(yōu)化(弟孟、)
6. 聚類
- 性能評(píng)估(聚類趨勢(shì)的估計(jì)、判定聚類簇?cái)?shù)样悟、評(píng)估聚類質(zhì)量)
- (流程拂募、 的選擇方法)
- (核心對(duì)象、密度直達(dá)窟她、密度可達(dá)陈症、密度相連)
- 層次聚類 (Scipy)
7. 集成學(xué)習(xí)
- 、礁苗,一個(gè)是降低偏差爬凑、一個(gè)是降低方差
- 個(gè)隨機(jī)變量,兩兩之間的相關(guān)系數(shù)為 试伙,其均值的方差為 嘁信,推導(dǎo)過程
- 損失函數(shù)于样、算法步驟、原理推導(dǎo)
- 損失函數(shù)潘靖、算法步驟穿剖、原理推導(dǎo)
- 原理推導(dǎo)、工程優(yōu)化
- 兩者的異同
- 相比 的改進(jìn)點(diǎn)
7. NLP基礎(chǔ)
- [的維度]
8.Deep Learning 基礎(chǔ)
- 前向傳播推導(dǎo)
- 反向傳播梯度推導(dǎo)
- 激活函數(shù)( 副作用)
- 梯度爆炸和梯度消失
- 參數(shù)初始化(為什么不能都為0卦溢、各種初始化方法)
- 優(yōu)化方法
- 原理和作用
- 原理和作用
- 原理和作用
- 原理和作用
8.CNN
- 參數(shù)共享和稀疏連接的特性和作用
- 的方法糊余、作用
- 反向傳播的過程
9. RNN
- 解決什么問題,原理单寂,缺點(diǎn)
- 參數(shù)初始化問題(對(duì)角矩陣)
- 原理圖
- 原理圖贬芥、參數(shù)計(jì)算、機(jī)制
10. 大數(shù)據(jù)基礎(chǔ)
- 原理宣决、 過程
- 為什么比 快
- 提交任務(wù)流程
- 寬窄依賴
- 容錯(cuò)機(jī)制
- 中 與 操作的區(qū)別
- RDD蘸劈、DataFrame、DataSet 異同
- 優(yōu)化:算子的使用尊沸、廣播變量
- 數(shù)據(jù)傾斜處理[7點(diǎn)]