一署惯、人工智能學(xué)習(xí)算法分類
人工智能算法大體上來說可以分類兩類:基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)算法(Machine Learning)和深度學(xué)習(xí)算法(Deep Learning)
總的來說左驾,在sklearn中機(jī)器學(xué)習(xí)算法大概的分類如下:
1. 純算法類
- (1).回歸算法
- (2).分類算法
- (3).聚類算法
- (4)降維算法
- (5)概率圖模型算法
- (6)文本挖掘算法
- (7)優(yōu)化算法
- (8)深度學(xué)習(xí)算法
2.建模方面
- (1).模型優(yōu)化
- (2).數(shù)據(jù)預(yù)處理
二镣隶、詳細(xì)算法
1.分類算法
- (1).LR (Logistic Regression,邏輯回歸又叫邏輯分類)
- (2).SVM (Support Vector Machine诡右,支持向量機(jī))
- (3).NB (Naive Bayes安岂,樸素貝葉斯)
- (4).DT (Decision Tree,決策樹)
- 1).C4.5
- 2).ID3
- 3).CART
- (5).集成算法
- 1).Bagging
- 2).Random Forest (隨機(jī)森林)
- 3).GB(梯度提升,Gradient boosting)
- 4).GBDT (Gradient Boosting Decision Tree)
- 5).AdaBoost
- 6).Xgboost
- (6).最大熵模型
2.回歸算法
- (1).LR (Linear Regression帆吻,線性回歸)
- (2).SVR (支持向量機(jī)回歸)
- (3). RR (Ridge Regression域那,嶺回歸)
3.聚類算法
- (1).Knn
- (2).Kmeans 算法
- (3).層次聚類
- (4).密度聚類
4.降維算法
- (1).SGD (隨機(jī)梯度下降)
- (2).
5.概率圖模型算法
- (1).貝葉斯網(wǎng)絡(luò)
- (2).HMM
- (3).CRF (條件隨機(jī)場(chǎng))
6.文本挖掘算法
- (1).模型
- 1).LDA (主題生成模型,Latent Dirichlet Allocation)
- 4).最大熵模型
- (2).關(guān)鍵詞提取
- 1).tf-idf
- 2).bm25
- 3).textrank
- 4).pagerank
- 5).左右熵 :左右熵高的作為關(guān)鍵詞
- 6).互信息:
- (3).詞法分析
- 1).分詞
- ①HMM (因馬爾科夫)
- ②CRF (條件隨機(jī)場(chǎng))
- 2).詞性標(biāo)注
- 3).命名實(shí)體識(shí)別
- 1).分詞
- (4).句法分析
- 1).句法結(jié)構(gòu)分析
- 2).依存句法分析
- (5).文本向量化
- 1).tf-idf
- 2).word2vec
- 3).doc2vec
- 4).cw2vec
- (6).距離計(jì)算
- 1).歐氏距離
- 2).相似度計(jì)算
7.優(yōu)化算法
- (1).正則化
- 1).L1正則化
- 2).L2正則化
8.深度學(xué)習(xí)算法
- (1).BP
- (2).CNN
- (3).DNN
- (3).RNN
- (4).LSTM
三、建模方面
1.模型優(yōu)化·
- (1).特征選擇
- (2).梯度下降
- (3).交叉驗(yàn)證
- (4).參數(shù)調(diào)優(yōu)
- (5).模型評(píng)估:準(zhǔn)確率次员、召回率败许、F1、AUC淑蔚、ROC市殷、損失函數(shù)
2.數(shù)據(jù)預(yù)處理
- (1).標(biāo)準(zhǔn)化
- (2).異常值處理
- (3).二值化
- (4).缺失值填充: 支持均值、中位數(shù)刹衫、特定值補(bǔ)差醋寝、多重插補(bǔ)