未標記樣本 在現(xiàn)實任務中,會出現(xiàn)一部分樣本被標記而另一部分樣本未被標記的情況耘婚,那么如何利用好未標記樣本數(shù)據(jù)呢?主動學習:先用標記好的樣本數(shù)據(jù)來進...
基礎知識 計算學習理論是機器學習的理論基礎陆赋,其目的是分析學習任務的困難本質沐祷,并根據(jù)分析結果指導算法設計。例如:在什么條件下可進行有效的學習攒岛,需要...
子集搜索與評價 特征選擇:在屬性集中可能存在無用的屬性赖临,即對結果判斷不重要的屬性,被稱為“無關特征”灾锯,而有用的屬性被稱為“相關特征”兢榨,而從特征集...
k近鄰學習 kNN學習是一種常用的監(jiān)督學習方法。 工作機制給定測試樣本挠进,基于某種距離度量找出訓練集中與其最靠近的k個訓練樣本色乾,然后根據(jù)這k個“鄰...
構造決策樹根節(jié)點 然后,據(jù)此劃分數(shù)據(jù)集领突,再對劃分后的子數(shù)據(jù)集重復以上過程暖璧,直到滿足當前數(shù)據(jù)集的每個樣本同屬一類或者所有特征已使用兩個條件之一。 ...
聚類任務 訓練樣本的標記信息未知君旦,目標是對無標記訓練樣本的學習來揭示數(shù)據(jù)的內在性質及規(guī)律澎办,即是無監(jiān)督學習,訓練數(shù)據(jù)無標記金砍,目的是為了分類局蚀。 何為...
集成學習的概念 如何產生和結合“好而不同”的個體學習器,是集成學習的核心恕稠。好代表個體學習器要有一定的準確率琅绅,而不同代表個體學習器之間要對同一組數(shù)...
貝葉斯分類器是一類分類算法的總稱,是各種分類器中分類錯誤概率最小的分類器鹅巍,而貝葉斯定理是這類算法的核心千扶。 貝葉斯決策論 貝葉斯決策論是概率框架下...
支持向量機(supporyibant Vector Machine)是一種算法,一般被稱作SVM骆捧,其為處理非線性問題提供了一種更加強大的方法澎羞。 ...