結構風險最小化: 在經(jīng)驗風險最小化的基礎上扬舒,盡可能采用簡單的模型,以此提高泛化預測精度凫佛。 經(jīng)驗風險最小化: 根據(jù)已有樣本讲坎,訓練模型使得預測結果,...
基本動機:嘗試學習出一個合適的距離度量 馬氏距離: 表示數(shù)據(jù)的協(xié)方差距離晨炕。它是一種有效的計算兩個未知樣本集的相似度的方法。與歐氏距離不同的是它考...
是一類借鑒了拓撲流形概念的降維方法瓮栗。 流形是在局部與歐式空間同胚的空間,它在局部具有歐式空間的性質(zhì)费奸,能用歐氏距離來進行距離計算弥激。若低維流形嵌入到...
密采樣:任意測試樣本X在附近任意小的ε距離范圍內(nèi)總能找到一個訓練樣本 低維嵌入:人們觀測或者收集到的數(shù)據(jù)樣本雖是高維的微服,但與學習任務密切相關的僅...
詳見http://www.cnblogs.com/JeffreySun/archive/2010/06/24/1627247.html,講解的非常詳細
試圖在不同層次對數(shù)據(jù)集進行劃分以蕴,從而形成樹形的聚類結構。自頂向下或自底向上均可 AGNES :自底向上 初始所以樣本為一個簇辛孵,每一步合并距離最近...
假設聚類結構能通過樣本分布的緊密程度確定。 DBSCAN 基于一組“領域”參數(shù)來刻畫樣本分布的緊密程度 ε-領域:對xj屬于D觉吭,其領域包含樣本集...
LVQ 試圖找到一組原型向量來刻畫聚類結構腾供,但與一般聚類算法不同的是鲜滩,LVQ假設數(shù)據(jù)樣本帶有類別標記伴鳖,學習過程利用樣本的這些監(jiān)督信息來輔助聚類。...
SVM的回歸形式榜聂, 假設我們能容忍f(x)與y之間最多有ε的偏差 相當于以f(x)為中心,構建了一個寬度為2ε的間隔帶