KNN的基本思想 根據(jù)距離函數(shù)計算待分類樣本X和每個訓練樣本的距離(作為相似度),選擇與待分類樣本距離最小的K個樣本作為X的K個最近鄰,最后...
PageRank 如果一個網(wǎng)頁被很多其他網(wǎng)頁鏈接到的話說明這個網(wǎng)頁比較重要犯犁,也就是PageRank值會相對較高蒋伦;如果一個PageRank值很高的...
聚類:將數(shù)據(jù)自動的分成有緊密關系的子集或簇。 k-means:對于給定樣本集,分為k個簇触幼。簇內點盡量緊密,簇間距離盡量大究飞。 k-means是一個...
1.經(jīng)驗熵 隨機變量X概率分布:P(X =xi) =pi, i =l,2, ... ,n(n為X的類別數(shù)) 隨機變量X的熵(信息熵): 2...
數(shù)據(jù)降維 降維置谦,即通過某種數(shù)學變換將原始高維的數(shù)據(jù)轉變成低維的數(shù)據(jù)。
數(shù)據(jù)清洗 數(shù)據(jù)清洗是指發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤的最后一道程序亿傅,包括檢查數(shù)據(jù)一致性媒峡,處理異常值,處理缺失值葵擎,光滑噪聲和去重等谅阿。 1.一致性...
基于鎖的并發(fā)控制方法 什么是鎖? “鎖“是一種控制對數(shù)據(jù)項的并發(fā)訪問的機制1.每一數(shù)據(jù)項都有一唯一的鎖2.每一事務讀寫數(shù)據(jù)項前酬滤,要獲得鎖3.如果...
事務的概念 訪問并可能更新各種數(shù)據(jù)項的一個程序執(zhí)行單元奔穿。事務由事務開始【begin transaction】和事務結束【end transact...