第15章 大數(shù)據(jù)與MapReduce(代碼) MapReduce:分布式計(jì)算的框架MapRedece分布式的計(jì)算框架劫哼,可以將單個計(jì)算作業(yè)分配給多...
第15章 大數(shù)據(jù)與MapReduce(代碼) MapReduce:分布式計(jì)算的框架MapRedece分布式的計(jì)算框架劫哼,可以將單個計(jì)算作業(yè)分配給多...
第14章 利用SVD簡化數(shù)據(jù)(代碼) SVD的應(yīng)用圖像壓縮噪聲濾波模式識別生物驾孔,物理藤抡,經(jīng)濟(jì)方面的一些統(tǒng)計(jì)模型的處理。SVD優(yōu)缺點(diǎn)優(yōu)點(diǎn):簡化數(shù)據(jù)侦讨,...
第13章 利用PCA來簡化數(shù)據(jù)(代碼) 降維技術(shù)降維的意思是能夠用一組個數(shù)為d的向量zi來代表個數(shù)為D的向量xi所包含的有用信息,其中d<D。假...
第12章 使用FP-growth算法來高效發(fā)現(xiàn)頻繁項(xiàng)集(代碼) FP優(yōu)點(diǎn)因?yàn)?FP-growth 算法只需要對數(shù)據(jù)集遍歷兩次任洞,所以速度更快。FP...
第11章 使用Apriori算法進(jìn)行關(guān)聯(lián)分析(代碼) 關(guān)聯(lián)分析關(guān)聯(lián)分析是一種在大規(guī)模數(shù)據(jù)集中尋找有趣關(guān)系的任務(wù)发侵。這些關(guān)系可以有兩種形式:頻繁項(xiàng)集...
第10章 K-均值聚類算法(代碼) K-均值算法的優(yōu)缺點(diǎn)K-均值是發(fā)現(xiàn)給定數(shù)據(jù)集的 K 個簇的聚類算法, 之所以稱之為 K-均值 是因?yàn)樗梢园l(fā)...
第九章 樹回歸(代碼) 樹回歸算法的優(yōu)缺點(diǎn)優(yōu)點(diǎn):可以對復(fù)雜和非線性的問題建模.缺點(diǎn):結(jié)果不容易理解.適用數(shù)據(jù)類型:數(shù)值型和標(biāo)稱型. 樹回歸和分類...
第八章 預(yù)測數(shù)值型數(shù)據(jù):回歸(代碼) 線性回歸算法的優(yōu)缺點(diǎn)優(yōu)點(diǎn):結(jié)果容易理解,計(jì)算上下不復(fù)雜缺點(diǎn):對非線性問題數(shù)據(jù)處理不好.使用數(shù)據(jù)類型:數(shù)值型...
第七章 利用AdaBoost元算法提高分類性能(代碼) AdaBoost算法的優(yōu)缺點(diǎn)優(yōu)點(diǎn): 泛化錯誤率低交掏,易編碼,可以應(yīng)用再大部分分類器上刃鳄,無參...
第六章 支持向量機(jī)(代碼) SVM算法優(yōu)缺點(diǎn)優(yōu)點(diǎn):泛化錯誤率低盅弛,計(jì)算開銷不大,結(jié)果易解釋叔锐。缺點(diǎn):對參數(shù)調(diào)節(jié)和和核函數(shù)的選擇敏感挪鹏,原始分類器不加修...