線性回歸: 參數(shù):[n,1]X:[n,m]y:[m,1]m為樣本數(shù) 誤差ε獨(dú)立同分布提鸟,服從均值為0,方差為某定值σ^2的高斯分布宠进。隨機(jī)現(xiàn)象可以看...
Logistic回歸 優(yōu)點(diǎn): 計(jì)算代價不高,易于實(shí)現(xiàn)和理解 缺點(diǎn): 容易欠擬合藐翎,分類精度可能不高 適用數(shù)據(jù)類型: 數(shù)值型和標(biāo)稱型數(shù)據(jù) 二分類問題...
樸素貝葉斯 優(yōu)點(diǎn) 在數(shù)據(jù)較少的情況下仍然有效材蹬,可以處理多類別問題。 缺點(diǎn) 對于輸入數(shù)據(jù)的準(zhǔn)備方式較為敏感 適用數(shù)據(jù)類型 標(biāo)稱型數(shù)據(jù) 貝葉斯決策理...
決策樹算法 優(yōu)點(diǎn) 計(jì)算復(fù)雜度不高吝镣,輸出結(jié)果易于理解堤器,對中間值得缺失不敏感,可以處理不相關(guān)特征數(shù)據(jù)末贾。 缺點(diǎn) 可能會產(chǎn)生過度匹配問題 適用數(shù)據(jù)類型 ...
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)篇 (k近鄰算法) k近鄰算法:通過測量不同特征值之間的距離進(jìn)行分類 優(yōu)點(diǎn):精度高闸溃,對異常值不敏感,無數(shù)據(jù)輸入假定拱撵。 缺點(diǎn):計(jì)算復(fù)雜...
HBase的分布式集群安裝 這里安裝的集群使用的是hadoop1.0.4版本辉川,所以使用的hbase版本是0.94.27版本,關(guān)于hbase對ha...
ZooKeeper的集群安裝 虛擬機(jī)的集群: http://apache.fayea.com/zookeeper/stable/ 1.將下載好的...
在hadoop上運(yùn)行python程序 準(zhǔn)備文件 測試文件test.txt (/home/hadoop/input/test.txt) mappe...
hadoop2.4.1搭建完全分布式集群 準(zhǔn)備工具 1.32位ubuntu14.04.4虛擬機(jī) 2.jdk1.7版本和hadoop2.4版本(注...