線性回歸: 參數(shù):[n,1]X:[n,m]y:[m,1]m為樣本數(shù) 誤差ε獨立同分布帚屉,服從均值為0梢褐,方差為某定值σ^2的高斯分布彻犁。隨機現(xiàn)象可以看...
Logistic回歸 優(yōu)點: 計算代價不高,易于實現(xiàn)和理解 缺點: 容易欠擬合阶冈,分類精度可能不高 適用數(shù)據(jù)類型: 數(shù)值型和標稱型數(shù)據(jù) 二分類問題...
樸素貝葉斯 優(yōu)點 在數(shù)據(jù)較少的情況下仍然有效润绵,可以處理多類別問題。 缺點 對于輸入數(shù)據(jù)的準備方式較為敏感 適用數(shù)據(jù)類型 標稱型數(shù)據(jù) 貝葉斯決策理...
決策樹算法 優(yōu)點 計算復雜度不高母赵,輸出結(jié)果易于理解逸爵,對中間值得缺失不敏感,可以處理不相關(guān)特征數(shù)據(jù)凹嘲。 缺點 可能會產(chǎn)生過度匹配問題 適用數(shù)據(jù)類型 ...
機器學習實戰(zhàn)篇 (k近鄰算法) k近鄰算法:通過測量不同特征值之間的距離進行分類 優(yōu)點:精度高师倔,對異常值不敏感,無數(shù)據(jù)輸入假定周蹭。 缺點:計算復雜...
HBase的分布式集群安裝 這里安裝的集群使用的是hadoop1.0.4版本趋艘,所以使用的hbase版本是0.94.27版本,關(guān)于hbase對ha...
ZooKeeper的集群安裝 虛擬機的集群: http://apache.fayea.com/zookeeper/stable/ 1.將下載好的...
在hadoop上運行python程序 準備文件 測試文件test.txt (/home/hadoop/input/test.txt) mappe...
hadoop2.4.1搭建完全分布式集群 準備工具 1.32位ubuntu14.04.4虛擬機 2.jdk1.7版本和hadoop2.4版本(注...