
線性回歸: 參數(shù):[n,1]X:[n,m]y:[m,1]m為樣本數(shù) 誤差ε獨(dú)立同分布,服從均值為0醋拧,方差為某定值σ^2的高斯分布。隨機(jī)現(xiàn)象可以看作眾多因素的獨(dú)立影響的綜合反應(yīng)...
Logistic回歸 優(yōu)點(diǎn): 計(jì)算代價(jià)不高,易于實(shí)現(xiàn)和理解 缺點(diǎn): 容易欠擬合碌补,分類精度可能不高 適用數(shù)據(jù)類型: 數(shù)值型和標(biāo)稱型數(shù)據(jù) 二分類問(wèn)題 在二維平面劃分?jǐn)?shù)據(jù)(http...
樸素貝葉斯 優(yōu)點(diǎn) 在數(shù)據(jù)較少的情況下仍然有效,可以處理多類別問(wèn)題棉饶。 缺點(diǎn) 對(duì)于輸入數(shù)據(jù)的準(zhǔn)備方式較為敏感 適用數(shù)據(jù)類型 標(biāo)稱型數(shù)據(jù) 貝葉斯決策理論 w為特征厦章,ci為分類 對(duì)于...
決策樹(shù)算法 優(yōu)點(diǎn) 計(jì)算復(fù)雜度不高,輸出結(jié)果易于理解照藻,對(duì)中間值得缺失不敏感袜啃,可以處理不相關(guān)特征數(shù)據(jù)。 缺點(diǎn) 可能會(huì)產(chǎn)生過(guò)度匹配問(wèn)題 適用數(shù)據(jù)類型 數(shù)值型和標(biāo)稱型數(shù)據(jù) 信息增益 ...
機(jī)器學(xué)習(xí)實(shí)戰(zhàn)篇 (k近鄰算法) k近鄰算法:通過(guò)測(cè)量不同特征值之間的距離進(jìn)行分類 優(yōu)點(diǎn):精度高幸缕,對(duì)異常值不敏感群发,無(wú)數(shù)據(jù)輸入假定。 缺點(diǎn):計(jì)算復(fù)雜度高发乔,空間復(fù)雜度高熟妓。 計(jì)算公式...
HBase的分布式集群安裝 這里安裝的集群使用的是hadoop1.0.4版本,所以使用的hbase版本是0.94.27版本,關(guān)于hbase對(duì)hadoop的版本支持請(qǐng)自行百度 ...
ZooKeeper的集群安裝 虛擬機(jī)的集群: http://apache.fayea.com/zookeeper/stable/ 1.將下載好的zookeeper-3.4.9...
在hadoop上運(yùn)行python程序 準(zhǔn)備文件 測(cè)試文件test.txt (/home/hadoop/input/test.txt) mapper.py (/home/...
hadoop2.4.1搭建完全分布式集群 準(zhǔn)備工具 1.32位ubuntu14.04.4虛擬機(jī) 2.jdk1.7版本和hadoop2.4版本(注意jdk的版本位數(shù)必須和ubu...
gunicorn+gevent+nginx部署flask應(yīng)用 這次部署是在ubuntu上進(jìn)行的,在部署開(kāi)始之前要做以下事情: 1.在你的linux系統(tǒng)上安裝python-pi...