似然函數(shù) 什么樣的參數(shù)跟我們的數(shù)據(jù)組合后恰好是真實(shí)值。既什么樣的參數(shù)的極值點(diǎn) 對(duì)數(shù)似然 似然是累乘,轉(zhuǎn)換為對(duì)數(shù)似然芥被,把乘法轉(zhuǎn)換為加法(對(duì)數(shù)里的乘...
樹模型 決策樹:從根節(jié)點(diǎn)開始族展,一步步走到葉子節(jié)點(diǎn)(決策) 所有的數(shù)據(jù)最終都會(huì)落到葉子節(jié)點(diǎn)冲粤,既可以做分類也可以做回歸image.png決策樹對(duì)過濾...
通常輸入的特征數(shù)據(jù)是高維的(大于3維)恢着,一般難以直接以原特征對(duì)聚類結(jié)果進(jìn)行展示途凫。而TSNE提供了一種有效的數(shù)據(jù)降維方式桐汤,讓我們可以在2維或者3維...
K-Means算法是典型的基于距離的非層次聚類算法而克,在最小化誤差函數(shù)的基礎(chǔ)上將數(shù)據(jù)換分為預(yù)定的類數(shù)K,采用距離作為相似性的評(píng)價(jià)指標(biāo)怔毛,即認(rèn)為兩個(gè)對(duì)...
在Python中员萍,主成分分析的函數(shù)位于Scikit-Learn下:sklearn.decomposition.PCA(n_components ...
一些數(shù)據(jù)挖掘算法,要求數(shù)據(jù)是分類屬性形式的拣度。所以常常需要將連續(xù)屬性變換成分類屬性碎绎,即連續(xù)屬性離散化螃壤。 常用的離散化方法 等寬法將屬性的值域分成具...
數(shù)據(jù)規(guī)范化(歸一化)處理是數(shù)據(jù)挖掘中的一項(xiàng)基礎(chǔ)工作。消除指標(biāo)間的量綱和取值范圍差異的影響筋帖,需要進(jìn)行標(biāo)準(zhǔn)化處理奸晴,將數(shù)據(jù)按照比例縮放,使之落入一個(gè)特...
Pandas DataFrame Selecting and Indexing image.png image.png image.png im...
Pandas Series創(chuàng)建/操作 Pandas Series創(chuàng)建 Pandas Series操作 Pandas Dataframe Data...