LDA有標簽數(shù)據(jù)降維

之前無標簽數(shù)據(jù)降維PCA涂乌,那么像下圖帶有標簽數(shù)據(jù),如果用PCA降維將會投影到v軸上杭隙,這個投影方差最大,數(shù)據(jù)將變成不可分狀態(tài)因妙,LDA將把數(shù)據(jù)投影加上已有分類這個變量痰憎,將數(shù)據(jù)投影到u軸上


假設(shè)原數(shù)據(jù)分成n類,用矩陣Di表示i類數(shù)據(jù)攀涵,均值向量mi,將設(shè)將數(shù)據(jù)投影到向量w上后铣耘,均值分別為Mi,向量w模長為1,則有



矩陣Di投影后類方差為



我們希望
盡可能大以故,這樣數(shù)據(jù)才能保留之前的分類特性蜗细,問題轉(zhuǎn)化為求

的最大值
設(shè)



對J求導(dǎo)

J最大值應(yīng)該是矩陣
的最大特征值

例子

from numpy.random import random_sample
import numpy as np
# fig = plt.figure()
N = 600
# 設(shè)橢圓中心center
cx = 5
cy = 6
a = 1/8.0
b = 4
X,scale = 2*a*random_sample((N,))+cx-a,60
Y = [2*b*np.sqrt(1.0-((xi-cx)/a)**2)*random_sample()+cy-b*np.sqrt(1.0-((xi-cx)/a)**2) for xi in X]
colors = ['green', 'green']*150
fig, ax = plt.subplots()
fig.set_size_inches(4, 6)
ax.scatter(X, Y,c = "none",s=scale,alpha=1, edgecolors=['green']*N)
X1,scale = 2*a*random_sample((N,))+cx-a,60
Y1 = [2*b*np.sqrt(1.0-((xi-cx)/a)**2)*random_sample()+cy-b*np.sqrt(1.0-((xi-cx)/a)**2) for xi in X1]
ax.scatter(X1+0.3, Y1,c = "none",s=scale,alpha=1, edgecolors=['red']*N)
plt.savefig('lda.png')
plt.show()

自己實現(xiàn)

D1 = np.array([X, Y])
D2 = np.array([X1+0.3, Y1])
m1 = np.mean(D1, axis=1)
m1 = m1[None,]
print m1
m2 = np.mean(D2, axis=1)
m2 = m2[None,]
print m2
SA = np.dot((m1-m2).T,(m1-m2))
S1 = np.dot(D1-m1.T,(D1-m1.T).T)
print S1
S2 = np.dot(D2-m2.T,(D2-m2.T).T)
SB = S1+S2
S = np.dot(np.linalg.inv(SB), SA)
evalue, evec = np.linalg.eig(S)
data1 = np.dot(evec[:,0], D1)
plt.scatter(data1, [0]*data1.size,c = 'g',s=scale,alpha=1, edgecolors=['none']*N)
data2 = np.dot(evec[:,0], D2)
plt.scatter(data2, [0]*data2.size,c = 'r',s=scale,alpha=1, edgecolors=['none']*N)
plt.show()

調(diào)用sklearn

from sklearn.lda import LDA
lda = LDA(n_components=1)
X3 = np.column_stack((D1,D2))
print X3.shape
Y = np.ones(X3.shape[1])
print Y.shape
Y[0:N/2]=0
X_trainn_lda = lda.fit_transform(X3.T, Y.T)
print X_trainn_lda.shape
xy = X_trainn_lda.size
plt.scatter(X_trainn_lda, [0]*xy,c = (['g']*(xy/2)+['r']*(xy/2)),s=scale,alpha=1, edgecolors=['none']*N)
plt.show()

完美投影成兩個線段,

多個分組情況

下圖是由一個三維空間的三組數(shù)據(jù),降維到二維的投影



不再是一個向量炉媒,而是一個矩陣形式踪区,
分子分母需要重新刻畫,多維數(shù)據(jù)離散程度用協(xié)方差來刻畫吊骤,分子可以用每組均值數(shù)據(jù)的協(xié)方差來表示

最后是兩個矩陣的比值缎岗,這個沒有具體的意義,pca知變換后特征值大小代表在該特征向量下投影的離散程度白粉,而特征值的乘積=矩陣行列式传泊,那么

例子

import scipy.io as sio  
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from numpy.random import random_sample
import numpy as np
ax=plt.subplot(111,projection='3d') #創(chuàng)建一個三維的繪圖工程
N = 200
scale = 60
# 設(shè)橢球中心center
cx = 2
cy = 2
cz = 2
a = 1.0
b = 1.5
c = 4.0
def plot(cx,cy,cz, a,b,c,N, color):
    X,scale = 2*a*random_sample((N,))+cx-a,60
    Y = [b*np.sqrt(1.0-((xi-cx)/a)**2)*(2*random_sample()-1)+cy for xi in X]
    Z = [c*np.sqrt(1-((xi-cx)/a)**2-((yi-cy)/b)**2)*(2*random_sample()-1)+cz for xi, yi in zip(X,Y)]
    ax.scatter(X, Y, Z,c = color,s=scale,alpha=1, edgecolors=['none']*N)
    lr =  np.array((X,Y,Z))
    return lr
data1 = plot(cx,cy,cz,a,b,c,N, 'b')
data2 = plot(cx+3,cy,cz,a,b,c,N,'r')
data3 = plot(cx,cy+4,cz,a,b,c,N,'g')
data = np.hstack((data1,data2,data3))
print data.shape
pca = PCA(n_components=2)
X_train_pca = pca.fit_transform(data)
print X_train_pca.shape
train = np.dot(X_train_pca.T, data)
ax.set_xlim([0,5])
ax.set_ylim([0,5])
ax.set_zlim([0,5])
ax.set_xlabel("X")
ax.set_ylabel("Y")
ax.set_zlabel("Z")

plt.show()

生成三個橢球,數(shù)據(jù)點紅鸭巴、綠眷细、藍三組



PCA降維后數(shù)據(jù)

plt.scatter(train[0,:], train[1,:],c = (['r']*N+['g']*N+['b']*N),s=scale,alpha=1, edgecolors=['none']*N)
plt.show()

LDA降維后數(shù)據(jù)

m1 = np.mean(data1, axis=1)[None,].T
m2 = np.mean(data2, axis=1)[None,].T
m3 = np.mean(data3, axis=1)[None,].T
print m1.shape
m = np.hstack((m1,m2,m3))
mTotal = np.mean(data, axis=1)[None,].T

SA = np.dot(m-mTotal, (m-mTotal).T)
SB = np.dot(data1-m1, (data1-m1).T)+np.dot(data2-m2, (data2-m2).T)+np.dot(data3-m3, (data3-m3).T)

S = np.dot(np.linalg.inv(SB), SA)
evalue, evec = np.linalg.eig(S)
myTrain =np.dot(evec, data)
plt.scatter(myTrain[0,:], myTrain[1,:],c = (['r']*N+['g']*N+['b']*N),s=scale,alpha=1, edgecolors=['none']*N)
plt.show()

調(diào)用sklearn

from sklearn.lda import LDA
lda = LDA(n_components=2)
y_train =[0]*N+[1]*N+[2]*N
y_train = np.array(y_train)
X_train_lda = lda.fit_transform(data.T, y_train.T)
print X_train_lda.shape
plt.scatter(X_train_lda.T[0,:], X_train_lda.T[1,:],c = (['r']*N+['g']*N+['b']*N),s=scale,alpha=1, edgecolors=['none']*N)
plt.show()

注意 矩陣并不一定可逆,可以先進行pca降維奕扣,再LDA

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末薪鹦,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子惯豆,更是在濱河造成了極大的恐慌池磁,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,383評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件楷兽,死亡現(xiàn)場離奇詭異地熄,居然都是意外死亡,警方通過查閱死者的電腦和手機芯杀,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,522評論 3 385
  • 文/潘曉璐 我一進店門端考,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人揭厚,你說我怎么就攤上這事却特。” “怎么了筛圆?”我有些...
    開封第一講書人閱讀 157,852評論 0 348
  • 文/不壞的土叔 我叫張陵裂明,是天一觀的道長。 經(jīng)常有香客問我太援,道長闽晦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,621評論 1 284
  • 正文 為了忘掉前任提岔,我火速辦了婚禮仙蛉,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘碱蒙。我一直安慰自己荠瘪,他們只是感情好,可當我...
    茶點故事閱讀 65,741評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著哀墓,像睡著了一般鞭莽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上麸祷,一...
    開封第一講書人閱讀 49,929評論 1 290
  • 那天,我揣著相機與錄音褒搔,去河邊找鬼阶牍。 笑死,一個胖子當著我的面吹牛星瘾,可吹牛的內(nèi)容都是我干的走孽。 我是一名探鬼主播,決...
    沈念sama閱讀 39,076評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼琳状,長吁一口氣:“原來是場噩夢啊……” “哼磕瓷!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起念逞,我...
    開封第一講書人閱讀 37,803評論 0 268
  • 序言:老撾萬榮一對情侶失蹤困食,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后翎承,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體硕盹,經(jīng)...
    沈念sama閱讀 44,265評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,582評論 2 327
  • 正文 我和宋清朗相戀三年叨咖,在試婚紗的時候發(fā)現(xiàn)自己被綠了瘩例。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,716評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡甸各,死狀恐怖垛贤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情趣倾,我是刑警寧澤聘惦,帶...
    沈念sama閱讀 34,395評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站誊酌,受9級特大地震影響部凑,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜碧浊,卻給世界環(huán)境...
    茶點故事閱讀 40,039評論 3 316
  • 文/蒙蒙 一涂邀、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧箱锐,春花似錦比勉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽观蜗。三九已至,卻和暖如春衣洁,著一層夾襖步出監(jiān)牢的瞬間墓捻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,027評論 1 266
  • 我被黑心中介騙來泰國打工坊夫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留砖第,地道東北人。 一個月前我還...
    沈念sama閱讀 46,488評論 2 361
  • 正文 我出身青樓环凿,卻偏偏與公主長得像梧兼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子智听,可洞房花燭夜當晚...
    茶點故事閱讀 43,612評論 2 350

推薦閱讀更多精彩內(nèi)容