學習記錄

PCA

點乘 (內(nèi)積)?

到這里還是看不出內(nèi)積和這東西有什么關系蜡励,不過如果我們將內(nèi)積表示為另一種我們熟悉的形式:

A?B=|A||B|cos(a)

現(xiàn)在事情似乎是有點眉目了:A與B的內(nèi)積等于A到B的投影長度乘以B的模媳谁。再進一步够话,如果我們假設B的模為1,即讓|B|=1帅刀,那么就變成了:

A?B=|A|cos(a)

也就是說炫掐,設向量B的模為1盲镶,則A與B的內(nèi)積值等于A向B所在直線投影的矢量長度!這就是內(nèi)積的一種幾何解釋睁冬,也是我們得到的第一個重要結(jié)論挎春。在后面的推導中,將反復使用這個結(jié)論豆拨。

一般的直奋,如果我們有M個N維向量,想將其變換為由R個N維向量表示的新空間中施禾,那么首先將R個基按行組成矩陣A脚线,然后將向量按列組成矩陣B,那么兩矩陣的乘積AB就是變換結(jié)果弥搞,其中AB的第m列為A中第m列變換后的結(jié)果邮绿。

數(shù)學表示為:

其中pi是一個行向量,表示第i個攀例,aj是一個列向量船逮,表示第j個原始數(shù)據(jù)記錄。

示例


特別要注意的是粤铭,這里R可以小于N挖胃,而R決定了變換后數(shù)據(jù)的維數(shù)。也就是說,我們可以將一N維數(shù)據(jù)變換到更低維度的空間中去酱鸭,變換后的維度取決于基的數(shù)量吗垮。因此這種矩陣相乘的表示也可以表示降維變換。

最后凛辣,上述分析同時給矩陣相乘找到了一種物理解釋:兩個矩陣相乘的意義是將右邊矩陣中的每一列列向量變換到左邊矩陣中每一行行向量為基所表示的空間中去抱既。更抽象的說,一個矩陣可以表示一種線性變換扁誓。很多同學在學線性代數(shù)時對矩陣相乘的方法感到奇怪防泵,但是如果明白了矩陣相乘的物理意義,其合理性就一目了然了蝗敢。

優(yōu)化目標:投影到新向量后數(shù)據(jù)的離散程度最大化==> 方差最大化捷泞; 而新向量之間的“關聯(lián)”最小化,協(xié)方差最小

上面我們導出了優(yōu)化目標寿谴,但是這個目標似乎不能直接作為操作指南(或者說算法)锁右,因為它只說要什么,但根本沒有說怎么做讶泰。所以我們要繼續(xù)在數(shù)學上研究計算方案咏瑟。

我們看到,最終要達到的目的與字段內(nèi)方差及字段間協(xié)方差有密切關系痪署。因此我們希望能將兩者統(tǒng)一表示码泞,仔細觀察發(fā)現(xiàn),兩者均可以表示為內(nèi)積的形式狼犯,而內(nèi)積又與矩陣相乘密切相關余寥。于是我們來了靈感:

假設我們只有a和b兩個字段,那么我們將它們按行組成矩陣X:

X=(a1b1a2b2??ambm)

然后我們用X乘以X的轉(zhuǎn)置悯森,并乘上系數(shù)1/m:

1mXXT=(1m∑mi=1a2i1m∑mi=1aibi1m∑mi=1aibi1m∑mi=1b2i)

奇跡出現(xiàn)了宋舷!這個矩陣對角線上的兩個元素分別是兩個字段的方差,而其它元素是a和b的協(xié)方差瓢姻。兩者被統(tǒng)一到了一個矩陣的祝蝠。

根據(jù)矩陣相乘的運算法則,這個結(jié)論很容易被推廣到一般情況:

設我們有m個n維數(shù)據(jù)記錄幻碱,將其按列排成n乘m的矩陣X续膳,設C=1mXXT

,則C是一個對稱矩陣收班,其對角線分別個各個字段的方差,而第i行j列和j行i列元素相同谒兄,表示i和j兩個字段的協(xié)方差摔桦。

設原始數(shù)據(jù)矩陣X對應的協(xié)方差矩陣為C,而P是一組基按行組成的矩陣,設Y=PX邻耕,則Y為X對P做基變換后的數(shù)據(jù)鸥咖。設Y的協(xié)方差矩陣為D,我們推導一下D與C的關系:

C由上步計算得知兄世,P為需求

現(xiàn)在事情很明白了啼辣!我們要找的P不是別的,而是能讓原始協(xié)方差矩陣對角化的P御滩。換句話說鸥拧,優(yōu)化目標變成了尋找一個矩陣P,滿足PCPT

是一個對角矩陣削解,并且對角元素按從大到小依次排列富弦,那么P的前K行就是要尋找的基,用P的前K行組成的矩陣乘以X就使得X從N維降到了K維并滿足上述優(yōu)化條件氛驮。


mysql

排序:order by??? asc 升序(默認)???? desc 降序

聚合函數(shù):

sum()

ifnull(english,0)?? 如果english是null的話,就把它改為0

******* 任何值+null = null

count(*) 腕柜;max();min()矫废; avg()

where 和 having的區(qū)別?

where 用于分組前 后不能跟聚合函數(shù)

having 用于分組后 可以跟聚合函數(shù)

分組:group by

分組條件過濾:having

SQL的查詢語句的總結(jié)

順序:?? ?s...f...w...g...h...o...;

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末盏缤,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子蓖扑,更是在濱河造成了極大的恐慌唉铜,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,464評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件赵誓,死亡現(xiàn)場離奇詭異打毛,居然都是意外死亡,警方通過查閱死者的電腦和手機俩功,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,033評論 3 399
  • 文/潘曉璐 我一進店門幻枉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人诡蜓,你說我怎么就攤上這事熬甫。” “怎么了蔓罚?”我有些...
    開封第一講書人閱讀 169,078評論 0 362
  • 文/不壞的土叔 我叫張陵椿肩,是天一觀的道長。 經(jīng)常有香客問我豺谈,道長郑象,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,979評論 1 299
  • 正文 為了忘掉前任茬末,我火速辦了婚禮厂榛,結(jié)果婚禮上盖矫,老公的妹妹穿的比我還像新娘。我一直安慰自己击奶,他們只是感情好辈双,可當我...
    茶點故事閱讀 69,001評論 6 398
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著柜砾,像睡著了一般湃望。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上痰驱,一...
    開封第一講書人閱讀 52,584評論 1 312
  • 那天证芭,我揣著相機與錄音,去河邊找鬼萄唇。 笑死檩帐,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的另萤。 我是一名探鬼主播湃密,決...
    沈念sama閱讀 41,085評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼四敞!你這毒婦竟也來了泛源?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 40,023評論 0 277
  • 序言:老撾萬榮一對情侶失蹤忿危,失蹤者是張志新(化名)和其女友劉穎达箍,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體铺厨,經(jīng)...
    沈念sama閱讀 46,555評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡缎玫,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,626評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了解滓。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赃磨。...
    茶點故事閱讀 40,769評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖洼裤,靈堂內(nèi)的尸體忽然破棺而出邻辉,到底是詐尸還是另有隱情,我是刑警寧澤腮鞍,帶...
    沈念sama閱讀 36,439評論 5 351
  • 正文 年R本政府宣布值骇,位于F島的核電站,受9級特大地震影響移国,放射性物質(zhì)發(fā)生泄漏吱瘩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,115評論 3 335
  • 文/蒙蒙 一迹缀、第九天 我趴在偏房一處隱蔽的房頂上張望使碾。 院中可真熱鬧皱卓,春花似錦、人聲如沸部逮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,601評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽兄朋。三九已至,卻和暖如春怜械,著一層夾襖步出監(jiān)牢的瞬間颅和,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,702評論 1 274
  • 我被黑心中介騙來泰國打工缕允, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留峡扩,地道東北人。 一個月前我還...
    沈念sama閱讀 49,191評論 3 378
  • 正文 我出身青樓障本,卻偏偏與公主長得像教届,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子驾霜,可洞房花燭夜當晚...
    茶點故事閱讀 45,781評論 2 361

推薦閱讀更多精彩內(nèi)容