感想
這是一本奇書爱态,第一章沒有什么廢話谭贪,全部都是干貨。奇書有幾種锦担,比如“大一統(tǒng)理論”俭识,把許多看似并不直接相關(guān)的部分,站在一個更高的抽象層次洞渔,用一個無比簡潔的總結(jié)套媚,全部統(tǒng)一起來,讓人感到醍醐灌頂磁椒,“茅廁”頓開堤瘤。比如之前看過的一本《微積分五講》就是這種書,以后有時間專門對它寫個讀書筆記浆熔。<br />
而這本書本辐,是另一種“奇”。作者從現(xiàn)實(shí)生活中的實(shí)例切入医增,并將之轉(zhuǎn)化為一個數(shù)學(xué)的問題(矩陣方法)慎皱,之所以稱之為奇,實(shí)在是因?yàn)檫@樣的書叶骨,太少見了(或者是我太孤陋寡聞了)茫多。這種方式是無比親切的,人認(rèn)識世界的規(guī)律從具體上升到抽象忽刽,或者說的“機(jī)器學(xué)習(xí)”一點(diǎn)天揖,人腦如果沒有大量的實(shí)例來學(xué)習(xí),不足以從中獲取到模式跪帝。但是我們看到過太多的數(shù)學(xué)書今膊,上來就是公式、定義伞剑、定理万细、引理、推論1纸泄、推論2赖钞,寫的就跟一個字典一樣。即使邏輯再嚴(yán)密聘裁,體系再完美雪营,作為教科書而言,連廁紙都不如衡便。<br />
章節(jié)結(jié)構(gòu)
這本書主要有3個部分献起,第一部分是一些線性代數(shù)的基礎(chǔ)知識洋访,其中第一章是3個實(shí)際問題的概述,單刀直入谴餐,讓我們一上來就能十分直觀地感受到矩陣方法在現(xiàn)實(shí)問題中的使用姻政,這些示例問題會在第二部分的時候展開討論,而其中需要的線性代數(shù)基礎(chǔ)知識則在第一部分剩下的章節(jié)中集中討論岂嗓。
第一部分:線性代數(shù)有什么用汁展,為什么需要矩陣分解
★向量和矩陣如何用在數(shù)據(jù)挖掘和模式識別領(lǐng)域(概述)
名詞解釋
Data Mining:the science of extracting useful information from large data sets
Pattern Recognition:the act of taking in raw data and making an action based on the ‘category’ of the pattern”
應(yīng)用領(lǐng)域:電子商務(wù)、搜索引擎厌殉、生物信息學(xué)食绿、信息檢索
學(xué)科交叉:computer science, statistics and data analysis, linear algebra, and optimization
實(shí)際應(yīng)用的示例
-
信息檢索(information retrieval)
作者舉例:
假如要查詢“ranking of Web pages”這個關(guān)鍵詞公罕,按照上面那個關(guān)鍵詞表器紧,其實(shí)就對應(yīng)一個查詢向量
進(jìn)而楼眷,整個查詢的問題铲汪,就變成了 一個數(shù)學(xué)的問題:即從矩陣A中,找出一個向量x罐柳,使得該向量最接近與查詢向量q掌腰。作者說,要解決這類問題硝清,就需要一些距離度量(distance measure)的方法
為什么需要矩陣分解
在現(xiàn)實(shí)中,Key Words的數(shù)量十分巨大转晰,達(dá)到10的6次方數(shù)量級芦拿,其結(jié)果就是,A矩陣中查邢,會產(chǎn)生大量的0元素蔗崎,這樣的矩陣被稱為稀疏矩陣(sparse),如果沒有很好的簡化問題的方法扰藕,那么求解的過程即使對于計(jì)算機(jī)而言也將是十分漫長和痛苦的缓苛,矩陣分解正是人們在深入研究了矩陣的性質(zhì)之后,所發(fā)現(xiàn)的對矩陣進(jìn)行簡化的方法邓深。如果了解了矩陣分解的現(xiàn)實(shí)背景未桥,就知道它的存在是有意義的,節(jié)省了大量的無趣計(jì)算時間芥备,比起某些補(bǔ)品冬耿,它更加實(shí)在地延長我們的生命。明年過年不送禮萌壳,送禮只送矩陣分解亦镶。
其中一種矩陣分解方法被稱為singular value decomposition (SVD)日月,中文名叫奇異值分解,我也不知道為什么碰巧中文名那么奇異缤骨。爱咬。使用這種方法, 可以進(jìn)行數(shù)據(jù)壓縮(data compression)和檢索增強(qiáng)(retrieval enhancement) -
文字識別
作者舉例
小時候都寫過田字格绊起,把一個漢字寫在一個田字格里面精拟,同樣的道理,可以用這樣的格子把文字割開勒庄,劃分區(qū)域串前。田字格可以看成是一個3x3的矩陣,當(dāng)然也可以劃分得更加精細(xì)一點(diǎn)实蔽,變成一個16x16的格子荡碾。
3可以用一個16行16列的矩陣來表示,也就是說用256個數(shù)字構(gòu)成的矩陣局装,來表示一個手寫的3坛吁,這256個數(shù)字的大小,代表在那個點(diǎn)上的灰度大小铐尚。我們把原來的16行16列表示的3變成1列256行乎芳,此時3可以用一個向量來表示,假如說有1000個手寫3的樣本优俘,那么A矩陣就是一個1000列封断,256行的矩陣,其中每一個列向量爹脾,對應(yīng)一個手寫樣本3帖旨。其中的每一列,張(span)成一個子空間(subspace)灵妨,然后利用線性代數(shù)的知識解阅,計(jì)算這個子空間的近似基(approximate basis)
-
搜索引擎
作者示例:
谷歌的搜索引擎的核心就是矩陣運(yùn)算
如果兩個元素之間有關(guān)聯(lián)琼梆,那么就不為0性誉,否則就為0。比如說4茎杂,比較高冷错览,只進(jìn)不出,所以第4列都為0煌往。另外自身和自身也定為0倾哺,這樣該矩陣的對角線上也都是為0。
一個巴掌都有大小刽脖,網(wǎng)頁與網(wǎng)頁之間當(dāng)然有質(zhì)量上的差異羞海,一個好的搜索引擎就需要定量地把這種差異描述出來,谷歌通過解決P矩陣特征值的問題曲管,來完成這個評級(rank)却邓。