關(guān)于作者
吳軍孟岛,畢業(yè)于清華大學(xué)和約翰霍普金斯大學(xué)瓶竭,他有很多個(gè)身份。
他是硅谷投資人渠羞,豐元資本的創(chuàng)始合伙人斤贰,是著名的自然語(yǔ)言處理專(zhuān)家和搜索專(zhuān)家,也是“得到”App專(zhuān)欄《硅谷來(lái)信》的主理人次询。他是谷歌的早期員工之一荧恍,在谷歌期間領(lǐng)導(dǎo)參與了很多研發(fā)項(xiàng)目,是谷歌中屯吊、日送巡、韓搜索算法的發(fā)明人。同時(shí)他還是位暢銷(xiāo)書(shū)作家盒卸,除了這本《數(shù)學(xué)之美》以外骗爆,還寫(xiě)過(guò)《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷(xiāo)書(shū)。
關(guān)于本書(shū)
在本書(shū)里蔽介,吳軍從他的親身經(jīng)歷出發(fā)淮腾,為我們介紹了數(shù)學(xué)在信息科學(xué)領(lǐng)域的種種應(yīng)用糟需,以及兩位著名的數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)智慧。通過(guò)這些實(shí)際案例谷朝,他為我們展示了數(shù)學(xué)和我們當(dāng)今生活的緊密聯(lián)系,以及數(shù)學(xué)思想背后蘊(yùn)含的簡(jiǎn)單之美武花。
核心內(nèi)容
本書(shū)的核心思想是:數(shù)學(xué)和我們的生活聯(lián)系非常緊密圆凰,生活中很多意想不到的問(wèn)題,其實(shí)都能用數(shù)學(xué)方法來(lái)解決体箕。數(shù)學(xué)能夠幫助我們跳出問(wèn)題的表面現(xiàn)象专钉,抓住事物發(fā)展背后的邏輯,從而用一種巧妙的方法去解決復(fù)雜的問(wèn)題累铅;同時(shí)因?yàn)閿?shù)學(xué)也具有簡(jiǎn)單的一致性跃须,這就讓我們經(jīng)常能用一種思想來(lái)解決不同種類(lèi)的問(wèn)題。而數(shù)學(xué)之美娃兽,就體現(xiàn)在這種實(shí)用和簡(jiǎn)潔之中菇民。
一、數(shù)學(xué)能幫我們跳出表象投储,抓住事物發(fā)展背后的邏輯
讓計(jì)算機(jī)能處理人類(lèi)的語(yǔ)言是我們今天很多工作的基礎(chǔ)第练,所以科學(xué)家們很早就在這個(gè)問(wèn)題上展開(kāi)了研究。
其實(shí)最開(kāi)始讓計(jì)算機(jī)處理語(yǔ)言的時(shí)候玛荞,科學(xué)家們按照仿生學(xué)的思路娇掏,堅(jiān)持認(rèn)為,要讓機(jī)器學(xué)會(huì)翻譯或者語(yǔ)言識(shí)別勋眯,就必須像人一樣婴梧,先讓計(jì)算機(jī)學(xué)會(huì)語(yǔ)法。但是后來(lái)人們發(fā)現(xiàn)客蹋,語(yǔ)法規(guī)則實(shí)在是太多塞蹭,根本沒(méi)有辦法窮盡。這種方法在上個(gè)世紀(jì)70年代逐漸被證明是不可行的嚼酝。
與此同時(shí)浮还,著名計(jì)算機(jī)科學(xué)家賈里尼克和他領(lǐng)導(dǎo)的實(shí)驗(yàn)室,發(fā)明了用統(tǒng)計(jì)學(xué)處理自然語(yǔ)言的方法闽巩,大大提高了語(yǔ)音識(shí)別的識(shí)別率和識(shí)別規(guī)模钧舌。他們的方法主要用了“馬爾科夫假設(shè)”, 這個(gè)假設(shè)是說(shuō)涎跨,假定一個(gè)句子里每一個(gè)詞出現(xiàn)的概率洼冻,只和前一個(gè)詞有關(guān),就好比“漲陀绾埽”這個(gè)詞撞牢,最有可能出現(xiàn)在“股票”之后。那么,只要給計(jì)算機(jī)量足夠大的機(jī)讀文本屋彪,計(jì)算機(jī)就能算出來(lái)所宰,在一個(gè)特定詞后面出現(xiàn)某個(gè)詞的概率。這樣畜挥,只要把一句話里所有詞出現(xiàn)的概率相乘仔粥,就是這個(gè)句子出現(xiàn)的概率了。概率最大的句子蟹但,就是我們需要的正確句子躯泰。
在解決問(wèn)題時(shí),過(guò)度地注意模仿卻不懂變通华糖,也是導(dǎo)致失敗的重要原因麦向。就像當(dāng)年人們最開(kāi)始制造飛機(jī)時(shí),總是想把飛機(jī)的機(jī)翼設(shè)計(jì)成鳥(niǎo)的翅膀客叉,但是最后萊特兄弟制造出來(lái)的第一架飛機(jī)诵竭,靠的不是仿生學(xué),而是空氣動(dòng)力學(xué)十办。所以說(shuō)秀撇,不被事情的表面現(xiàn)象迷惑,是一種很重要的能力向族,而數(shù)學(xué)就能幫我們跳出表象呵燕,抓住事物發(fā)展背后的邏輯。
二件相、數(shù)學(xué)的“一致性”體現(xiàn)著數(shù)學(xué)之美
余弦定理是一個(gè)揭示三角形邊角關(guān)系的重要數(shù)學(xué)定理再扭,使用余弦定理,就可以?xún)H憑三角形兩個(gè)邊的向量夜矗,計(jì)算出這兩個(gè)邊的夾角泛范。科學(xué)家為了讓計(jì)算機(jī)能處理人類(lèi)的語(yǔ)言紊撕,要先把新聞里的文字變成一組可以計(jì)算的數(shù)字罢荡,再設(shè)計(jì)一個(gè)算法,這樣就能讓計(jì)算機(jī)通過(guò)余弦定理对扶,來(lái)算出任意兩篇新聞的相似性区赵,從而確定新聞的分類(lèi)。
新聞里的詞分為實(shí)詞和虛詞浪南,“之乎者也的”這種虛詞對(duì)判斷新聞分類(lèi)無(wú)益笼才,就不考慮,而“股票”“利息”這種實(shí)詞络凿,對(duì)判斷新聞分類(lèi)很有幫助骡送,是我們關(guān)注的重點(diǎn)昂羡,我們就要用這些實(shí)詞計(jì)算出一則新聞的特征向量。只要給每一則新聞都計(jì)算出其獨(dú)特的特征向量摔踱,再根據(jù)每一類(lèi)新聞經(jīng)常出現(xiàn)的詞的特征虐先,就可以判斷出任意一條新聞的分類(lèi)。
在新聞分類(lèi)的工作中昌渤,計(jì)算機(jī)不需要去理解每篇新聞赴穗,只要找到同一類(lèi)新聞的相似點(diǎn)就可以了,用余弦定理就能搞定膀息,這就證明了數(shù)學(xué)的“一致性”。雖然事物發(fā)展千變?nèi)f化了赵,但處理它們的數(shù)學(xué)模型卻是相似潜支、甚至相同的。這種一致性柿汛,就是一種“數(shù)學(xué)之美”冗酿。
三、數(shù)學(xué)的妙處就是络断,一個(gè)好方法裁替,常常也是最簡(jiǎn)單明了的方法
現(xiàn)在我們每個(gè)人幾乎每天都會(huì)用到搜索引擎,它可以在極短的時(shí)間內(nèi)搜索到大量你需要的網(wǎng)頁(yè)貌笨,這背后的關(guān)鍵就是數(shù)學(xué)弱判。
搜索引擎背后的基本數(shù)學(xué)原理,其實(shí)特別簡(jiǎn)單锥惋。二進(jìn)制是世界上最簡(jiǎn)單的計(jì)數(shù)方法昌腰,因?yàn)槎M(jìn)制只有0和1兩個(gè)數(shù)字,并且二進(jìn)制還可以表示邏輯里的“是”和“非”膀跌。布爾運(yùn)算遭商,就是一種針對(duì)二進(jìn)制的運(yùn)算,它是19世紀(jì)英國(guó)的一名名叫布爾的數(shù)學(xué)家發(fā)明的捅伤,基本的運(yùn)算只有“與”“或”“非”三種劫流,非常簡(jiǎn)單。
搜索引擎會(huì)把用戶(hù)查詢(xún)的語(yǔ)句丛忆,轉(zhuǎn)換成布爾運(yùn)算的算式祠汇,看看搜索關(guān)鍵詞有沒(méi)有出現(xiàn)在這個(gè)網(wǎng)頁(yè),1就代表出現(xiàn)蘸际,0就代表沒(méi)出現(xiàn)座哩。這樣一來(lái),每個(gè)網(wǎng)頁(yè)就會(huì)轉(zhuǎn)換成一個(gè)數(shù)字粮彤。最后只要把顯示為1的網(wǎng)頁(yè)拿出來(lái)根穷,就是你要的搜索結(jié)果了姜骡。計(jì)算機(jī)做布爾運(yùn)算的速度非常快屿良,所以搜索引擎可以輕松地在很短的時(shí)間里搜索出大量網(wǎng)頁(yè)圈澈。
牛頓曾經(jīng)說(shuō)過(guò),“真理在形式上從來(lái)都是簡(jiǎn)單的尘惧,而不是復(fù)雜和含混不清的”康栈。數(shù)學(xué)之美也體現(xiàn)在這里,如果你能拿數(shù)學(xué)工具來(lái)解決問(wèn)題喷橙,那么不管你的方法有多復(fù)雜啥么,這里面的基本思想都應(yīng)該是簡(jiǎn)單的。
四贰逾、兩位數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)思維
本書(shū)的作者吳軍認(rèn)為悬荣,技術(shù)其實(shí)分為兩種,分別是“術(shù)”和“道”疙剑÷扔兀“術(shù)”指的是具體做事的技藝和方法,而“道”指的是做事的原理和原則言缤。
這本書(shū)的目的是講“道”嚼蚀,而不是去講多么具體的“術(shù)”。因?yàn)楹芏嗑唧w的技術(shù)很快就會(huì)變得落伍管挟。追求“術(shù)”的人轿曙,一輩子都會(huì)很辛苦。只有掌握了技術(shù)的本質(zhì)和精髓哮独,做事才能游刃有余拳芙。
第一位大師是阿米特·辛格。他是美國(guó)工程院院士皮璧,谷歌公司內(nèi)的一位技術(shù)大神舟扎。辛格做事情的哲學(xué),是先幫助用戶(hù)解決80%的問(wèn)題悴务,再慢慢解決剩下20%的問(wèn)題睹限,這就讓他總是能在較短的時(shí)間里較好的解決問(wèn)題。阿米特·辛格還奉行簡(jiǎn)單的哲學(xué)讯檐,他認(rèn)為最簡(jiǎn)單的東西往往是最好的羡疗。因?yàn)樗J(rèn)為越簡(jiǎn)單的事情越容易解釋道理,這樣可以方便查找錯(cuò)誤别洪。
第二位大師是邁克爾·柯林斯叨恨,他是一個(gè)擅長(zhǎng)用數(shù)學(xué)把工作做到極致的人⊥诙猓柯林斯的哲學(xué)是追求極致和完美痒钝。比如他曾經(jīng)設(shè)計(jì)了一個(gè)幫助計(jì)算機(jī)處理自然語(yǔ)言的分析器秉颗,目的不是為了驗(yàn)證什么理論,而僅僅是為了做出世界上最好的分析器送矩〔仙柯林斯的特點(diǎn),就是把事情做到極致栋荸。他并不是刻意去追求繁瑣和復(fù)雜菇怀,也不是和阿米特·辛格完全對(duì)立,他只是在追求數(shù)學(xué)上的嚴(yán)謹(jǐn)和完美晌块。
不管是阿米特·辛格的簡(jiǎn)單哲學(xué)爱沟,還是邁克爾·柯林斯的完美哲學(xué),都把數(shù)學(xué)的力量發(fā)揮到了極致匆背,讓數(shù)學(xué)用最好的方式來(lái)解決復(fù)雜的問(wèn)題钥顽。這兩種哲學(xué),不是硬幣的兩面靠汁,而是相互補(bǔ)充的。
金句
1. 其實(shí)在解決問(wèn)題時(shí)闽铐,過(guò)度地模仿卻不懂變通蝶怔,也是導(dǎo)致失敗的重要原因。就像當(dāng)年人們最開(kāi)始制造飛機(jī)時(shí)兄墅,總是想把飛機(jī)的機(jī)翼設(shè)計(jì)成鳥(niǎo)的翅膀踢星,通過(guò)上下擺動(dòng)來(lái)起飛。但是最后萊特兄弟制造出來(lái)的第一架飛機(jī)隙咸,靠的不是仿生學(xué)沐悦,而是空氣動(dòng)力學(xué)。
2. 雖然事物發(fā)展千變?nèi)f化五督,但處理它們的數(shù)學(xué)模型卻是相似藏否、甚至相同的,這種一致性充包,就是一種“數(shù)學(xué)之美”副签。
3. 牛頓曾經(jīng)說(shuō)過(guò),“真理在形式上從來(lái)都是簡(jiǎn)單的基矮,而不是復(fù)雜和含混不清的”淆储,數(shù)學(xué)之美也體現(xiàn)在這里。如果你能拿數(shù)學(xué)工具來(lái)解決問(wèn)題家浇,那么不管你的方法有多復(fù)雜本砰,這里面的基本思想都應(yīng)該是簡(jiǎn)單的。
4. 追求“術(shù)”的人钢悲,一輩子都會(huì)很辛苦点额,只有掌握了技術(shù)的本質(zhì)和精髓舔株,做事才能游刃有余。
5. 很多人的失敗咖楣,不是因?yàn)椴粌?yōu)秀督笆,而是方法不對(duì),如果一開(kāi)始就追求“高大全”诱贿,但是很長(zhǎng)時(shí)間都不能解決問(wèn)題娃肿,最后的結(jié)果反而會(huì)很差。