關(guān)于作者
吳軍稚叹,畢業(yè)于清華大學(xué)和約翰霍普金斯大學(xué)焰薄,他有很多個(gè)身份。
他是硅谷投資人扒袖,豐元資本的創(chuàng)始合伙人塞茅,是著名的自然語言處理專家和搜索專家,也是“得到”App專欄《硅谷來信》的主理人季率。他是谷歌的早期員工之一野瘦,在谷歌期間領(lǐng)導(dǎo)參與了很多研發(fā)項(xiàng)目,是谷歌中、日鞭光、韓搜索算法的發(fā)明人吏廉。同時(shí)他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外惰许,還寫過《文明之光》《智能時(shí)代》《浪潮之巔》等多本暢銷書席覆。
關(guān)于本書
在本書里,吳軍從他的親身經(jīng)歷出發(fā)汹买,為我們介紹了數(shù)學(xué)在信息科學(xué)領(lǐng)域的種種應(yīng)用佩伤,以及兩位著名的數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)智慧。通過這些實(shí)際案例晦毙,他為我們展示了數(shù)學(xué)和我們當(dāng)今生活的緊密聯(lián)系畦戒,以及數(shù)學(xué)思想背后蘊(yùn)含的簡(jiǎn)單之美。
核心內(nèi)容
本書的核心思想是:數(shù)學(xué)和我們的生活聯(lián)系非常緊密结序,生活中很多意想不到的問題障斋,其實(shí)都能用數(shù)學(xué)方法來解決。數(shù)學(xué)能夠幫助我們跳出問題的表面現(xiàn)象徐鹤,抓住事物發(fā)展背后的邏輯垃环,從而用一種巧妙的方法去解決復(fù)雜的問題;同時(shí)因?yàn)閿?shù)學(xué)也具有簡(jiǎn)單的一致性返敬,這就讓我們經(jīng)常能用一種思想來解決不同種類的問題遂庄。而數(shù)學(xué)之美,就體現(xiàn)在這種實(shí)用和簡(jiǎn)潔之中劲赠。
一涛目、數(shù)學(xué)能幫我們跳出表象,抓住事物發(fā)展背后的邏輯
讓計(jì)算機(jī)能處理人類的語言是我們今天很多工作的基礎(chǔ)凛澎,所以科學(xué)家們很早就在這個(gè)問題上展開了研究霹肝。
其實(shí)最開始讓計(jì)算機(jī)處理語言的時(shí)候,科學(xué)家們按照仿生學(xué)的思路塑煎,堅(jiān)持認(rèn)為沫换,要讓機(jī)器學(xué)會(huì)翻譯或者語言識(shí)別,就必須像人一樣最铁,先讓計(jì)算機(jī)學(xué)會(huì)語法讯赏。但是后來人們發(fā)現(xiàn),語法規(guī)則實(shí)在是太多冷尉,根本沒有辦法窮盡漱挎。這種方法在上個(gè)世紀(jì)70年代逐漸被證明是不可行的。
與此同時(shí)雀哨,著名計(jì)算機(jī)科學(xué)家賈里尼克和他領(lǐng)導(dǎo)的實(shí)驗(yàn)室磕谅,發(fā)明了用統(tǒng)計(jì)學(xué)處理自然語言的方法,大大提高了語音識(shí)別的識(shí)別率和識(shí)別規(guī)模。他們的方法主要用了“馬爾科夫假設(shè)”怜庸, 這個(gè)假設(shè)是說,假定一個(gè)句子里每一個(gè)詞出現(xiàn)的概率垢村,只和前一個(gè)詞有關(guān)割疾,就好比“漲停”這個(gè)詞嘉栓,最有可能出現(xiàn)在“股票”之后宏榕。那么,只要給計(jì)算機(jī)量足夠大的機(jī)讀文本侵佃,計(jì)算機(jī)就能算出來麻昼,在一個(gè)特定詞后面出現(xiàn)某個(gè)詞的概率。這樣馋辈,只要把一句話里所有詞出現(xiàn)的概率相乘抚芦,就是這個(gè)句子出現(xiàn)的概率了。概率最大的句子迈螟,就是我們需要的正確句子叉抡。
在解決問題時(shí),過度地注意模仿卻不懂變通答毫,也是導(dǎo)致失敗的重要原因褥民。就像當(dāng)年人們最開始制造飛機(jī)時(shí),總是想把飛機(jī)的機(jī)翼設(shè)計(jì)成鳥的翅膀洗搂,但是最后萊特兄弟制造出來的第一架飛機(jī)消返,靠的不是仿生學(xué),而是空氣動(dòng)力學(xué)耘拇。所以說撵颊,不被事情的表面現(xiàn)象迷惑,是一種很重要的能力惫叛,而數(shù)學(xué)就能幫我們跳出表象秦驯,抓住事物發(fā)展背后的邏輯。
二挣棕、數(shù)學(xué)的“一致性”體現(xiàn)著數(shù)學(xué)之美
余弦定理是一個(gè)揭示三角形邊角關(guān)系的重要數(shù)學(xué)定理译隘,使用余弦定理,就可以僅憑三角形兩個(gè)邊的向量洛心,計(jì)算出這兩個(gè)邊的夾角固耘。科學(xué)家為了讓計(jì)算機(jī)能處理人類的語言词身,要先把新聞里的文字變成一組可以計(jì)算的數(shù)字厅目,再設(shè)計(jì)一個(gè)算法,這樣就能讓計(jì)算機(jī)通過余弦定理,來算出任意兩篇新聞的相似性损敷,從而確定新聞的分類葫笼。
新聞里的詞分為實(shí)詞和虛詞,“之乎者也的”這種虛詞對(duì)判斷新聞分類無益拗馒,就不考慮路星,而“股票”“利息”這種實(shí)詞,對(duì)判斷新聞分類很有幫助诱桂,是我們關(guān)注的重點(diǎn)洋丐,我們就要用這些實(shí)詞計(jì)算出一則新聞的特征向量。只要給每一則新聞都計(jì)算出其獨(dú)特的特征向量挥等,再根據(jù)每一類新聞經(jīng)常出現(xiàn)的詞的特征友绝,就可以判斷出任意一條新聞的分類。
在新聞分類的工作中肝劲,計(jì)算機(jī)不需要去理解每篇新聞迁客,只要找到同一類新聞的相似點(diǎn)就可以了,用余弦定理就能搞定辞槐,這就證明了數(shù)學(xué)的“一致性”哲泊。雖然事物發(fā)展千變?nèi)f化,但處理它們的數(shù)學(xué)模型卻是相似催蝗、甚至相同的切威。這種一致性,就是一種“數(shù)學(xué)之美”丙号。
三先朦、數(shù)學(xué)的妙處就是,一個(gè)好方法犬缨,常常也是最簡(jiǎn)單明了的方法
現(xiàn)在我們每個(gè)人幾乎每天都會(huì)用到搜索引擎喳魏,它可以在極短的時(shí)間內(nèi)搜索到大量你需要的網(wǎng)頁,這背后的關(guān)鍵就是數(shù)學(xué)怀薛。
搜索引擎背后的基本數(shù)學(xué)原理刺彩,其實(shí)特別簡(jiǎn)單。二進(jìn)制是世界上最簡(jiǎn)單的計(jì)數(shù)方法枝恋,因?yàn)槎M(jìn)制只有0和1兩個(gè)數(shù)字创倔,并且二進(jìn)制還可以表示邏輯里的“是”和“非”。布爾運(yùn)算焚碌,就是一種針對(duì)二進(jìn)制的運(yùn)算畦攘,它是19世紀(jì)英國(guó)的一名名叫布爾的數(shù)學(xué)家發(fā)明的,基本的運(yùn)算只有“與”“或”“非”三種十电,非常簡(jiǎn)單知押。
搜索引擎會(huì)把用戶查詢的語句叹螟,轉(zhuǎn)換成布爾運(yùn)算的算式,看看搜索關(guān)鍵詞有沒有出現(xiàn)在這個(gè)網(wǎng)頁台盯,1就代表出現(xiàn)罢绽,0就代表沒出現(xiàn)。這樣一來静盅,每個(gè)網(wǎng)頁就會(huì)轉(zhuǎn)換成一個(gè)數(shù)字良价。最后只要把顯示為1的網(wǎng)頁拿出來,就是你要的搜索結(jié)果了温亲。計(jì)算機(jī)做布爾運(yùn)算的速度非撑锉冢快杯矩,所以搜索引擎可以輕松地在很短的時(shí)間里搜索出大量網(wǎng)頁栈虚。
牛頓曾經(jīng)說過,“真理在形式上從來都是簡(jiǎn)單的史隆,而不是復(fù)雜和含混不清的”魂务。數(shù)學(xué)之美也體現(xiàn)在這里,如果你能拿數(shù)學(xué)工具來解決問題泌射,那么不管你的方法有多復(fù)雜粘姜,這里面的基本思想都應(yīng)該是簡(jiǎn)單的。
四熔酷、兩位數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)思維
本書的作者吳軍認(rèn)為孤紧,技術(shù)其實(shí)分為兩種,分別是“術(shù)”和“道”拒秘『畔裕“術(shù)”指的是具體做事的技藝和方法,而“道”指的是做事的原理和原則躺酒。
這本書的目的是講“道”押蚤,而不是去講多么具體的“術(shù)”。因?yàn)楹芏嗑唧w的技術(shù)很快就會(huì)變得落伍羹应。追求“術(shù)”的人,一輩子都會(huì)很辛苦。只有掌握了技術(shù)的本質(zhì)和精髓掀宋,做事才能游刃有余戚丸。
第一位大師是阿米特·辛格。他是美國(guó)工程院院士裸违,谷歌公司內(nèi)的一位技術(shù)大神煞烫。辛格做事情的哲學(xué),是先幫助用戶解決80%的問題累颂,再慢慢解決剩下20%的問題滞详,這就讓他總是能在較短的時(shí)間里較好的解決問題凛俱。阿米特·辛格還奉行簡(jiǎn)單的哲學(xué),他認(rèn)為最簡(jiǎn)單的東西往往是最好的料饥。因?yàn)樗J(rèn)為越簡(jiǎn)單的事情越容易解釋道理蒲犬,這樣可以方便查找錯(cuò)誤。
第二位大師是邁克爾·柯林斯岸啡,他是一個(gè)擅長(zhǎng)用數(shù)學(xué)把工作做到極致的人原叮。柯林斯的哲學(xué)是追求極致和完美巡蘸。比如他曾經(jīng)設(shè)計(jì)了一個(gè)幫助計(jì)算機(jī)處理自然語言的分析器奋隶,目的不是為了驗(yàn)證什么理論,而僅僅是為了做出世界上最好的分析器悦荒∥ㄐ溃柯林斯的特點(diǎn),就是把事情做到極致搬味。他并不是刻意去追求繁瑣和復(fù)雜境氢,也不是和阿米特·辛格完全對(duì)立,他只是在追求數(shù)學(xué)上的嚴(yán)謹(jǐn)和完美碰纬。
不管是阿米特·辛格的簡(jiǎn)單哲學(xué)萍聊,還是邁克爾·柯林斯的完美哲學(xué),都把數(shù)學(xué)的力量發(fā)揮到了極致悦析,讓數(shù)學(xué)用最好的方式來解決復(fù)雜的問題寿桨。這兩種哲學(xué),不是硬幣的兩面强戴,而是相互補(bǔ)充的亭螟。
金句
1. 其實(shí)在解決問題時(shí),過度地模仿卻不懂變通酌泰,也是導(dǎo)致失敗的重要原因媒佣。就像當(dāng)年人們最開始制造飛機(jī)時(shí),總是想把飛機(jī)的機(jī)翼設(shè)計(jì)成鳥的翅膀陵刹,通過上下擺動(dòng)來起飛默伍。但是最后萊特兄弟制造出來的第一架飛機(jī),靠的不是仿生學(xué)衰琐,而是空氣動(dòng)力學(xué)也糊。
2. 雖然事物發(fā)展千變?nèi)f化,但處理它們的數(shù)學(xué)模型卻是相似羡宙、甚至相同的狸剃,這種一致性,就是一種“數(shù)學(xué)之美”狗热。
3. 牛頓曾經(jīng)說過钞馁,“真理在形式上從來都是簡(jiǎn)單的虑省,而不是復(fù)雜和含混不清的”,數(shù)學(xué)之美也體現(xiàn)在這里僧凰。如果你能拿數(shù)學(xué)工具來解決問題探颈,那么不管你的方法有多復(fù)雜,這里面的基本思想都應(yīng)該是簡(jiǎn)單的训措。
4. 追求“術(shù)”的人伪节,一輩子都會(huì)很辛苦,只有掌握了技術(shù)的本質(zhì)和精髓绩鸣,做事才能游刃有余怀大。
5. 很多人的失敗,不是因?yàn)椴粌?yōu)秀呀闻,而是方法不對(duì)化借,如果一開始就追求“高大全”,但是很長(zhǎng)時(shí)間都不能解決問題总珠,最后的結(jié)果反而會(huì)很差屏鳍。