關(guān)于作者
吳軍,畢業(yè)于清華大學(xué)和約翰霍普金斯大學(xué)济锄,他有很多個身份暑椰。
他是硅谷投資人,豐元資本的創(chuàng)始合伙人荐绝,是著名的自然語言處理專家和搜索專家一汽,也是“得到”App專欄《硅谷來信》的主理人。他是谷歌的早期員工之一低滩,在谷歌期間領(lǐng)導(dǎo)參與了很多研發(fā)項目角虫,是谷歌中、日委造、韓搜索算法的發(fā)明人戳鹅。同時他還是位暢銷書作家,除了這本《數(shù)學(xué)之美》以外昏兆,還寫過《文明之光》《智能時代》《浪潮之巔》等多本暢銷書枫虏。
關(guān)于本書
在本書里,吳軍從他的親身經(jīng)歷出發(fā)爬虱,為我們介紹了數(shù)學(xué)在信息科學(xué)領(lǐng)域的種種應(yīng)用隶债,以及兩位著名的數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)智慧。通過這些實際案例跑筝,他為我們展示了數(shù)學(xué)和我們當(dāng)今生活的緊密聯(lián)系死讹,以及數(shù)學(xué)思想背后蘊含的簡單之美。
核心內(nèi)容
本書的核心思想是:數(shù)學(xué)和我們的生活聯(lián)系非常緊密曲梗,生活中很多意想不到的問題赞警,其實都能用數(shù)學(xué)方法來解決。數(shù)學(xué)能夠幫助我們跳出問題的表面現(xiàn)象,抓住事物發(fā)展背后的邏輯,從而用一種巧妙的方法去解決復(fù)雜的問題育叁;同時因為數(shù)學(xué)也具有簡單的一致性寨躁,這就讓我們經(jīng)常能用一種思想來解決不同種類的問題举户。而數(shù)學(xué)之美,就體現(xiàn)在這種實用和簡潔之中陵珍。
一非竿、數(shù)學(xué)能幫我們跳出表象琼蚯,抓住事物發(fā)展背后的邏輯
讓計算機能處理人類的語言是我們今天很多工作的基礎(chǔ)酬凳,所以科學(xué)家們很早就在這個問題上展開了研究。
其實最開始讓計算機處理語言的時候遭庶,科學(xué)家們按照仿生學(xué)的思路宁仔,堅持認(rèn)為,要讓機器學(xué)會翻譯或者語言識別罚拟,就必須像人一樣台诗,先讓計算機學(xué)會語法完箩。但是后來人們發(fā)現(xiàn)赐俗,語法規(guī)則實在是太多,根本沒有辦法窮盡弊知。這種方法在上個世紀(jì)70年代逐漸被證明是不可行的阻逮。
與此同時,著名計算機科學(xué)家賈里尼克和他領(lǐng)導(dǎo)的實驗室秩彤,發(fā)明了用統(tǒng)計學(xué)處理自然語言的方法叔扼,大大提高了語音識別的識別率和識別規(guī)模。他們的方法主要用了“馬爾科夫假設(shè)”漫雷, 這個假設(shè)是說瓜富,假定一個句子里每一個詞出現(xiàn)的概率,只和前一個詞有關(guān)降盹,就好比“漲陀敫蹋”這個詞,最有可能出現(xiàn)在“股票”之后蓄坏。那么价捧,只要給計算機量足夠大的機讀文本,計算機就能算出來涡戳,在一個特定詞后面出現(xiàn)某個詞的概率结蟋。這樣,只要把一句話里所有詞出現(xiàn)的概率相乘渔彰,就是這個句子出現(xiàn)的概率了嵌屎。概率最大的句子,就是我們需要的正確句子恍涂。
在解決問題時编整,過度地注意模仿卻不懂變通,也是導(dǎo)致失敗的重要原因乳丰。就像當(dāng)年人們最開始制造飛機時掌测,總是想把飛機的機翼設(shè)計成鳥的翅膀,但是最后萊特兄弟制造出來的第一架飛機,靠的不是仿生學(xué)汞斧,而是空氣動力學(xué)夜郁。所以說,不被事情的表面現(xiàn)象迷惑粘勒,是一種很重要的能力竞端,而數(shù)學(xué)就能幫我們跳出表象,抓住事物發(fā)展背后的邏輯庙睡。
二事富、數(shù)學(xué)的“一致性”體現(xiàn)著數(shù)學(xué)之美
余弦定理是一個揭示三角形邊角關(guān)系的重要數(shù)學(xué)定理,使用余弦定理乘陪,就可以僅憑三角形兩個邊的向量统台,計算出這兩個邊的夾角》纫兀科學(xué)家為了讓計算機能處理人類的語言贱勃,要先把新聞里的文字變成一組可以計算的數(shù)字,再設(shè)計一個算法谤逼,這樣就能讓計算機通過余弦定理贵扰,來算出任意兩篇新聞的相似性,從而確定新聞的分類流部。
新聞里的詞分為實詞和虛詞戚绕,“之乎者也的”這種虛詞對判斷新聞分類無益,就不考慮枝冀,而“股票”“利息”這種實詞舞丛,對判斷新聞分類很有幫助,是我們關(guān)注的重點宾茂,我們就要用這些實詞計算出一則新聞的特征向量瓷马。只要給每一則新聞都計算出其獨特的特征向量,再根據(jù)每一類新聞經(jīng)常出現(xiàn)的詞的特征跨晴,就可以判斷出任意一條新聞的分類欧聘。
在新聞分類的工作中,計算機不需要去理解每篇新聞端盆,只要找到同一類新聞的相似點就可以了怀骤,用余弦定理就能搞定,這就證明了數(shù)學(xué)的“一致性”焕妙。雖然事物發(fā)展千變?nèi)f化蒋伦,但處理它們的數(shù)學(xué)模型卻是相似、甚至相同的焚鹊。這種一致性痕届,就是一種“數(shù)學(xué)之美”。
三、數(shù)學(xué)的妙處就是研叫,一個好方法锤窑,常常也是最簡單明了的方法
現(xiàn)在我們每個人幾乎每天都會用到搜索引擎,它可以在極短的時間內(nèi)搜索到大量你需要的網(wǎng)頁嚷炉,這背后的關(guān)鍵就是數(shù)學(xué)渊啰。
搜索引擎背后的基本數(shù)學(xué)原理,其實特別簡單申屹。二進(jìn)制是世界上最簡單的計數(shù)方法绘证,因為二進(jìn)制只有0和1兩個數(shù)字,并且二進(jìn)制還可以表示邏輯里的“是”和“非”哗讥。布爾運算嚷那,就是一種針對二進(jìn)制的運算,它是19世紀(jì)英國的一名名叫布爾的數(shù)學(xué)家發(fā)明的忌栅,基本的運算只有“與”“或”“非”三種车酣,非常簡單曲稼。
搜索引擎會把用戶查詢的語句索绪,轉(zhuǎn)換成布爾運算的算式,看看搜索關(guān)鍵詞有沒有出現(xiàn)在這個網(wǎng)頁贫悄,1就代表出現(xiàn)瑞驱,0就代表沒出現(xiàn)。這樣一來窄坦,每個網(wǎng)頁就會轉(zhuǎn)換成一個數(shù)字唤反。最后只要把顯示為1的網(wǎng)頁拿出來,就是你要的搜索結(jié)果了鸭津。計算機做布爾運算的速度非惩蹋快,所以搜索引擎可以輕松地在很短的時間里搜索出大量網(wǎng)頁逆趋。
牛頓曾經(jīng)說過盏阶,“真理在形式上從來都是簡單的,而不是復(fù)雜和含混不清的”闻书。數(shù)學(xué)之美也體現(xiàn)在這里名斟,如果你能拿數(shù)學(xué)工具來解決問題,那么不管你的方法有多復(fù)雜魄眉,這里面的基本思想都應(yīng)該是簡單的砰盐。
四、兩位數(shù)學(xué)信息科學(xué)大師的數(shù)學(xué)思維
本書的作者吳軍認(rèn)為坑律,技術(shù)其實分為兩種岩梳,分別是“術(shù)”和“道”。“術(shù)”指的是具體做事的技藝和方法冀值,而“道”指的是做事的原理和原則淘捡。
這本書的目的是講“道”,而不是去講多么具體的“術(shù)”池摧。因為很多具體的技術(shù)很快就會變得落伍焦除。追求“術(shù)”的人,一輩子都會很辛苦作彤。只有掌握了技術(shù)的本質(zhì)和精髓膘魄,做事才能游刃有余。
第一位大師是阿米特·辛格竭讳。他是美國工程院院士创葡,谷歌公司內(nèi)的一位技術(shù)大神。辛格做事情的哲學(xué)绢慢,是先幫助用戶解決80%的問題灿渴,再慢慢解決剩下20%的問題,這就讓他總是能在較短的時間里較好的解決問題胰舆。阿米特·辛格還奉行簡單的哲學(xué)骚露,他認(rèn)為最簡單的東西往往是最好的。因為他認(rèn)為越簡單的事情越容易解釋道理缚窿,這樣可以方便查找錯誤棘幸。
第二位大師是邁克爾·柯林斯,他是一個擅長用數(shù)學(xué)把工作做到極致的人倦零∥笮柯林斯的哲學(xué)是追求極致和完美。比如他曾經(jīng)設(shè)計了一個幫助計算機處理自然語言的分析器扫茅,目的不是為了驗證什么理論蹋嵌,而僅僅是為了做出世界上最好的分析器『叮柯林斯的特點栽烂,就是把事情做到極致。他并不是刻意去追求繁瑣和復(fù)雜停蕉,也不是和阿米特·辛格完全對立愕鼓,他只是在追求數(shù)學(xué)上的嚴(yán)謹(jǐn)和完美。
不管是阿米特·辛格的簡單哲學(xué)慧起,還是邁克爾·柯林斯的完美哲學(xué)菇晃,都把數(shù)學(xué)的力量發(fā)揮到了極致,讓數(shù)學(xué)用最好的方式來解決復(fù)雜的問題蚓挤。這兩種哲學(xué)磺送,不是硬幣的兩面驻子,而是相互補充的。
金句
1. 其實在解決問題時估灿,過度地模仿卻不懂變通崇呵,也是導(dǎo)致失敗的重要原因。就像當(dāng)年人們最開始制造飛機時馅袁,總是想把飛機的機翼設(shè)計成鳥的翅膀域慷,通過上下擺動來起飛。但是最后萊特兄弟制造出來的第一架飛機汗销,靠的不是仿生學(xué)犹褒,而是空氣動力學(xué)。
2. 雖然事物發(fā)展千變?nèi)f化弛针,但處理它們的數(shù)學(xué)模型卻是相似叠骑、甚至相同的,這種一致性削茁,就是一種“數(shù)學(xué)之美”宙枷。
3. 牛頓曾經(jīng)說過,“真理在形式上從來都是簡單的茧跋,而不是復(fù)雜和含混不清的”慰丛,數(shù)學(xué)之美也體現(xiàn)在這里。如果你能拿數(shù)學(xué)工具來解決問題厌衔,那么不管你的方法有多復(fù)雜璧帝,這里面的基本思想都應(yīng)該是簡單的捍岳。
4. 追求“術(shù)”的人富寿,一輩子都會很辛苦,只有掌握了技術(shù)的本質(zhì)和精髓锣夹,做事才能游刃有余页徐。
5. 很多人的失敗,不是因為不優(yōu)秀银萍,而是方法不對变勇,如果一開始就追求“高大全”,但是很長時間都不能解決問題贴唇,最后的結(jié)果反而會很差搀绣。
撰稿:田正賡
腦圖:摩西