作者介紹
楊德升驹愚,周伯通招聘CTO译秦。歷任開源 SNS 社區(qū) ThinkSNS 核心工程師峡捡、115 網(wǎng)盤高級 iOS 工程師等職位,2013年6月至今筑悴,任周伯通招聘CTO们拙,負責周伯通招聘的產品和技術團隊。
作者的微信公眾號:Focused(ID:stay-focused)阁吝。
作者的個人微信號:yisheng砚婆。
如果我們把資本和機械動能作為大航海時代以來全球近代化的推動力,那么數(shù)據(jù)將成為下一次技術革命和社會變革的核心動力突勇。我們要在這樣一個高度上理解大數(shù)據(jù)装盯,以及由它帶來的全球智能革命。
從《浪潮之巔》開始甲馋,吳軍老師的書幾乎每本都有讀過埂奈,除了感嘆他寫書的速度已經(jīng)超過很多人的讀書速度外,每本書的質量還給人以智商被碾壓的快感定躏。要說吳軍老師的哪本書帶給我的沖擊最大账磺,我只服這本《智能時代》,尤其是配合閱讀《數(shù)學之美(第二版)》效果更佳痊远!
每一本好書都會讓人進步些許垮抗,或者增強技能,或者開闊視野碧聪,或者愉悅精神冒版,而這本《智能時代》帶來的是認知方式和思維方式的崩塌,給人的是「還好讀了這本書」的后怕感逞姿。
我讀《智能時代》大概經(jīng)歷三個步驟:開篇講大數(shù)據(jù)思維與傳統(tǒng)機械思維的差異壤玫,讓人醍醐灌頂豁护;中篇講技術、方法與挑戰(zhàn)欲间,是一個很好引導與總結楚里;結尾講對社會結構的沖擊,讓人倒吸一口涼氣猎贴。
如果只選三個最讓我印象深刻的結論班缎,我會選擇:
機器智能的革命:從規(guī)則到統(tǒng)計
思維的革命:從機械思維到大數(shù)據(jù)思維
智能革命和未來社會
這篇讀書筆記嘗試總結說明以上三點,詳細內容強烈推薦各位讀原作她渴,有理論說明达址,有數(shù)學推演,絕對讓你不虛此行趁耗。
1. 機器智能的革命:從規(guī)則到統(tǒng)計
從珠算時代開始沉唠,各式能夠輔助計算的機器一直在進化,而真正給機器智能以科學解釋的是阿蘭·圖靈博士苛败。圖靈于 1950 年在《思想》雜志上發(fā)表的題為《計算的機器和智能》的論文满葛,提出一種驗證機器有無智能的判別方法,即大家都熟悉的圖靈測試(Turing Test)罢屈。具體說就是:讓一臺機器和一個人坐在幕后嘀韧,讓一個裁判同時與幕后的機器和人進行交流,如果這個裁判無法判斷自己交流的對象是人還是機器缠捌,就說明這臺機器有了和人同等的智能锄贷。
圖靈(圖片來自wikipedia.com)
今天計算機已經(jīng)能做到花式智能,比如:語音識別曼月、機器翻譯谊却、文本的自動摘要和寫作、戰(zhàn)勝圍棋和德?lián)涔谲娧魄邸⒆詣踊卮饐栴}等等炎辨,但是人類走到這一步之前先繞了十幾年的彎路。
人工智能 1.0:基于規(guī)則
人類在幾千年前就夢想著飛行绩衷,于是就開始模仿鳥的飛行方式蹦魔,將鳥的羽毛做成翅膀綁在胳膊上就從山上往下跳,然后就悲劇了咳燕。后來人們把這種方法論稱作「鳥飛派」勿决,也就是看看鳥是如何飛的,就能造出飛機招盲,而不需要了解空氣動力學低缩。
人工智能研究開始的十幾年就是典型「鳥飛派」的做法。為了讓計算機理解人類語言,計算機科學家與語言學家開始結伴研究咆繁,普遍采用基于語法規(guī)則和語義規(guī)則的方法讳推,即通過字典和算法對語句做語法分析、上下文語境分析玩般,并得到語句的語法分析樹银觅。
結果如大家所見,經(jīng)過十幾年的研究坏为,科學家發(fā)現(xiàn)人工智能的局限性明顯究驴,除了做出幾個了簡單的「玩具」,比如讓機器人像猴子一樣摘香蕉匀伏,解決不了什么實際問題洒忧。20 世紀 70 年代初,全球最好的語音識別系統(tǒng)的識別率只有 70% 左右够颠,而且要求講話者要口齒清晰熙侍,沒有噪聲。
人工智能 2.0:基于統(tǒng)計
20 世紀 70 年代履磨,人類開始嘗試機器智能的另一條發(fā)展道路蛉抓,即采用數(shù)據(jù)驅動和超級計算的方法,即把智能問題變成數(shù)據(jù)問題蹬耘。
我們都知道可以用抽樣來估計整體的概率分布芝雪,那么這個方法有沒有理論基礎呢减余?19 世紀的俄國科學家切比雪夫給出了肯定的回答综苔,他得出這樣一個不等式,也稱作切比雪夫不等式:
這個公式的含義是位岔,當樣本足夠多時如筛,一個隨機變量(比如觀察到的中國大學生的男女比例)和它的數(shù)學期望值(比如真實情況下的中國大學生男女比例)之間的誤差可以無限小。
在大多數(shù)復雜的智能應用中抒抬,除了用統(tǒng)計數(shù)據(jù)做一些加減乘除外杨刨,還需要建立起一個數(shù)學模型才可能在實際中使用。要建立數(shù)學模型需要解決兩個問題擦剑,首先是采用什么樣的模型妖胀,其次是模型的參數(shù)是多少。鑒于完美的模型未必存在惠勒,即便存在赚抡,找到它也非常不容易而且很費時間,工程上常常采用多而簡單的模型纠屋,只要數(shù)據(jù)樣本足夠多涂臣,它可以取代一個復雜的模型。這種方法被稱為數(shù)據(jù)驅動的方法售担,因為它是先有大量的數(shù)據(jù)赁遗,而不是預設的模型署辉,然后用很多簡單的模型去契合數(shù)據(jù)。
數(shù)據(jù)驅動的方法想要成功岩四,除了數(shù)據(jù)量足夠大外哭尝,還需要一個大前提,那就是樣本必須非常具有代表性剖煌。這句話出現(xiàn)在所有統(tǒng)計學的教科書里刚夺,但是在現(xiàn)實生活中達成這個前提是何其困難。這時末捣,一舉解決這個問題「大數(shù)據(jù)」出場了侠姑,大數(shù)據(jù)不僅僅能做到具有代表性,而且能做到數(shù)據(jù)全量箩做!關于大數(shù)據(jù)的介紹莽红,請參看原作,這里不贅述邦邦。
By the way安吁,李開復就是在這樣的背景下,在傳統(tǒng)的人工智能實驗室里燃辖,采用基于統(tǒng)計的方法開展他的博士論文的工作鬼店,并最終和洪小文一起構建了世界上第一個大詞匯量、非特定人黔龟、連續(xù)語音識別系統(tǒng)妇智。
2. 思維的革命:從機械思維到大數(shù)據(jù)思維
就像量子物理學的思維邏輯與經(jīng)典物理學的思維邏輯完全不同一樣,在方法論層面氏身,大數(shù)據(jù)時代需要也一定會出現(xiàn)一種全新的思維方式巍棱。
機械思維
今天談到「機械思維」,很多人腦海中的印象是死板蛋欣、僵化航徙,但是在兩個世紀之前,這是一個時髦的詞匯陷虎。毫不夸張的說到踏,在過去的三個世紀里,機械思維算得上是人類總結出的最重要的思維方式尚猿。
舉個青霉素的栗子窝稿,大家就明白什么是「機械思維」了。
19 世紀中期谊路,科學家發(fā)現(xiàn)生物細菌會導致很多疾病讹躯,運用因果關系,人們很容易想到殺死細菌就能治好疾病。不過潮梯,后來英國醫(yī)生弗萊明等人發(fā)現(xiàn)骗灶,把消毒劑涂抹在傷員傷口上并不管用,因此就尋找能夠從人體內殺菌的物質秉馏,并最終在1928 年發(fā)現(xiàn)青霉素耙旦,但是他并知道青霉素的殺菌原理,也沒有能力濃縮和提取其有效成分萝究。1943 年牛津大學的科學家搞清楚了青霉素中的一種物質(青霉烷)能夠破壞細菌的細胞壁免都,而人類和動物的細胞沒有細胞壁,這就達到了其殺菌而對動物無傷害的作用帆竹。1945 年绕娘,女科學家多蘿西·霍奇金搞清楚了青霉烷的分子結構(并因此獲得諾貝爾獎),這樣到了 1957 年人類終于可以人工合成青霉素栽连。再之后险领,亞伯拉罕基于對青霉烷的分子結構的改進,發(fā)明了頭孢類的新型抗生素秒紧。直到今天绢陌,制藥行業(yè)的核心方法都遵循「研究病理找到真正致病的原因,然后針對這個原因找到解決方案」熔恢。
簡單的說脐湾,機械思維就是「分析現(xiàn)象找到原因,根據(jù)原因得到結果」的思維叙淌,「知其然秤掌,知其所以然」的思維。
抽象的說凿菩,機械思維就是因果邏輯推理思維机杜。
歐幾里得最大的成就不是發(fā)現(xiàn)了幾何定理帜讲,而是創(chuàng)立了公理化體系的幾何學衅谷。在歐幾里得的幾何學中,他首先總結出 5 條簡單得不能再簡單似将、相互獨立获黔、不證自明的公設,接下來幾何學的一切定理都由這 5 條公設直接或間接地演繹得出在验。歐幾里得這種基于邏輯推理的公理化體系對西方人的整個思維方式具有極大的影響玷氏,甚至整個羅馬法的演進都是建立在這個的基礎上,之后牛頓又把這一科學體系擴展到自然科學領域腋舌。最終盏触,機械思維直接帶來工業(yè)大發(fā)明時代和全球化時代。
歐幾里得(圖片來自wikipedia.com)
大數(shù)據(jù)思維
與機械思維相對的這個詞,書里并沒有明確的給出來赞辩,想來想去我選擇了「大數(shù)據(jù)思維」這個略微模糊的詞匯雌芽,因為它囊括了智能時代的所有重要概念,比如強相關性辨嗽、不確定性等等世落。
首先,就像量子物理之于經(jīng)典物理的首要特征是測不準原理和因果關系的崩塌一樣糟需,我們必須承認我們這個客觀世界的不確定性屉佳,今天面臨的復雜情況已經(jīng)不是機械時代用幾個定律就能講清楚的(至于為什么,請看書里的詳細解釋)洲押。
按照香農的信息論武花,信息和數(shù)據(jù)是能夠消除不確定性的,那么很多智能問題也就變成了數(shù)據(jù)問題杈帐,這樣我們也就不難理解為什么大數(shù)據(jù)的出現(xiàn)能夠解決智能問題了髓堪。在不確定性的世界里,如果我們依然能夠找到確定性和因果關系娘荡,這自然是最好的結果干旁。在無法確定因果關系時,數(shù)據(jù)為我們提供了解決問題的新方法炮沐,數(shù)據(jù)之間的強相關性在某種程度上可以取代原來的因果關系争群,幫助我們得到我們想要的答案,這便是大數(shù)據(jù)思維的核心大年。當然换薄,大數(shù)據(jù)思維并非是完全取代機械思維,兩者并非完全對立翔试,前者更多是后者的補充轻要。
香農(圖片來源dajia.qq.com)
從因果關系到強相關性關系的思維轉換,書中介紹了不少案例幫助理解垦缅,比如檢察院如何證明煙草公司有罪當懲冲泥、警方如何高效查處毒品種植等等,這里不再贅述壁涎。
3. 智能革命和未來社會
放眼歷史長河凡恍,一項技術帶動整個社會發(fā)生變革的事情時常發(fā)生,書中給出一個通用的模式怔球,即:
新技術 + 原有產業(yè) = 新產業(yè)
歷史上可以套在這個公式中的技術大家都很熟悉了嚼酝,包括蒸汽機、電竟坛、計算機信息技術闽巩、摩爾定律钧舌、互聯(lián)網(wǎng)等等,而放眼未來涎跨,即將被套入這個公式的新技術則是大數(shù)據(jù)和機器智能兩個詞匯延刘。依據(jù)這個公式,吳軍老師展望了未來的農業(yè)六敬、體育碘赖、制造業(yè)等行業(yè)的發(fā)展形態(tài),其中體育業(yè)的例子尤為讓人印象深刻外构。
在 2015 - 2016 年的 NBA 賽季普泡,位于硅谷地區(qū)的金州勇士隊創(chuàng)造了 NBA 歷史常規(guī)賽獲勝率最高的記錄,在 82 場比賽中獲勝 73 場(此前的記錄是喬丹時代的公牛隊保持)审编,同時還創(chuàng)下主場 54 連勝的記錄撼班。熟悉 NBA 的朋友都知道,勇士隊長期以來都是聯(lián)盟的傳統(tǒng)爛隊垒酬,2009 賽季更是全聯(lián)盟排名倒數(shù)第二砰嘁。那是什么讓它如此突飛猛進呢?
一般情況下勘究,一個弱隊的崛起主要是靠老板財大氣粗矮湘,砸錢買球星和金牌教練,然后花式做廣告招攬球迷口糕,中國的恒大足球隊就是這個策略缅阳。但是,金州勇士隊的翻身卻不是靠砸錢景描,而是因為它的地理位置 -- 硅谷十办!
圖片來源 agzhibo.com
在勇士隊管理層背后,有一支工程師團隊利用大數(shù)據(jù)制定球隊的發(fā)展戰(zhàn)略和比賽戰(zhàn)術超棺,管理層堅持用數(shù)據(jù)說話向族,而非憑經(jīng)驗。根據(jù)對歷年來 NBA 比賽的數(shù)據(jù)分析的結果棠绘,管理層發(fā)現(xiàn)NBA 幾十年來一直追求制空權的打法(比如喬丹件相、姚明)是低效甚至錯誤的,最有效的進攻是眼花繚亂的傳球和準確的投籃弄唧,而不是彰顯個人能力的突破和扣籃适肠。在這個思想的指導下,勇士隊甚至賣掉球隊所剩無幾的「低效」球星候引,著重培養(yǎng)自己看中的新人,而首先被選中的就是現(xiàn)在已家喻戶曉的斯蒂芬·庫里敦跌。跟大腕相比澄干,各項數(shù)據(jù)都相形見絀的庫里之所以被重用逛揩,是因為他有一個特長,那就是投籃精準麸俘。正式對這個策略的高效執(zhí)行辩稽,讓勇士隊、庫里从媚、湯普森大展神威逞泄,拿下殊榮無數(shù)。除了利用數(shù)據(jù)制定球隊戰(zhàn)略拜效,勇士隊還利用實時數(shù)據(jù)及時調整比賽中的戰(zhàn)術喷众,甚至可以幫助球隊改進精細到兩個人配合的細節(jié)。
鑒于勇士隊的戰(zhàn)術和成績帶給 NBA 的巨大沖擊紧憾,奧巴馬在白宮專門接見了勇士隊員到千,籃球界的人士也將勇士隊稱為 NBA 里的 Google。
總 ? 結
大數(shù)據(jù)導致機器智能革命的到來赴穗,這對未來社會的影響將是全方位憔四、全行業(yè)、立體式的般眉。任何一次技術革命了赵,最初受益的都是理解它、使用它甸赃、發(fā)展它的人斟览,而遠離它、拒絕它的人辑奈,在很長的時間里都將是迷茫的一代苛茂。在智能革命到來之際,作為人和企業(yè)無疑應該擁抱它鸠窗,讓自己成為那 2% 的受益者妓羊。
關注EGONetworks公眾號,獲取更多有關好書和技術領導者的文章稍计。