機(jī)器學(xué)習(xí)在這幾年都非常熱臀稚,被冠以人工智能 AI 之名,非常吸引眼球三痰。大家都在談?wù)摶蛩伎妓降滓馕吨裁窗伤拢瑫?huì)給我們帶來什么樣的影響?
硅谷著名科技投資家及分析師 Benedict Evans 6月發(fā)表了一篇 Ways to think about machine learning 的文章(鏈接可點(diǎn)閱讀原文)散劫,分享了他如何看待和理解機(jī)器學(xué)習(xí)的稚机,非常務(wù)實(shí)。36kr 也編譯了中文版获搏,推薦給大家赖条。
為什么要學(xué)習(xí)和了解機(jī)器學(xué)習(xí)?
Benedict Evans?認(rèn)為常熙,最終幾乎所有的東西都會(huì)有機(jī)器學(xué)習(xí)纬乍,到那時(shí)人們對(duì)機(jī)器學(xué)習(xí)已經(jīng)是習(xí)以為常、見怪不怪了裸卫。到這一步還有多久呢仿贬?10-15年。
這不禁讓人思考:這10年墓贿,我們能利用這個(gè)契機(jī)在各自的領(lǐng)域做點(diǎn)什么呢诅蝶?正如以往的各種技術(shù)浪潮興起時(shí),比如工業(yè)革命募壕、電力革命调炬、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)舱馅,還有作者在文中說到的關(guān)系數(shù)據(jù)庫技術(shù)等缰泡,那時(shí)各領(lǐng)域的創(chuàng)新者們都是如何響應(yīng)的呢?
如果希望10年后能在自己的領(lǐng)域有所影響力的代嗤,利用機(jī)器學(xué)習(xí)應(yīng)該是一個(gè)好的機(jī)會(huì)棘钞。跟自己相關(guān)的是學(xué)習(xí)領(lǐng)域,所以如何利用機(jī)器學(xué)習(xí)來提升學(xué)習(xí)的效率干毅,是這一年多來在探索的命題宜猜。
假若10年機(jī)器學(xué)習(xí)技術(shù)真的對(duì)人類的學(xué)習(xí)方式、方法及效率帶了本質(zhì)的改變硝逢,希望其中能有一點(diǎn)自己的貢獻(xiàn)姨拥。
下面是學(xué)習(xí) Benedict Evans 這篇文章記的筆記以及自己的一點(diǎn)思考绅喉。
討論機(jī)器學(xué)習(xí)務(wù)實(shí)方式
機(jī)器學(xué)習(xí)又被稱作“人工智能 (AI)”。這個(gè)名字有好有不好叫乌。好的方面是柴罐,很容易抓眼球,獲得大家(包括投資人)的注意力憨奸。不好的是革屠,容易跑偏。大家容易想象成一種具有通用智能的東西排宰。
作者舉了很好的例子:
在自動(dòng)化的每一波浪潮中似芝,我們都想象我們正在創(chuàng)造一些擬人化的東西或具有通用智能的東西。在上世紀(jì)20板甘、30年代国觉,我們想象鋼鐵俠拿著錘子在工廠里走來走去,在50年代虾啦,我們想象人形機(jī)器人在廚房里走來走去做家務(wù)麻诀。但我們沒有機(jī)器人仆人,我們有用來清洗的機(jī)器傲醉。
所以“人工智能將接管所有的工作” “數(shù)據(jù)是新的石油” 類似的話題都過于高屋建瓴蝇闭,對(duì)深入理解機(jī)器學(xué)習(xí)并無益處。
更務(wù)實(shí)且有助于理解和解決問題的方式應(yīng)該是:機(jī)器學(xué)習(xí)可以看作是另一種意義上的自動(dòng)化硬毕,在概念上跟傳送帶或取放機(jī)并沒有什么不同呻引。它每次只能解決一個(gè)單一問題,每個(gè)問題都需要不同的實(shí)現(xiàn)方式吐咳、不同的數(shù)據(jù)逻悠、不同的路徑,而且往往需要不同的公司韭脊。洗碗機(jī)洗碗童谒,洗衣機(jī)洗衣服,機(jī)器學(xué)習(xí)跟它們一樣沪羔,都是自動(dòng)化的一部分饥伊。
找到機(jī)器學(xué)習(xí)應(yīng)用場景的兩套工具
作者在文中提供了兩個(gè)思維角度,來尋找具體產(chǎn)品中機(jī)器學(xué)習(xí)的應(yīng)用場景蔫饰。
工具一:從數(shù)據(jù)和要解決的問題的類型上來思考琅豆,主要有三類:
(1)如果你有相關(guān)數(shù)據(jù),機(jī)器學(xué)習(xí)可以提供更好的結(jié)果(數(shù)據(jù)分析)
比如:Instacar 公司建立了一個(gè)系統(tǒng)篓吁,來優(yōu)化個(gè)人購物者在超市中的路線茫因,結(jié)果是相關(guān)超市有50%的提升。這是由三名工程師利用谷歌的開源工具 Keras 和 Tensorflow 建立的杖剪。
(2)機(jī)器學(xué)習(xí)可以對(duì)已有數(shù)據(jù)提出新的問題(數(shù)據(jù)挖掘)
比如:就像正在找線索的律師冻押,可以通過尋找有關(guān)“憤怒的”或“焦慮的”以及其他異常的線索驰贷,帶來新的發(fā)現(xiàn)。
(3)機(jī)器學(xué)習(xí)可以用來直接分析音頻翼雀、圖像或視頻數(shù)據(jù),以前無法做到孩擂。這意味著圖像傳感器和麥克風(fēng)變成了一種全新的輸入機(jī)制(增加可分析數(shù)據(jù)類型)
比如:一家為汽車公司提供座椅的公司狼渊,在一個(gè)便宜的DSP芯片上安裝了一個(gè)神經(jīng)網(wǎng)絡(luò),并配有一個(gè)便宜的智能手機(jī)圖像傳感器类垦,用來檢測面料是否有褶皺狈邑。?
作者還特意指出,這個(gè)識(shí)別面料是否有褶皺蚤认,跟識(shí)別一張圖是否是貓并不是同一個(gè)問題米苹。我想他的意思應(yīng)該是,用于工業(yè)界和實(shí)際產(chǎn)品中技術(shù)砰琢,并不需要像識(shí)別一張照片是否是貓這種認(rèn)知層面的技術(shù)蘸嘶。能低成本地解決環(huán)節(jié)中任何一個(gè)哪怕是細(xì)小的問題,都是好的陪汽。至于能不能叫“人工智能”又有什么關(guān)系训唱,它的本質(zhì)是將以前無法自動(dòng)化的任務(wù)給自動(dòng)化了。
工具二:自動(dòng)化的感覺(上面講的這種自動(dòng)化)
這個(gè)似乎有點(diǎn)虛無渺茫挚冤。你要想象這種自動(dòng)化是一種低層次的自動(dòng)化况增,并不需要像有20年經(jīng)驗(yàn)的專家那樣。
作者打了一個(gè)比方训挡,還挺有意思的澳骤。他說有了機(jī)器學(xué)習(xí)這個(gè)工具,就像是給了你無數(shù)個(gè)可以用的實(shí)習(xí)生澜薄,或者是10歲的孩子为肮。
5年前,機(jī)器能區(qū)分只能是照片的大小肤京。一位10歲的孩子弥锄,可以分出男女。一位15歲的青少年可以分出酷或者不酷蟆沫。一位實(shí)習(xí)生則能區(qū)分出有趣的人或無趣的人∽严荆現(xiàn)在的機(jī)器學(xué)習(xí),已經(jīng)可以達(dá)到10歲孩子甚至是15歲青少年的能力饭庞,但也許永遠(yuǎn)達(dá)不到實(shí)習(xí)生的水平戒悠。
那么問題來了:在這種情況下,如果你有一百萬15歲青少年(即機(jī)器學(xué)習(xí))來幫忙看照片舟山,你會(huì)怎么做呢绸狐?同理卤恳,你會(huì)怎么通過他們來聽電話,來識(shí)別圖片寒矿,來監(jiān)測信用卡轉(zhuǎn)賬信息呢突琳?
(也許可以想一想再看答案...)
我們可以要求“他們” 聽完所有的電話,找出其中聽起來有些生氣的那些符相;讀完所有的郵件找到顯得“焦慮”的那些拆融;看完所有照片,找出酷的(至少是‘有點(diǎn)怪’)的啊终,而在這之后的事情可以交給人來處理镜豹。所以,機(jī)器學(xué)習(xí)并不需要成為專家本身蓝牲。
而這本質(zhì)上就自動(dòng)化一直在做的事趟脂,就像是 Excel 和 Photoshop 一直在為我們做的事情一樣。
將一個(gè)重復(fù)多次的獨(dú)立任務(wù)自動(dòng)化例衍,這同樣是機(jī)器學(xué)習(xí)要做的昔期。
當(dāng)然上面這個(gè)比喻也有不適用的時(shí)候,比如機(jī)器在有的領(lǐng)域會(huì)超越人類佛玄,比如圍棋镇眷。AlphaGo 就是一個(gè)很好的例子。但是這種領(lǐng)域足夠狹窄翎嫡,有具體且有限的規(guī)則欠动,機(jī)器通過規(guī)則推演可以看到全部數(shù)據(jù),而人類反而做不到的情況惑申,是非常少見的具伍。所以絕大多數(shù)的機(jī)器學(xué)習(xí)應(yīng)用,還是上面說的“自動(dòng)化”圈驼。
最后人芽,結(jié)合自己的一點(diǎn)實(shí)際經(jīng)驗(yàn),說一說自己的體會(huì)绩脆,主要有兩個(gè)方面萤厅。
第一,先摘低垂的果實(shí)
“低垂的果實(shí)” 是從萬維鋼的得到專欄《精英日課》聽來的譯法靴迫,英文是low hanging fruit惕味,指的是相對(duì)不需要費(fèi)太大力氣就能獲得的。
不是所有的人或公司都要追求10倍創(chuàng)新玉锌,那些讓希望賦予機(jī)器認(rèn)知能力的事情可以由大公司來做名挥。對(duì)于一個(gè)直接面向用戶的產(chǎn)品來說,什么能提升體驗(yàn)主守、能創(chuàng)造新的用戶價(jià)值禀倔,就用什么榄融。不為所謂“人工智能”之名所累,一切以解決問題和提升效率為優(yōu)先救湖,是更務(wù)實(shí)的態(tài)度愧杯。
第二,機(jī)器學(xué)習(xí)在用戶量級(jí)大的系統(tǒng)解決方案型產(chǎn)品中更能發(fā)揮出效能
一是因?yàn)闄C(jī)器學(xué)習(xí)是靠數(shù)據(jù)驅(qū)動(dòng)鞋既,用戶量級(jí)大力九,收集的數(shù)據(jù)多,訓(xùn)練和迭代模型都更有利涛救。另一個(gè)原因是业扒,因?yàn)闄C(jī)器學(xué)習(xí)優(yōu)化的可能是整個(gè)體系的一個(gè)環(huán)節(jié)检吆,其效能需要在多次重復(fù)使用中發(fā)揮出來。這種回報(bào)后置要求程储,一在獲得成效前要有長遠(yuǎn)眼光蹭沛,二在取得成效后,需要系統(tǒng)將其效能放大章鲤。
比如摊灭,一個(gè)自適應(yīng)的英語水平測評(píng)做得非常精準(zhǔn),但人們不一定愿意持續(xù)為測評(píng)付費(fèi)败徊。更好的情況是帚呼,測評(píng)后面還有一整體套提升英語水平的付費(fèi)課程。
總之皱蹦,機(jī)器學(xué)習(xí)是一個(gè)我們不想也不能忽視的趨勢煤杀。它已經(jīng)被應(yīng)用于各行各業(yè)的各個(gè)環(huán)節(jié),也將被應(yīng)用于更多的場景沪哺,以此來提升效率沈自。
所以這10年,我們都可以在各自的領(lǐng)域做點(diǎn)什么呢辜妓?這是一個(gè)好問題枯途。
(全文完)
本文首發(fā)自公眾號(hào)「一周一城」,如果對(duì)你有啟發(fā)籍滴,別忘了點(diǎn)贊支持一下哇酪夷。