本期博客介紹如何學(xué)習(xí)人工智能,當(dāng)然不是由我本人來闡述艾恼,而是根據(jù)吳恩達(dá)老師的Quora回答進(jìn)行總結(jié)和歸納住涉。
Andrew Ng是大名鼎鼎的人工智能大師、是Stanford大學(xué)人工智能實(shí)驗(yàn)室主任钠绍、是百度首席科學(xué)家舆声、Coursera的創(chuàng)始人、Google眼鏡和無人車的初創(chuàng)成員柳爽。其權(quán)威和知名度不言而喻媳握,本文就是基于他的Quora回答給大家講解下如何入門機(jī)器學(xué)習(xí)。
Andrew在Quora上的問答
Andrew在Quora上回答了一共9個問題磷脯,基本上都是和人工智能有關(guān)的毙芜,每個回答都超過萬人點(diǎn)贊,其影響力可想而知争拐。下面按照點(diǎn)贊由高到低介紹下Andrew的回答腋粥。
1. 作為一個教育家,你有什么好的建議給學(xué)生們嗎架曹?
當(dāng)決定如何花費(fèi)你的時間時隘冲,我建議應(yīng)該從兩個方面進(jìn)行考慮:
- 你在做的事情能改變世界嗎?
- 你將花多少來學(xué)習(xí)绑雄?
直到今天展辞,我也是這樣來決定如何花費(fèi)我時間的。
我們?nèi)缃竦纳鐣o每個人最好的機(jī)會來改變世界万牺。隨著信息技術(shù)和現(xiàn)代通訊的發(fā)展罗珍,好的點(diǎn)子和產(chǎn)品將以超乎以往任何時候的速度來傳播。只要有好的點(diǎn)子和強(qiáng)大的執(zhí)行力脚粟,任何人都能很快地幫助到這個星球上的其他人覆旱。
因此,問問你自己:如果你所從事的工作成功超越你廣闊的夢想核无,那么它是否對其他人有重要影響扣唱。如果不是,那么繼續(xù)尋找些其它的事情來做。否則噪沙, 你就沒有發(fā)揮出你全部潛力炼彪。
第二,特別是當(dāng)你年輕時正歼,不要去評估投資未來教育的價值辐马。我所說的年輕是指小于100歲。
任何你所學(xué)到的東西都會在接下來的工作中遇到局义。但是這并不容易喜爷,一旦你離開了學(xué)校,花時間來學(xué)習(xí)都是相對的短期回報旭咽。也沒有老師在你旁邊給你打分并激勵你不斷學(xué)習(xí)。但是赌厅,你可以自驅(qū)動使得閱讀變得有趣穷绵,不斷創(chuàng)新你的點(diǎn)子,不斷與你值得學(xué)習(xí)的人交流特愿,那么經(jīng)過一段時間以后仲墨,你在你的領(lǐng)域?qū)兂身敿馊瞬拧?/p>
對我來說,我十分熱愛閱讀揍障。在我kindle中有超過1000本書目养,我會花費(fèi)晚上和周末大量的時間來閱讀。我的閱讀套餐包括學(xué)術(shù)研究論文毒嫡、商業(yè)策略書籍癌蚁、創(chuàng)新方法、產(chǎn)品兜畸、我崇拜的人物傳記等等努释。我有時候也看看網(wǎng)絡(luò)課程(MOOCs)。我也很愛和能教我新知識的人交流咬摇,不管他是老朋友還是新伙伴伐蒂。
這個學(xué)習(xí)的過程將幫助自己決定到底想做什么。當(dāng)你看了足夠多關(guān)于其他人改變世界的例子時肛鹏,你將得到越來越多的好點(diǎn)子來改變這個世界逸邦。
總之,你不斷投資自己去學(xué)習(xí)在扰,即便這個過程非常困難缕减。并且不斷的去尋找一個幫助人類發(fā)展的道路。
2. 在機(jī)器學(xué)習(xí)領(lǐng)域芒珠,你應(yīng)該如何開始你的職業(yè)生涯烛卧?
這要取決于你如何定義“機(jī)器學(xué)習(xí)職業(yè)生涯”。如果你說的是一個應(yīng)用現(xiàn)成工具的工作,比如R的工具庫总放,Python的scikit-learn庫呈宇。那么你在本科時上了2-3年的機(jī)器學(xué)習(xí)相關(guān)課程即可了,或者一些在線學(xué)習(xí)課程(如https://www.coursera.org/learn/machine-learning 和 https://www.coursera.org/specializations/jhu-data-science)局雄。
你也應(yīng)該進(jìn)行一些實(shí)踐的項(xiàng)目甥啄,比如參加kaggle競賽,或者開放你的源碼在github上炬搭。(我強(qiáng)烈推薦使用python)如果你的工作是希望開發(fā)新的基礎(chǔ)機(jī)器學(xué)習(xí)算法蜈漓,你應(yīng)該考取一個計(jì)算機(jī)或者數(shù)據(jù)統(tǒng)計(jì)領(lǐng)域的PhD(還有一些博士后研究者從其他領(lǐng)域如物理學(xué)轉(zhuǎn)到機(jī)器學(xué)習(xí)領(lǐng)域)
更多幫助可以參考:https://www.quora.com/How-do-I-learn-machine-learning-1
3. 在10-20年后,工作將會如何變化宫盔?
如果你是一個50年駕齡的卡車司機(jī)融虽,由于無人車的發(fā)展導(dǎo)致你的工作沒有了,你將怎么做灼芭?
我們這個社會對有技能的人是有很大機(jī)會的有额。但問題是一些30年的工作經(jīng)驗(yàn)將會大幅貶值。我們應(yīng)當(dāng)有更多的道德義務(wù)來幫助人們獲得新的技能和追逐新的機(jī)會彼绷。
幸運(yùn)的是巍佑,隨著在線課程的發(fā)展和其它相當(dāng)規(guī)模的教育(比如Coursera、可汗學(xué)院寄悯、Lynda等)萤衰,我們這樣做起來就相當(dāng)容易了。我不擔(dān)心未來20年里缺少重要工作機(jī)會——現(xiàn)在以及可見的未來里還有很多東西只有人能做而機(jī)器不能的猜旬。但是我關(guān)心有需要培訓(xùn)每個人的需求脆栋。
我也花費(fèi)了一些基本的收入,這些收入用來提供給每個人一個合適的地方學(xué)習(xí)新的技能洒擦。我們現(xiàn)在的社會和政治現(xiàn)實(shí)來看筹吐,還沒有做好無理由的為每個人買單的準(zhǔn)備。我建議通過提高財(cái)政支出來提供他們更多學(xué)習(xí)技能的機(jī)會秘遏。因此丘薛,他們并不游手好閑,我們激勵這些沒有工作的人們并幫助他們重返崗位邦危。
我非常喜歡Erik Brynjolfsson和Andrew McAfee關(guān)于這個話題的言論:第二次機(jī)器時代洋侨。
4. AI是不是一個對人類有威脅的存在?
今天擔(dān)心AI可能是邪惡的超智能體就像擔(dān)心火星上人口也會超載一樣倦蚪,而我們至今還不能到火星希坚。
AI已經(jīng)獲得里極大地進(jìn)步,我對機(jī)器智能能夠創(chuàng)建一個更美好的社會抱有極其樂觀的態(tài)度陵且。但是AI現(xiàn)在還非常有限裁僧,幾乎所有深度學(xué)習(xí)的經(jīng)濟(jì)和社會價值問題都是要通過監(jiān)督學(xué)習(xí)个束,它受限于大量的格式化后的數(shù)據(jù)(比如進(jìn)行了標(biāo)簽后的數(shù)據(jù))。盡管AI已經(jīng)幫助了成千上萬的人們聊疲,并且還會幫助更多人茬底,但我看不到任何威脅到人類的可能。
往遠(yuǎn)點(diǎn)看获洲,還有很多其他不需要監(jiān)督學(xué)習(xí)的AI形式阱表,比如無監(jiān)督學(xué)習(xí)(我們需要更多的數(shù)據(jù),因?yàn)閿?shù)據(jù)不需要被標(biāo)記)贡珊。在我的團(tuán)隊(duì)或其它團(tuán)隊(duì)中還有更多令人興奮的學(xué)習(xí)形式最爬。我們所有人都希望有技術(shù)的突破,但是我們都不能預(yù)測什么時候會實(shí)現(xiàn)门岔。
我認(rèn)為對邪惡AI的恐懼已經(jīng)使政策制定和領(lǐng)導(dǎo)者在這個假象上錯誤地進(jìn)行了布局爱致。還有其它AI可能導(dǎo)致的問題,尤其是對工作的變化寒随。毫無疑問糠悯,AI在接下來十年會創(chuàng)造更好的社會,我們作為AI創(chuàng)造者也應(yīng)該解決我們導(dǎo)致的這一問題牢裳。我期望在線網(wǎng)絡(luò)課程能成為這解決方法的一部分逢防,但我們還需要除了教育的更多東西叶沛。
5. 是什么原因使Andrew Ng來學(xué)習(xí)人工智能蒲讯?
我想讓我們用AI來創(chuàng)造一個更好的世界。
正如工業(yè)革命解放了人類許許多多的體力勞動(你能想象如果你還需要自己洗衣服的生活嘛灰署?)判帮,在未來AI將解放人類繁重的智力勞動。比如溉箕,擁有無人車的話將不會浪費(fèi)人們一生中3年的時間來開車晦墙。這將給我們更多時間陪愛人以及追求更有價值的目標(biāo)。
當(dāng)我16歲的時候我開始學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(現(xiàn)在稱為深度學(xué)習(xí))肴茄,當(dāng)時我還是新加坡國立大學(xué)的學(xué)生晌畅。我們當(dāng)時做的東西用現(xiàn)在的標(biāo)準(zhǔn)來看是微不足道的,但是在那時我覺得用幾行代碼讓計(jì)算機(jī)來學(xué)習(xí)是十分興奮的寡痰。
說一個好笑的事兒:我們當(dāng)時用的電腦跑emacs十分卡抗楔,所以我學(xué)習(xí)了vi,至今仍然用vi拦坠。
在那時连躏,我還擔(dān)當(dāng)了一個辦公室助理的兼職工作,我做了許多復(fù)印件工作(事實(shí)上贞滨,我是辦公室助理的助理)入热。那時候我意識到了更智能的機(jī)器能幫我們做許多工作,這樣人類才可以做更多有挑戰(zhàn)性的工作。
在未來十年內(nèi)勺良,AI將改變這個社會绰播。我們將從我們做什么變到我們讓計(jì)算機(jī)做什么≈F可能就在不久的未來幅垮,Quora上就有人問:“能自己開車的生活是什么樣的?”
6. Andrew Ng是怎樣看待深度學(xué)習(xí)的尾组?
深度學(xué)習(xí)是一個令人振奮的工具來幫助許多人創(chuàng)造出現(xiàn)成的AI應(yīng)用忙芒。可以幫助實(shí)現(xiàn)無人駕駛汽車讳侨,精準(zhǔn)的語音識別呵萨,圖像理解程序等等。
雖然現(xiàn)在深度學(xué)習(xí)進(jìn)展喜人跨跨,但是我認(rèn)為人有很多機(jī)會潮峦,特別是在精準(zhǔn)農(nóng)業(yè)、消費(fèi)金融勇婴、醫(yī)療領(lǐng)域等忱嘹。在那里我看到一個清晰的機(jī)會,深刻的學(xué)習(xí)可以有很大的影響耕渴,但我們沒有精力沒有時間來關(guān)注這一切拘悦。所以我相信深度學(xué)習(xí)不會很快就達(dá)到瓶頸期,而且它還會繼續(xù)快速增長橱脸。
深度學(xué)習(xí)也有些言過其實(shí)了础米。由于神經(jīng)網(wǎng)絡(luò)是非常高深且難以解釋的,我們許多人用人腦來解釋它添诉。但是我們幾乎不知道生物大腦是如何工作的屁桑。UC Berkeley大學(xué)的Michael Jordan稱深度學(xué)習(xí)為“卡通”版的生物大腦——這是一個對我們都不懂的超簡化版東西的描述,我也很同意這一觀點(diǎn)栏赴。盡管媒體大肆炒作蘑斧,我們幾乎無法建立達(dá)到人類水平的智能。因?yàn)槲覀兏静恢来竽X是如何工作的须眷,試圖盲目地復(fù)制我們在計(jì)算機(jī)中所知的東西并沒有導(dǎo)致特別有效的人工智能系統(tǒng)竖瘾。相反,最有效的深學(xué)習(xí)工作柒爸,也是至今已經(jīng)取得進(jìn)展的是從CS和工程原理來進(jìn)行准浴,最多是借鑒生物學(xué)靈感,而不是試圖盲目復(fù)制生物學(xué)知識捎稚。
具體來說乐横,如果你聽到有人說:“大腦做到某個事情求橄,而我的智能系統(tǒng)也會做想同事。所以我們是在建立一個模擬的大腦葡公」夼”,我覺得他肯定是在扯淡催什!
許多用于深度學(xué)習(xí)的想法已經(jīng)存在了幾十年涵亏。為什么現(xiàn)在才流行起來?其進(jìn)度的兩個主要原因是:(i)數(shù)據(jù)規(guī)模(ii)計(jì)算規(guī)模蒲凶。隨著我們在網(wǎng)站和移動設(shè)備上花費(fèi)更多的時間气筋,在過去的二十年中,我們一直在迅速積累數(shù)據(jù)旋圆。直到最近宠默,我們想出了如何利用大規(guī)模計(jì)算從而建立深度學(xué)習(xí)算法,從而可以利用這個龐大的數(shù)據(jù)量灵巧。
現(xiàn)在我們正處于兩個正反饋過程中搀矫,這加速了深度學(xué)習(xí)的發(fā)展:
首先,現(xiàn)在我們有龐大的機(jī)器來吸收大量的數(shù)據(jù)刻肄,大數(shù)據(jù)的價值就更清晰了瓤球。這使得我們有了一個更大的動機(jī)來獲得更多的數(shù)據(jù),這反過來又激勵我們來建立更大且更快的神經(jīng)網(wǎng)絡(luò)敏弃。
第二卦羡,我們迅速地實(shí)現(xiàn)了深度學(xué)習(xí)也加快了創(chuàng)新,加速了深度學(xué)習(xí)的研究進(jìn)展权她。許多人低估了對計(jì)算機(jī)系統(tǒng)投資對深度學(xué)習(xí)的影響虹茶。當(dāng)進(jìn)行深度學(xué)習(xí)研究時逝薪,我們開始并不知道什么樣的算法會正常工作隅要,我們的工作就是運(yùn)行大量的實(shí)驗(yàn)來找出它。如果我們有一個高效的計(jì)算平臺讓你一天跑一個實(shí)驗(yàn)而不是一周跑一個的話董济,那么你的研究進(jìn)展幾乎可以增加7倍速度步清!
這就是為什么我們組在2008年斯坦福大學(xué)里就開始倡導(dǎo)使用GPU來進(jìn)行深度學(xué)習(xí)(但是是有爭議的,但現(xiàn)在幾乎每個人都這樣做了)虏肾;現(xiàn)在我又推薦使用HPC(高性能計(jì)算/超級計(jì)算機(jī))擴(kuò)大深度學(xué)習(xí)的規(guī)模廓啊。機(jī)器學(xué)習(xí)應(yīng)該擁抱HPC。這些方法將使研究人員更有效率封豪,促進(jìn)我們整個領(lǐng)域的進(jìn)步谴轮。
總之:深度學(xué)習(xí)已經(jīng)幫助AI取得了巨大的進(jìn)步,但將來會有更好的AI吹埠!
7. 在工業(yè)界和在Stanford學(xué)術(shù)界工作有什么區(qū)別第步?
當(dāng)有人問我是否應(yīng)該在工業(yè)界還是學(xué)術(shù)界工作時疮装,我通常建議他們先弄清楚他們想做什么。也就是說粘都,你的使命是什么廓推?你想讓世界發(fā)生什么樣的變化?當(dāng)你有了答案翩隧,你就可以知道在公司還是大學(xué)哪一個是更好的地方來完成你的使命樊展。
以下是一些我認(rèn)為在商界工作更合適的理由:
- 獲取重大資源,做大項(xiàng)目堆生。人工智能研究日益資本集中专缠,需要龐大的數(shù)據(jù)和計(jì)算資源。這些在公司更容易得到淑仆。
- 強(qiáng)烈的團(tuán)隊(duì)合作意識藤肢。當(dāng)你不需要太擔(dān)心作者排序問題或這項(xiàng)工作是否對你的博士論文有用,你可以更好地執(zhí)行團(tuán)隊(duì)合作意識糯景,追求團(tuán)隊(duì)整體的目標(biāo)并慶祝團(tuán)隊(duì)的成功嘁圈。
- 快速決策(取決于公司)。我喜歡工作在一個靈活的環(huán)境中蟀淮,我們可以快速的在需要的地方獲取資源最住,從快速建立一個新的計(jì)算集群到購買大量的數(shù)據(jù),等等怠惶。
- 通過產(chǎn)品創(chuàng)新和服務(wù)能夠直接幫助到大量的人們涨缚。
以下是一些我認(rèn)為在學(xué)術(shù)界工作比較好的方面:
- 可以公開地探索任何話題。例如策治,在Stanford脓魏,我開始錄制教育視頻。最初沒有人認(rèn)為這是“真正的”Stanford工作通惫;但這最后變成Coursera(同時Stanford也因此受益)茂翔。在Stanford,當(dāng)我和我的學(xué)生覺得要建立一個開源機(jī)器人平臺履腋,我們不需要跟其他任何人評估就開始執(zhí)行珊燎。這使得ROS得以創(chuàng)建,它是一個非常成功的開源平臺遵湖。
- 可以將100%的時間來學(xué)習(xí)悔政,甚至幾年沒有直接產(chǎn)出。像百度這樣的公司非常支持員工的成長延旧,通常讓員工花幾個月的時間來學(xué)習(xí)谋国,但是讓員工這樣做幾年還是很難。
- 獲得學(xué)位的能力迁沫。即使在今天芦瘾,有一個高等學(xué)位是有幫助的闷盔。大學(xué)和公司都能很好地培養(yǎng)人才,而社會正變得非常善于鑒別能力旅急,無論你從哪里獲得這種能力逢勾。
對于我自己,一個讓我一直很感興趣的使命是讓大眾獲得世界上最好的教育藐吮。我認(rèn)為我的公司(Coursera)會很好地執(zhí)行這一任務(wù)溺拱。最近,我想通過開發(fā)人工智能技術(shù)來讓我們幫助數(shù)以百萬計(jì)的人谣辞,我認(rèn)為我的公司(百度)將是很好地執(zhí)行這一使命迫摔。但是還有很多其他有價值的任務(wù),比如教育學(xué)生泥从,研究某些領(lǐng)域句占,在大學(xué)里會執(zhí)行地更好。
8. 什么時候無人車能真正到消費(fèi)者手中躯嫉?
我希望在3年內(nèi)纱烘,我們會在道路上擁有大量無人車輛,并在5年內(nèi)大規(guī)模生產(chǎn)祈餐。(隨意在你的日歷上做筆記擂啥,在3年或5年后檢查一下,看我的預(yù)測是否正確7簟)
我們最近通過Stanford10周年慶贏得了DARPA無人駕駛挑戰(zhàn)賽哺壶。為什么無人駕駛還要這么久?
首先蜒谤,我認(rèn)為制造一輛能到處行駛汽車的過程是非常具有挑戰(zhàn)性的山宾,這是最錯誤的目標(biāo)。無人駕駛最大的問題是解決所有角落的情況——所有奇怪的問題每10000或100000英里駕駛發(fā)生一次鳍徽。機(jī)器學(xué)習(xí)很好地讓你的性能從90%的準(zhǔn)確率到99.9%资锰,但它沒有讓我們從99.9%到99.9999%。我認(rèn)為從不同的目標(biāo)出發(fā)會更有希望:巴士或通勤車只開一條固定的公交路線或只是在一個小區(qū)域行駛旬盯。如果我們能確保路線的路面和車道標(biāo)記台妆,以及是否有新的修繕等等翎猛,那么我們能實(shí)現(xiàn)真正的安全胖翰。然后,讓我們再慢慢添加路線切厘,并逐步擴(kuò)大地區(qū)萨咳,這樣我們可以實(shí)現(xiàn)安全行駛。這是我們在百度采取的方法疫稿,我希望其他團(tuán)體也采用這種方法培他。
第二鹃两,汽車本質(zhì)上是不同于人類看世界。例如舀凛,今天的計(jì)算機(jī)視覺無法可靠區(qū)分建筑工人揮手是指“你來吧”還是“快停止”俊扳。另一方面,我們的自動駕駛汽車是沒有盲點(diǎn)的猛遍,可以無時無刻看到周圍360度馋记;我們的HPC(高性能計(jì)算機(jī))系統(tǒng)也有比人類更快的反應(yīng)速度。我認(rèn)為我們不應(yīng)該指望自主汽車的駕駛方式和人類的駕駛方式完全一樣懊烤。我們可以使他們安全梯醒,可預(yù)測且可靠,但他們將不同于人類駕駛的汽車腌紧。我們作為技術(shù)人員茸习,既要搞清楚基本規(guī)定也要對這些汽車有新期待,必須與政府和社會一起在這方面發(fā)揮重要的推動作用壁肋。
我對未來無人駕駛充滿樂觀態(tài)度号胚。它將幫助人類節(jié)省大量時間,并大幅消除交通事故浸遗。我期待全球科技人員與政府涕刚、社會一起推動這一技術(shù)發(fā)展。
機(jī)器學(xué)習(xí)入門方法
通過Andrew給大家的回答乙帮,其實(shí)也基本能知道機(jī)器學(xué)習(xí)目前對于這個世界的發(fā)展是有很大作用杜漠。
- 入門機(jī)器學(xué)習(xí)首先就是推薦Andrew在Coursera上的課程“Machine Learning”,可以說是這個是入門的精品課程察净。
- Kevin Murphy的Machine Learning Textbook也是進(jìn)階教學(xué)課程之一驾茴,非常有用。
- github上有個awesome系列氢卡,其中ML系列里面推薦了無數(shù)本十分有意義的材料:github地址锈至,有一本使用R語言的統(tǒng)計(jì)學(xué)書是十分有意義的。