Neil Zhu监徘,簡書ID Not_GOD,University AI 創(chuàng)始人 & Chief Scientist吧碾,致力于推進世界人工智能化進程凰盔。制定并實施 UAI 中長期增長戰(zhàn)略和目標,帶領團隊快速成長為人工智能領域最專業(yè)的力量倦春。
作為行業(yè)領導者户敬,他和UAI一起在2014年創(chuàng)建了TASA(中國最早的人工智能社團), DL Center(深度學習知識中心全球價值網(wǎng)絡),AI growth(行業(yè)智庫培訓)等睁本,為中國的人工智能人才建設輸送了大量的血液和養(yǎng)分尿庐。此外,他還參與或者舉辦過各類國際性的人工智能峰會和活動呢堰,產(chǎn)生了巨大的影響力抄瑟,書寫了60萬字的人工智能精品技術內容,生產(chǎn)翻譯了全球第一本深度學習入門書《神經(jīng)網(wǎng)絡與深度學習》枉疼,生產(chǎn)的內容被大量的專業(yè)垂直公眾號和媒體轉載與連載皮假。曾經(jīng)受邀為國內頂尖大學制定人工智能學習規(guī)劃和教授人工智能前沿課程,均受學生和老師好評骂维。
Hinton現(xiàn)在花費了半年在Google公司惹资,讓工程師們從過去十年的痛苦中解脫出來。他同時也探索了那些被認為是不可工作的神經(jīng)網(wǎng)絡航闺,追求他所說的“黑暗知識”褪测。他經(jīng)常花費整天進行編程来颤,那些作為一個教授一般不用進行的工作汰扭。當我問到他職業(yè)生涯哪段時間最為高產(chǎn)的時候,Hinton毫不猶豫地回答說:“下個五年”福铅。
Google在許多產(chǎn)品上使用深度學習萝毛。當我在這個暑假訪問Hinton時,將深度學習應用在語言翻譯上的工作才剛剛開始滑黔。Google對每種語言都有編碼網(wǎng)絡和解碼網(wǎng)絡笆包,把每個詞都轉化成一個巨大的矩陣环揽,該矩陣刻畫了其包含的意義——比如說,貓和狗之間的數(shù)值要比狗和紅褐色之間的數(shù)值要锈钟丁(注:這里的數(shù)值一般稱為相似度)例如歉胶,英語編碼網(wǎng)絡將這些數(shù)字傳送給法語解碼網(wǎng)絡,這個可以對所有這些數(shù)字記性預測巴粪。然后對每個詞對進行分析通今,所有這比較這個結果和已知的翻譯,然后BP這些錯誤肛根。Hinton說辫塌,在幾個月后,效果已經(jīng)很好了派哲。
對于Hinton來說臼氨,有點諷刺的是,這位挑戰(zhàn)權威者芭届,現(xiàn)在為一個大公司工作储矩。不過,這是不可避免的褂乍。這些公司具有這些工具來讓深度學習工作持隧,而高校沒有這樣的實力。在Hinton暑期課程的Caffee時間树叽,我無意中聽見一個年輕的學者抱怨不能夠從一家公司獲得足夠的數(shù)據(jù)舆蝴。在幾分鐘后,他又說:“我將要去微軟了题诵,現(xiàn)在我就沒有這個問題了洁仗。”
“有個比較大的問題是性锭,大公司雇了足夠的研究者后赠潦,在高校就缺少師資力量來培養(yǎng)更多的學生和進行基礎研究〔莞裕”Hinton說她奥。但是技術公司也注意到了這個問題了。Google也已經(jīng)開始鼓勵Bengio進行自己的基礎研究了怎棱。
We could have moved a lot faster, if it weren't for the ways of science as a human enterprise.
在Facebook哩俭,LeCun已經(jīng)重造了一個Bell實驗室,他在1990年代在那里工作拳恋。他保證道凡资,盡管可能會有一點的推延,也會發(fā)表自己的研究成果谬运∠读蓿“我不認為學術研究將會沒有立足之地垦藏。”LeCun又說伞访。技術對人才的追求掂骏,創(chuàng)造除了更多的學生而不是被工業(yè)界掩埋。他在警惕過熱的同時厚掷,也對深度學習的發(fā)展充滿信心弟灼。“我有近20年沒有這樣做過了蝗肪,除非我相信這些方法袜爪,否則不會這樣挑戰(zhàn)眾人的判斷的⊙ι粒”
Bengio時常會想到那時不被允許的研究資助,在計算機視覺和語音識別領域中持有舊觀點的科學家們常常會攻擊神經(jīng)網(wǎng)絡的研究俺陋』硌樱“我們本來可以把研究加快很多的,如果人們不把科學當做是人類企業(yè)的話腊状∮沼剑”Bengio這么說過。多樣化應該戰(zhàn)勝個人偏見缴挖〈“但是人類就是傾向于藐視他們不理解或者堅信的事物。”
現(xiàn)在神經(jīng)網(wǎng)絡領域的學者占據(jù)統(tǒng)治地位了映屋。甚至在長期推崇傳統(tǒng)神經(jīng)網(wǎng)絡的MIT苟鸯,學者們也加入其中。
“我們就是在恐龍腳下存活的哺乳動物棚点,” Salk的Sejnowski說道早处。“基本上瘫析,微弱膽小的哺乳動物贏得了世界砌梆。恐龍不復存在贬循。新紀元開始咸包。”
Rosenblatt在他新聞發(fā)布會上分享的很多夢想都已成真杖虾。另外一些人烂瘫,如計算機意識仍然是遙遠的事情。今天最大的神經(jīng)網(wǎng)絡擁有10億個鏈接亏掀,是過去幾年規(guī)模的1000倍忱反。但是相比于人類的大腦泛释,這個規(guī)模還是微小的。10億鏈接就是1立方毫米的組織温算;在腦部掃描中怜校,比體像素要小一些。現(xiàn)在離人類智能還是相當遙遠注竿。Hinton仍舊受到人類大腦的啟發(fā)和鼓舞茄茁,但是他也知道自己并不是在重新復制大腦。甚至相差很多巩割。
對于逐漸增大的神經(jīng)網(wǎng)絡能夠做到的猜測也是很多裙顽。許多研究者堅信推理可以從神經(jīng)網(wǎng)絡中誕生。Gary F. Marcus宣谈,NYU的心理學家愈犹,質疑在幾篇《紐約人》報道的深度學習的進展,其中一點就是Hinton讓他說出神經(jīng)網(wǎng)絡可以做到什么才能讓自己佩服闻丑。他的答案如下:“地方議會議員拒絕給出一個許可漩怎,因為他們害怕暴力∴挛耍”誰害怕暴力勋锤?如果一個神經(jīng)網(wǎng)絡可以回答這個問題,那么他們就會發(fā)生一些事情侥祭。
Sejnowski說叁执,這里有一個深深的諷刺。深度學習現(xiàn)在是一個探索巨大數(shù)據(jù)庫的一種前景光明的工具矮冬√竿穑“我們啟動這樣的事業(yè)來理解我們的大腦的工作原理』斗”他說入挣,“現(xiàn)在看來這個創(chuàng)造出來的工具,可能并不多么地像真正的大腦硝拧,但確實是理解神經(jīng)科學進展的最好的工具径筏。”
這是在多倫多的一整天障陶。我在訪問的過程中滋恬,注意到Hinton在他的筆記本電腦上運行著一個撐血。每隔幾秒鐘抱究,兩個黑白瘦削數(shù)字在顯示屏上閃過恢氯,隨機地重疊在一起。他正在測試一個新的算法,看看包含視覺雜亂的數(shù)字的識別情況勋拟。
兩個新數(shù)字出現(xiàn)了勋磕。Hinton的眼神閃出一絲淘氣。
“你看看這兩個數(shù)字是什么敢靡?” 他問道挂滓。
“6和4?”
我是正確的啸胧。計算機程序也是正確的赶站。但是我有一點點疲倦。我的神經(jīng)網(wǎng)絡不大中用了纺念。另一個數(shù)字對出來了贝椿。
“那么這兩個呢?” Hinton又問陷谱。
“這個很麻煩啊烙博。0和5?” 我回答道叭首。
“0和9习勤。它得到了0和9。比你的結果好焙格。”
我錯了夷都。機器勝利了眷唉。
===
注:作者Paul Voosen是Chronicle的資深記者。