前面說到過大數(shù)據(jù)對(duì)我們獲取信息,找到世界的規(guī)律和模型有著重要的意義逮矛。在今天這個(gè)時(shí)代鸡号,數(shù)據(jù)包括了幾乎一切,你的上網(wǎng)時(shí)間须鼎,訪問的網(wǎng)站鲸伴,看過的視頻,聽過的音樂和買過的東西晋控。而這些大數(shù)據(jù)就是打開機(jī)器智能的鑰匙汞窗。
機(jī)器智能是什么呢?我們理解的就是機(jī)器要能做一些人可以做的事赡译,比如語音識(shí)別仲吏、圖像識(shí)別、語言翻譯蝌焚、下棋等需要用到學(xué)習(xí)分析能力的事裹唆。這里要提到著名的圖靈測(cè)試,讓人和機(jī)器躲在幕后和幕前的裁判人交流只洒,如果裁判無法判斷哪一個(gè)是人哪一個(gè)是機(jī)器许帐,那么機(jī)器就通過了圖靈測(cè)試。我的理解是機(jī)器做到了人能做的事毕谴,而且做的和普通人一樣好甚至超過普通人成畦。
科學(xué)家們最先開始突破的是語音識(shí)別領(lǐng)域,也就是讓機(jī)器識(shí)別人的聲音涝开。也就是說機(jī)器要能聽懂人的話而且能輸出我們?nèi)四芸炊脑捬省i_始的時(shí)候,人們?cè)噲D以人類的學(xué)習(xí)邏輯來改進(jìn)機(jī)器舀武。你想想我們是如何學(xué)英語的拄养,如果只靠死記硬背英語中的每一個(gè)表達(dá),我們一輩子也無法說英語,我們學(xué)習(xí)語言靠得是理解和模仿》苟可是這個(gè)邏輯機(jī)器就不好使深寥,你想想怎么知道機(jī)器理解了某句話呢?科學(xué)家明斯基舉了一個(gè)例子,The pen was in the box這句話機(jī)器可以通過分析語法知道意思是盒子里有一只鋼筆。可是The box was in The pen這句話中的pen的意思是-小孩玩耍的圍欄嘁锯。機(jī)器怎么知道什么時(shí)候pen代表鋼筆,什么時(shí)候代表圍欄呢。這就讓那些試圖用人的學(xué)習(xí)模式套入機(jī)器的科學(xué)家在這個(gè)思路上看到了瓶頸家乘。
直到賈里尼克用大數(shù)據(jù)解決語音識(shí)別的方法蝗羊,人們才看到了大數(shù)據(jù)下的機(jī)器的飛躍。簡單的說仁锯,賈里尼克是單純的將語音識(shí)別問題變成一個(gè)通信問題耀找。好比我們之間的談話,一方發(fā)有意義的信息(編碼過程)业崖,通過媒介的傳播(電話野芒,空氣等),對(duì)方接受并理解信息(譯碼)双炕。所以機(jī)器只需要正確提取聲音特征就可以了狞悲。怎么提取呢,我的理解就是大量的聽妇斤,輸入大量的數(shù)據(jù)摇锋,讓機(jī)器通過程序知道哪些是有意義的信息。也就是說機(jī)器用我們?nèi)祟惒粫?huì)采用的策略進(jìn)行學(xué)習(xí)站超,這就要求機(jī)器能存儲(chǔ)大數(shù)據(jù)荸恕,并且能快速處理大數(shù)據(jù)。當(dāng)然了具體的算法是賈里尼克和團(tuán)隊(duì)一起設(shè)計(jì)的了死相,我們知道大數(shù)據(jù)的作用就可以了融求。
現(xiàn)在再來看阿爾法go和李世石的比賽,機(jī)器不需要會(huì)像人一樣思考媳纬,它要做的是輸入大數(shù)據(jù)即各種頂尖高手的棋局双肤,針對(duì)李世石下的每一步計(jì)算出各種情況下獲勝的概率然后采用概率最大的下法就可以了施掏。換句話說李世石不是在和一個(gè)人下棋钮惠,而是和這個(gè)世界的頂尖高手較量。而且機(jī)器優(yōu)于人的地方在于它沒有感情七芭,情緒不會(huì)影響它發(fā)揮素挽,一切只用交給算法和數(shù)據(jù)就行了。這里其實(shí)是人們?cè)谘芯繖C(jī)器智能的時(shí)候狸驳,從人類模式轉(zhuǎn)到數(shù)據(jù)驅(qū)動(dòng)的思維轉(zhuǎn)換预明。這個(gè)時(shí)候大數(shù)據(jù)就是一種巨大的資源,它的背后可以分析出人的種種行為耙箍。比如你老在亞馬遜上買書撰糠,亞馬遜就會(huì)經(jīng)常給你發(fā)一些新書的郵件。有時(shí)候你會(huì)發(fā)現(xiàn)它推薦的書挺對(duì)你的胃口辩昆,這也是大數(shù)據(jù)的作用阅酪。我們的一切行為都可以量化成數(shù)據(jù)的時(shí)候,在機(jī)器眼中我們就只是一個(gè)比特吧。希望今天的內(nèi)容對(duì)你有所啟發(fā)术辐,祝進(jìn)步砚尽!