經(jīng)濟(jì)學(xué)人:計(jì)算機(jī)如何學(xué)習(xí)人類語言?
日期:2017年1月11日
標(biāo)題:How machines learned to speak human language
副標(biāo):And what does that mean for the way people use computers?
來源:2017/01/economist-explains-6
今年圣誕節(jié)數(shù)以百萬計(jì)的人將得到一種裝有電子設(shè)備的盒子——能夠快速地提高使用人類語言的能力录择。亞馬遜的 Echo 設(shè)備拔莱,配備了一個(gè)名為 Alexa 的數(shù)字助理,現(xiàn)在在500多萬戶家庭中出現(xiàn)隘竭。 Echo 是一個(gè)圓筒形的臺式電腦塘秦,除了聲音之外沒有其它接口。你可以要求 Alexa 播報(bào)天氣信息动看,播放音樂尊剔,預(yù)定出租車,告知通勤路程或講一個(gè)老掉牙的笑話菱皆,它都會響應(yīng)须误。來自美國電腦巨頭的語音驅(qū)動(dòng)式數(shù)字助理(谷歌的 Assistant、微軟的 Cortana和蘋果的 Siri)也已經(jīng)取得了很大的進(jìn)步仇轻。計(jì)算機(jī)是如何處理人類語言的問題呢京痢?
曾經(jīng)的想法是將教機(jī)器學(xué)習(xí)語言規(guī)則,例如翻譯篷店,使用一套語法規(guī)則來打破源語言的意義祭椰,再用另一組用來重現(xiàn)目標(biāo)語言中的意思。但是經(jīng)歷過20世紀(jì)50年代的樂觀情緒過后,業(yè)界發(fā)現(xiàn)這種系統(tǒng)不能用于復(fù)雜的新句子方淤;基于語言規(guī)則的方法很難大規(guī)模擴(kuò)展應(yīng)用钉赁。用于人類語言識別技術(shù)的研究投資進(jìn)入了長達(dá)幾十年的蟄伏期,直到20世紀(jì)80年代的迎來復(fù)興時(shí)期携茂。
實(shí)際上你踩,人類語言識別技術(shù)可以通過模式匹配的形式來自我學(xué)習(xí)。例如語音識別邑蒋,計(jì)算機(jī)一邊輸入語音文件作為語料姓蜂,另一邊是人工編輯的譯本作為的譯本按厘。系統(tǒng)學(xué)著預(yù)測這些語音的結(jié)果“聽起來”應(yīng)該屬于那個(gè)譯本医吊。在翻譯過程中,訓(xùn)練數(shù)據(jù)是源語言文本和人工翻譯的文本逮京。系統(tǒng)自主學(xué)習(xí)卿堂、匹配它們之間的模式。提高語音識別和翻譯能力的一個(gè)因素是“語言模型”—— 一個(gè)關(guān)于英語句子的知識庫懒棉。這大大縮小了系統(tǒng)的預(yù)測工作量草描。
最近有三件事使這種方法取得了巨大的飛躍:首先,計(jì)算機(jī)的運(yùn)算能力比過去強(qiáng)大得多策严。第二穗慕,它們可以從海量的、日益增長的數(shù)據(jù)中學(xué)習(xí)妻导,不管是在因特網(wǎng)上公開獲取還是公司私下收集的逛绵。第三,所謂的“深度學(xué)習(xí)”(deep learning)倔韭,它使用包括多層次的數(shù)字“神經(jīng)元”及其連接的數(shù)字神經(jīng)網(wǎng)絡(luò)术浪,使得該系統(tǒng)非常善于從例子中學(xué)習(xí)。
所有這一切都意味著寿酌,計(jì)算機(jī)現(xiàn)在非常善于回答具備明確定義的問題胰苏。例如 “明天倫敦的氣溫是多少?” (公平地說醇疼,你不必是一臺電腦也能知道明天倫敦會下雨)硕并。用戶甚至可以用更自然的方式詢問,比如“明天我應(yīng)該帶傘去倫敦嗎秧荆?”(數(shù)字助理不斷地從人們不同的提問方式中學(xué)習(xí))倔毙,但是問一個(gè)開放式的問題(“明天倫敦有什么有趣或者可以薅羊毛的事情嗎?”)通常你只會得到一個(gè)來自搜索引擎結(jié)果的列表辰如。
隨著機(jī)器學(xué)習(xí)( machine learning)的改進(jìn)普监,當(dāng)用戶的智能設(shè)備更加熟悉他們時(shí),這樣的答案將變得更加有用。這意味著隱私倡導(dǎo)者的麻煩凯正,但是參考過去幾年手機(jī)應(yīng)用的情況來看毙玻,消費(fèi)者將作出權(quán)衡,他們通常非常高興能獲得新功能廊散。