經(jīng)濟(jì)學(xué)人:計(jì)算機(jī)如何學(xué)習(xí)人類語言钧汹?

經(jīng)濟(jì)學(xué)人:計(jì)算機(jī)如何學(xué)習(xí)人類語言?

日期:2017年1月11日
標(biāo)題:How machines learned to speak human language
副標(biāo):And what does that mean for the way people use computers?
來源:2017/01/economist-explains-6

今年圣誕節(jié)數(shù)以百萬計(jì)的人將得到一種裝有電子設(shè)備的盒子——能夠快速地提高使用人類語言的能力录择。亞馬遜的 Echo 設(shè)備拔莱,配備了一個(gè)名為 Alexa 的數(shù)字助理,現(xiàn)在在500多萬戶家庭中出現(xiàn)隘竭。 Echo 是一個(gè)圓筒形的臺式電腦塘秦,除了聲音之外沒有其它接口。你可以要求 Alexa 播報(bào)天氣信息动看,播放音樂尊剔,預(yù)定出租車,告知通勤路程或講一個(gè)老掉牙的笑話菱皆,它都會響應(yīng)须误。來自美國電腦巨頭的語音驅(qū)動(dòng)式數(shù)字助理(谷歌的 Assistant、微軟的 Cortana和蘋果的 Siri)也已經(jīng)取得了很大的進(jìn)步仇轻。計(jì)算機(jī)是如何處理人類語言的問題呢京痢?

曾經(jīng)的想法是將教機(jī)器學(xué)習(xí)語言規(guī)則,例如翻譯篷店,使用一套語法規(guī)則來打破源語言的意義祭椰,再用另一組用來重現(xiàn)目標(biāo)語言中的意思。但是經(jīng)歷過20世紀(jì)50年代的樂觀情緒過后,業(yè)界發(fā)現(xiàn)這種系統(tǒng)不能用于復(fù)雜的新句子方淤;基于語言規(guī)則的方法很難大規(guī)模擴(kuò)展應(yīng)用钉赁。用于人類語言識別技術(shù)的研究投資進(jìn)入了長達(dá)幾十年的蟄伏期,直到20世紀(jì)80年代的迎來復(fù)興時(shí)期携茂。

實(shí)際上你踩,人類語言識別技術(shù)可以通過模式匹配的形式來自我學(xué)習(xí)。例如語音識別邑蒋,計(jì)算機(jī)一邊輸入語音文件作為語料姓蜂,另一邊是人工編輯的譯本作為的譯本按厘。系統(tǒng)學(xué)著預(yù)測這些語音的結(jié)果“聽起來”應(yīng)該屬于那個(gè)譯本医吊。在翻譯過程中,訓(xùn)練數(shù)據(jù)是源語言文本和人工翻譯的文本逮京。系統(tǒng)自主學(xué)習(xí)卿堂、匹配它們之間的模式。提高語音識別和翻譯能力的一個(gè)因素是“語言模型”—— 一個(gè)關(guān)于英語句子的知識庫懒棉。這大大縮小了系統(tǒng)的預(yù)測工作量草描。

最近有三件事使這種方法取得了巨大的飛躍:首先,計(jì)算機(jī)的運(yùn)算能力比過去強(qiáng)大得多策严。第二穗慕,它們可以從海量的、日益增長的數(shù)據(jù)中學(xué)習(xí)妻导,不管是在因特網(wǎng)上公開獲取還是公司私下收集的逛绵。第三,所謂的“深度學(xué)習(xí)”(deep learning)倔韭,它使用包括多層次的數(shù)字“神經(jīng)元”及其連接的數(shù)字神經(jīng)網(wǎng)絡(luò)术浪,使得該系統(tǒng)非常善于從例子中學(xué)習(xí)。

所有這一切都意味著寿酌,計(jì)算機(jī)現(xiàn)在非常善于回答具備明確定義的問題胰苏。例如 “明天倫敦的氣溫是多少?” (公平地說醇疼,你不必是一臺電腦也能知道明天倫敦會下雨)硕并。用戶甚至可以用更自然的方式詢問,比如“明天我應(yīng)該帶傘去倫敦嗎秧荆?”(數(shù)字助理不斷地從人們不同的提問方式中學(xué)習(xí))倔毙,但是問一個(gè)開放式的問題(“明天倫敦有什么有趣或者可以薅羊毛的事情嗎?”)通常你只會得到一個(gè)來自搜索引擎結(jié)果的列表辰如。

隨著機(jī)器學(xué)習(xí)( machine learning)的改進(jìn)普监,當(dāng)用戶的智能設(shè)備更加熟悉他們時(shí),這樣的答案將變得更加有用。這意味著隱私倡導(dǎo)者的麻煩凯正,但是參考過去幾年手機(jī)應(yīng)用的情況來看毙玻,消費(fèi)者將作出權(quán)衡,他們通常非常高興能獲得新功能廊散。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末桑滩,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子允睹,更是在濱河造成了極大的恐慌运准,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,744評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缭受,死亡現(xiàn)場離奇詭異胁澳,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)米者,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評論 3 392
  • 文/潘曉璐 我一進(jìn)店門韭畸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人蔓搞,你說我怎么就攤上這事胰丁。” “怎么了喂分?”我有些...
    開封第一講書人閱讀 163,105評論 0 353
  • 文/不壞的土叔 我叫張陵锦庸,是天一觀的道長。 經(jīng)常有香客問我蒲祈,道長甘萧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,242評論 1 292
  • 正文 為了忘掉前任讳嘱,我火速辦了婚禮幔嗦,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘沥潭。我一直安慰自己邀泉,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,269評論 6 389
  • 文/花漫 我一把揭開白布钝鸽。 她就那樣靜靜地躺著汇恤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拔恰。 梳的紋絲不亂的頭發(fā)上因谎,一...
    開封第一講書人閱讀 51,215評論 1 299
  • 那天,我揣著相機(jī)與錄音颜懊,去河邊找鬼财岔。 笑死风皿,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的匠璧。 我是一名探鬼主播桐款,決...
    沈念sama閱讀 40,096評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼夷恍!你這毒婦竟也來了魔眨?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,939評論 0 274
  • 序言:老撾萬榮一對情侶失蹤酿雪,失蹤者是張志新(化名)和其女友劉穎遏暴,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體指黎,經(jīng)...
    沈念sama閱讀 45,354評論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡朋凉,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,573評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了袋励。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片侥啤。...
    茶點(diǎn)故事閱讀 39,745評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡当叭,死狀恐怖茬故,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蚁鳖,我是刑警寧澤磺芭,帶...
    沈念sama閱讀 35,448評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站醉箕,受9級特大地震影響钾腺,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜讥裤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,048評論 3 327
  • 文/蒙蒙 一放棒、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧己英,春花似錦间螟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,683評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至治拿,卻和暖如春摩泪,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背劫谅。 一陣腳步聲響...
    開封第一講書人閱讀 32,838評論 1 269
  • 我被黑心中介騙來泰國打工见坑, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留嚷掠,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,776評論 2 369
  • 正文 我出身青樓荞驴,卻偏偏與公主長得像叠国,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子戴尸,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,652評論 2 354

推薦閱讀更多精彩內(nèi)容