自然語言處理在 2017 年有哪些值得期待的發(fā)展

！@轉載文章

自然語言處理在 2017 年有哪些值得期待的發(fā)展？

知乎·竹間智能 Emotibot·幾秒前·打開原文

謝邀吕朵。從符號主義和連接主義的對立走向合作，從靜態(tài)分析走向交互窥突，從語法和淺層語義走向深層語義努溃，從功能主義走向認知和情感體驗。

謝邀阻问。

從符號主義和連接主義的對立走向合作梧税，從靜態(tài)分析走向交互，從語法和淺層語義走向深層語義称近，從功能主義走向認知和情感體驗贡蓖。

2016年是深度學習的大潮沖擊NLP的一年，果實豐碩煌茬。從底層的pos tagging, word segmentation, NER斥铺，到高級的任務比如semantic analysis, machine translation, machine reading comprehension, QA system, natural language generation。坛善。都是全面開花晾蜘，Deep learning for NLP的架構越來越成熟。經(jīng)典的Speech and Language Processing也出了第三版的draft（http://web.stanford.edu/~juraf sky/slp3/）眠屎。

那么在2017年剔交，我們又有什么樣的期待呢？

我想對于這個問題最有發(fā)言權的應該是Christopher Manning——他在Computational Linguistics and Deep Learning （http://www.mitpressjournals.org/do i/pdf/10.1162/COLI_a_00239）中的一些論點到了2017年依然成立改衩。

NLP無疑依然是機器學習有待攻克的下一個重大領域岖常。但是由于語言本身已經(jīng)是一種高層次的表達，深度學習在NLP中取得的成績并不如在視覺領域那樣突出葫督。尤其是在NLP的底層任務中竭鞍，基于深度學習的算法在正確率上的提升并沒有非常巨大板惑，但是速度卻要慢許多，這對于很多對NLP來說堪稱基礎的任務來說偎快，是不太能夠被接受的冯乘，比如說分詞。

在一些高級任務中晒夹，基于端到端學習的神經(jīng)網(wǎng)絡確實取得了令人矚目的成就裆馒，尤其是機器翻譯方面。由于復雜性太高丐怯，這樣的高級任務在此前是非常難以攻克的喷好，無論是基于常規(guī)的統(tǒng)計學習方法，還是基于規(guī)則的方法读跷。深度神經(jīng)網(wǎng)絡強悍的“記憶”能力和復雜特征提取能力非常適合于這類問題绒窑。在完形填空類型的閱讀理解（cloze-style machine reading comprehension）上，基于attention的模型也取得了非常巨大的突破（在SQuAD數(shù)據(jù)集上舔亭，2016年8月的Exact Match最好成績只有60%些膨，今年3月已經(jīng)接近77%，半年時間提升了接近20個點钦铺，這是極其罕見的）订雾。

但同時，深度學習的不可解釋的特性和對于數(shù)據(jù)的需求矛洞，也使得它尚未在要求更高的任務上取得突破洼哎，比如對話系統(tǒng)（雖然對話在2016年隨著Echo的成功已經(jīng)被炒得火熱）。

相比于機器翻譯沼本，對話系統(tǒng)并不是一個簡單的“sequence-to-sequence”的問題（雖然很多paper嘗試這樣去做）噩峦。對話系統(tǒng)必須要能夠準確地理解問題，并且基于自身的知識系統(tǒng)和對于對話目標的理解抽兆，去生成一個回復识补。這并不是簡單地去尋找“word alignment”就可以做到的。當然更不必說對于上下文和情感的理解辫红。而相比于完形填空類型的機器閱讀理解凭涂，對話系統(tǒng)可能的回復是完全開放的，并不是僅限于“答案包含在文本中”這樣的情形贴妻。而開放式的閱讀理解切油，同樣是一個AI-complete的難題。

這就要求我們對于交互的過程有更深刻的理解名惩，對于人類在交流的過程中的認知過程和情感變化有更好的模型澎胡。而這個方向上，深度學習暫時還沒有更好的辦法。

在這個過程中攻谁，就像Chris Manning說的一樣稚伍，我們需要更好的理解模型的組合（ compositionally in models）。

很顯然巢株，從傳統(tǒng)的語言學到我們現(xiàn)在的端到端的靠大量數(shù)據(jù)的訓練結果槐瑞，其間還有很大一塊認知過程的坑沒有被填上熙涤。有一個有意思的事情是阁苞，在大多數(shù)端到端的NLP應用中，在輸入中包括一些語言學的特征（例如pos tag或dependency tree）并不會對結果有重大影響祠挫。我們的一些粗淺的猜測那槽，是因為目前的NLP做的這些特征，其實對于語義的表示都還比較差等舔，某種程度來說所含信息還不如word embedding來的多骚灸。對于極其復雜、需要非常深的語義理解的任務來說慌植，這些語言學特征并沒有太多作用甚牲。這并不一定是對的——在結合語言學的規(guī)則與深度學習方面，太多實驗等著我們去做了蝶柿。

所以丈钙，我們需要解決的不僅僅是Semantic Role Labelling，甚至Semantic Parsing或是Abstract Meaning Representation（http://amr.isi.edu/）;我們需要知道的是從符號到人類體驗的一種映射——不僅僅是“紅色”可以被翻譯為“Red”——我們想知道人類在看到紅色時的感受交汤，以及紅色所代表的情緒雏赦。

我們想要復原的是文字完全無法記錄下來的現(xiàn)場的氣氛，情緒和心跳的感覺（embodied experience）芙扎。同樣的文字星岗，在不同的場景，應該有完全不同的表達力戒洼。

我們相信俏橘，僅僅依賴word2vec（或其它distributed representation）或是先進的memory-augmented networks，或是傳統(tǒng)的NLP方法圈浇，都還無法解決這些問題敷矫。

在情感和體驗的另一個極端，我們又希望語言能夠展示它“如雕塑一樣的美感”（羅素形容數(shù)學用語）汉额，可以精準地描述概念和邏輯曹仗。這要求我們在語言的模糊性上建立出來健壯的知識和推理體系——同樣，現(xiàn)在的深度學習也還不能做到這一點蠕搜。

只有結合了符號邏輯怎茫，神經(jīng)網(wǎng)絡以及認知科學，才有可能讓我們在對語言的理解和處理上更上一層樓。（硬廣Bayersian Cognitive Science/PPLhttps://www.zhihu.com/question/5944 2141/answer/166358150）

現(xiàn)在結合一些熱門的領域（任務）來談一談具體的方向轨蛤。

Dialogue

是的蜜宪，自然語言對話將會開創(chuàng)一個新的人機交互時代。但是2016年流行的seq2seq對話框架不會給我們太大的驚喜祥山。雖然理論上圃验，如果能夠給足訓練數(shù)據(jù)，它是可以表現(xiàn)得很好的缝呕。

原因在于澳窑，對話不同于翻譯，翻譯的input和output肯定是一個domain的東西供常，這大大限制了可能的解的空間摊聋。更重要的是，對話中有大量的省略和指代栈暇，我們必須通過大量的上下文信息才能夠理解對話麻裁。這樣的后果就是訓練對話系統(tǒng)對于訓練數(shù)據(jù)有指數(shù)級別上升的要求。

就算我們已經(jīng)記錄了這個世界上所有人類的對話源祈，明天依然會有人在不同的場景下說出的話煎源，根本沒有在訓練集中出現(xiàn)。

所以香缺，2017年的對話系統(tǒng)手销，一定是在限定的場景下發(fā)揮作用的。

即便是限定場景下的對話赫悄，也存在以下的幾個難點需要攻克原献。后面例舉的文章只是拋磚引玉。

1. 怎樣評估對話的質量埂淮？必須要和標準答案回答得一模一樣才算好嗎姑隅？（Towards an automatic Turing test: Learning to evaluate dialogue responseshttps://openreview.net/pdf?id=HJ5PIaseg）

2. 怎么利用對話中人類的反饋來幫助學習？（Dialogue Learning With Human-in-the-Loop:https://arxiv.org/pdf/1611.0982 3.pdf）

3. 怎樣keep track of dialogue state倔撞？怎么定義目標讲仰？怎么記住多個對話片段？（Frames: A Corpus for Adding Memory to Goal-Oriented Dialogue Systems：https://arxiv.org/abs/1704.0005 7）

4. 如何去做對話的policy痪蝇？（Towards Information-Seeking Agents：https://arxiv.org/abs/1612.0260 5）

5. 如何結合記憶以及情感鄙陡？（Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory：https://arxiv.org/abs/1704.0107 4）

6. 上下文如何建模？（Improving Frame Semantic Parsing with Hierarchical Dialogue Encoders：https://arxiv.org/abs/1705.0345 5）

7. 對話回復的生成如何變得可控躏啰？（Data Distillation for Controlling Specificity in Dialogue Generationhttps://arxiv.org/pdf/1702.0670 3.pdf）

閱讀理解（Open-domain QA）

去年到今年初MRC取得的進展大家已經(jīng)有目共睹了趁矾，最高表現(xiàn)的架構基本趨同。估計再刷下去就要達到super-human performance了（人類的 baseline是82 EM, 91 F1）给僵。比較有意思的是大家基本上都放棄了multi-hop reasoning的結構毫捣，原因非常簡單：Stanford的SQuAD跟FB的bAbI不一樣详拙，沒有專門設立這種需要推理的項目（諸如John went to the hall; John putdown the ball; Where is the ball?這類問題），大部分的問題主要依賴Attention機制就可以抓得很好了蔓同。bAbI這樣的偽推理看來大家也是受夠了饶辙。

但是SQuAD本身也存在很多問題，拋開細的面不說斑粱，cloze-style本來就有很大的問題弃揽。而且最近出現(xiàn)了海量的刷SQuAD的文章，品質老實說并不敢恭維则北。幸好Stanford的Chen Danqi大神的Reading Wikipedia to Answer Open-Domain Questions （http://cs.stanford.edu/people/danqi/papers/acl2017.pdf）打開了很多的方向矿微。通過海量閱讀（“machine reading at scale”），這篇文章試圖回答所有在wikipedia上出現(xiàn)的factoid問題咒锻。其中有大量的工程細節(jié)冷冗，在此不表守屉，僅致敬意惑艇。

Unsupervised Learning

在分布式語義表示這個“傳統(tǒng)”深度學習領域（2013年算是很“傳統(tǒng)”了吧），主要的工作還是向下拇泛，向上和向周邊擴展（不小心說了句廢話）滨巴。

向下是指sub-word level。(Enriching Word Vectors with Subword Information：https://arxiv.org/abs/1607.0460 6）

向上當然就是句子／篇章級別了俺叭。（A Simple but Tough-to-Beat Baseline for Sentence Embeddings：https://openreview.net/pdf?id=SyK00v5xx）

向周邊呢恭取？就是面向任務，譬如知識庫里的entity-embedding熄守，或者面向sentiment analysis的情感-embedding蜈垮。。好吧裕照，我承認這類的文章真的已經(jīng)看得太多了攒发，并沒有太大新意（no offense:我知道無論如何“boring”的文章，背后都是大家不眠不休的心血）晋南。

NLG

通過RNN-language model來做語言生成已經(jīng)很成熟了惠猿，這都已經(jīng)出survey paper了——Survey of the State of the Art in Natural Language Generation: Core tasks, applications and evaluation：https://arxiv.org/pdf/1703.0990 2.pdf

但是通過GAN／VAE來生成呢？

當然负间，做這個方向的人也很多偶妖，比如MSRA的Adversarial Neural Machine Translation（https://arxiv.org/abs/1704.0693 3）和Li Jiwei的Adversarial Learning for Neural Dialogue Generation：https://arxiv.org/pdf/1701.0654 7.pdf

不過認真地說，我同意Ian Goodfellow在Reddit里說的：“GANs have not been applied to NLP because GANs are only defined for real-valued data.” （https://www.reddit.com/r/MachineLea rning/comments/40ldq6/generative_adversarial_networks_for_text/）

當然政溃，做一些twist當然是可以強行讓它work的趾访，或者用VAE——但是目前看來，這些生成模型在自然語言方面并沒有在圖像方面的顯著療效董虱。更重要的是扼鞋，目前NLG的重要課題不是生成的質量，而是要搞清楚想說什么——類比一下，就如同就算人腦的Broca區(qū)域沒有問題藏鹊，可是Wernicke區(qū)域出現(xiàn)了問題润讥，那么病人會說一口流利的語言，可是每一句話都毫無意義——這樣的生成當然也是毫無意義的了盘寡。

所以這個領域楚殿，其實還是任重道遠啊。目前的很多“自然語言生成”或“寫稿機器人”竿痰，還是carefully-crafted的模版來的多脆粥。

總結

通過2016年的努力，deep learning在NLP領域已經(jīng)站穩(wěn)了腳跟影涉。我們期待2017年語言學和機器學習的進一步結合变隔，讓機器更加聰明，更懂你蟹倾。

歡迎大家補充匣缘、討論：）

本回答來自竹間智能Emotibot機器學習科學家馬永寧。

最后編輯于：2017.12.07 06:03:10

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末鲜棠，一起剝皮案震驚了整個濱河市肌厨，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌豁陆，老刑警劉巖柑爸，帶你破解...
沈念sama閱讀 206,839評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異盒音，居然都是意外死亡表鳍，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門祥诽，熙熙樓的掌柜王于貴愁眉苦臉地迎上來譬圣，“玉大人，你說我怎么就攤上這事原押⌒哺洌” “怎么了？”我有些...
開封第一講書人閱讀 153,116評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵诸衔，是天一觀的道長盯漂。經(jīng)常有香客問我，道長笨农，這世上最難降的妖魔是什么就缆？我笑而不...
開封第一講書人閱讀 55,371評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮谒亦，結果婚禮上竭宰，老公的妹妹穿的比我還像新娘空郊。我一直安慰自己，他們只是感情好切揭，可當我...
茶點故事閱讀 64,384評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布狞甚。她就那樣靜靜地躺著，像睡著了一般廓旬。火紅的嫁衣襯著肌膚如雪哼审。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,111評論 1贊 285
城市分裂傳說
那天孕豹，我揣著相機與錄音涩盾，去河邊找鬼。笑死励背，一個胖子當著我的面吹牛春霍，可吹牛的內容都是我干的。我是一名探鬼主播叶眉，決...
沈念sama閱讀 38,416評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼址儒，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了竟闪？” 一聲冷哼從身側響起离福，我...
開封第一講書人閱讀 37,053評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤杖狼，失蹤者是張志新（化名）和其女友劉穎炼蛤，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蝶涩，經(jīng)...
沈念sama閱讀 43,558評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡理朋，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,007評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了绿聘。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嗽上。...
茶點故事閱讀 38,117評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖熄攘，靈堂內的尸體忽然破棺而出兽愤，到底是詐尸還是另有隱情，我是刑警寧澤挪圾，帶...
沈念sama閱讀 33,756評論 4贊 324
?日本核電站爆炸內幕
正文年R本政府宣布浅萧，位于F島的核電站，受9級特大地震影響哲思，放射性物質發(fā)生泄漏洼畅。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,324評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一棚赔、第九天我趴在偏房一處隱蔽的房頂上張望帝簇。院中可真熱鬧徘郭，春花似錦、人聲如沸丧肴。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽芋浮。三九已至冲甘，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間途样，已是汗流浹背江醇。一陣腳步聲響...
開封第一講書人閱讀 31,539評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留何暇，地道東北人陶夜。一個月前我還...
沈念sama閱讀 45,578評論 2贊 355
代替公主和親
正文我出身青樓，卻偏偏與公主長得像裆站，于是被迫代替她去往敵國和親条辟。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,877評論 2贊 345

自然語言處理在 2017 年有哪些值得期待的發(fā)展

推薦閱讀更多精彩內容