2019年中國人工智能大會(Chinese Congress on Artificial Intelligence 2019市怎,簡稱“CCAI 2019”)將于9月21日-22日在青島召開浊竟。何曉冬博士將出席大會并擔任視覺語音語言多模態(tài)論壇共同主席。
何曉冬,京東集團技術(shù)副總裁,IEEE Fellow,京東人工智能研究院常務副院長吼和,深度學習及語音和語言實驗室的負責人,并擔任華盛頓大學(西雅圖)片仿、香港中文大學(深圳)和同濟大學兼職教授纹安,及中央美術(shù)學院榮譽教授尤辱。曾在IEEE砂豌、ACM、ACL光督、AAAI等學會的期刊和學術(shù)會議擔任編委阳距、組委或領(lǐng)域主席。主要從事人工智能領(lǐng)域结借,包括深度學習筐摘、自然語言處理、語音識別船老、計算機視覺咖熟、信息檢索和多模態(tài)智能等方面的研究。
深度學習方法在圖像和語音處理上已經(jīng)有了優(yōu)異表現(xiàn)柳畔。而在自然語言處理領(lǐng)域馍管,雖然我們也取得了一些激動人心的進展,但是更深層次的問題還有待突破薪韩。語言是人類獨有的智慧确沸,相信在未來的某一天,人工智能也能像人一樣做到對語言有充分的理解力俘陷。要做到這一點罗捎,何曉冬博士認為自然語言處理技術(shù)可從語言理解和語言生成兩個視角進行更加深入的研究,而更具挑戰(zhàn)的人機對話問題不僅是一個語言理解與生成的問題拉盾,還包括了博弈與決策桨菜,并期待學術(shù)界和產(chǎn)業(yè)界攜手,基于大規(guī)模實際應用場景和數(shù)據(jù),在長文本創(chuàng)作倒得、情感智能替蔬、多模態(tài)智能和對話智能等四個重要方向產(chǎn)生新的技術(shù)突破,在智能客服屎暇、智能零售承桥、融媒體、智能用藥與醫(yī)療服務根悼、智能咨詢與輔助決策等方面帶來產(chǎn)業(yè)提升凶异。
讓人工智能理解人類語言
自然語言理解領(lǐng)域中有兩個比較核心的問題。一個是語義表征挤巡,比如通過深度神經(jīng)網(wǎng)絡從自然語言中抽取出語義并將其投影到一個連續(xù)的語義向量空間剩彬。另一個是知識圖譜,比如用一個圖來表示結(jié)構(gòu)化的知識矿卑,圖中節(jié)點代表了重要的物體和實體喉恋,連線描述了實體間的關(guān)系。獲得了知識圖譜之后母廷,就可以進行知識推理和知識拓展等更多的研究轻黑。而針對這些核心問題的算法和模型將進一步支持語義匹配、搜索琴昆、推薦氓鄙、文本分類、語義解析业舍、機器問答等各種應用抖拦。
讓人工智能用人類能理解的方式表達
我們對于人工智能有著越來越高的期望,希望它不僅能理解自然語言舷暮,更能生成或者說創(chuàng)作自然語言√铮現(xiàn)在人工智能可以用多種方式來生成人類可理解的內(nèi)容,比如可以寫詩下面、寫文案复颈、整理文本摘要,甚至可以創(chuàng)作一個菜譜诸狭,機器翻譯也可大致看成是整合了語言理解與語言生成的一個系統(tǒng)券膀,而基本的人機對話系統(tǒng)也可看成在理解人的意圖后,生成合適的回復驯遇。在最近幾年芹彬,基于深度學習技術(shù),我們在上面這些語言理解與生成問題上都取得了比較明顯的進展叉庐。
自然語言處理新的突破在哪里
何曉冬博士預測舒帮,自然語言處理這個研究領(lǐng)域在未來可能會從文本創(chuàng)作、情感智能、多模態(tài)智能和對話智能等多個方向得到突破玩郊。首先是對于長文本內(nèi)容的創(chuàng)作肢执,要具備寫作邏輯。人工智能需要確立一個模型译红,使得主題预茄、子主題的結(jié)構(gòu)可以展開,并且能夠在模型上得到體現(xiàn)侦厚,最后才能真正寫出一篇前后邏輯嚴謹耻陕,有意義的文章。
其次是要理解用戶的情感刨沦,知道用戶的訴求诗宣,生成共情的對話,配合情感進行相應表達想诅。同時召庞,多模態(tài)學習也是一個新興的領(lǐng)域,包括從基礎(chǔ)的跨模態(tài)語義表征學習来破,比如語言-視覺多模態(tài)預訓練篮灼,到多模態(tài)知識獲取和知識推理,再到多模態(tài)智能的應用讳癌,比如圖像到文字描述穿稳、文本到圖像生成存皂、視覺-文本問答晌坤、語言-視覺導航等等。多模態(tài)智能技術(shù)將之前各個子領(lǐng)域的相對孤立的研究進行融合旦袋,并將驅(qū)動一系列新技術(shù)的研究骤菠。
最后是實現(xiàn)大規(guī)模復雜任務下的人機對話。這樣的人機對話技術(shù)不僅包含語言理解與應答疤孕、還需要具有全局優(yōu)化的博弈與決策能力商乎,比如在復雜場景下服務用戶時如何能達到用戶體驗與服務成本或效率的雙贏。為了實現(xiàn)這樣的目標祭阀,我們不但要讓人機對話系統(tǒng)承載情感分析與多模態(tài)信息處理的能力鹉戚,還可以探索增強學習在自然語言中的應用,讓機器自動從對話數(shù)據(jù)中學習到最優(yōu)的策略专控。有些研究人員還提出了新的遷移學習和主動學習的模型抹凳,包括把一個模型從一個領(lǐng)域遷移到另外一個領(lǐng)域,以及基于少量樣本就能有效學習伦腐,從而讓模型在一個新領(lǐng)域迅速達到很高的水平赢底。
語言理解作為一個核心技術(shù),就是能夠溝通人和世界的交流,我們希望機器能夠更進一步的進化到高級智能和通用智能幸冻,能夠自動學習和自我創(chuàng)新粹庞,然后在一些特定領(lǐng)域甚至比人做的更好,并能夠規(guī)那⑺穑化工程化庞溜,從而為用戶帶來更好的體驗,對產(chǎn)業(yè)帶來效率的提升碑定。何曉冬表示“我們的終極目標是用人工智能幫助人類更好的連接這個世界强缘。”