如果人要和機(jī)器人談戀愛,最大的障礙是什么灭将?

近年阿爾法狗與人類的圍棋“人機(jī)大戰(zhàn)”炒得火熱疼鸟,在這個(gè)新聞熱點(diǎn)的背后大家都會(huì)思考一個(gè)問題:人類和人工智能除了各種大戰(zhàn)之外,是否能夠?qū)崿F(xiàn)和諧共存庙曙?比如人類和機(jī)器人之間是否會(huì)有愛情出現(xiàn)呢空镜?

當(dāng)然,這樣的場(chǎng)景在很多電影中都已經(jīng)出現(xiàn)過,最近的一則消息讓大家對(duì)這個(gè)話題更有了一些想象空間:由斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering)挑戰(zhàn)賽榜單更新成績(jī)姑裂,科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室(HFL)提交的系統(tǒng)模型奪得第一名寶座馋袜,這也是中國(guó)本土研究機(jī)構(gòu)首次取得該賽事的榜首。

SQuAD挑戰(zhàn)賽最新成績(jī)榜單

SQuAD挑戰(zhàn)賽是行業(yè)內(nèi)公認(rèn)的“機(jī)器閱讀理解標(biāo)準(zhǔn)水平測(cè)試”舶斧,也是該領(lǐng)域的頂級(jí)賽事欣鳖,被譽(yù)為機(jī)器閱讀理解界的ImageNet(圖像識(shí)別領(lǐng)域的頂級(jí)賽事)。參賽者來自全球?qū)W術(shù)界和產(chǎn)業(yè)界的研究團(tuán)隊(duì)茴厉,包括微軟亞洲研究院泽台、艾倫研究院、IBM矾缓、Salesforce怀酷、Facebook、谷歌以及卡內(nèi)基·梅隆大學(xué)嗜闻、斯坦福大學(xué)等知名企業(yè)研究機(jī)構(gòu)和高校蜕依,賽事對(duì)自然語言理解的進(jìn)步有重要的推動(dòng)作用。

如果人類想和機(jī)器人談戀愛琉雳,最大的困難就是:機(jī)器閱讀的長(zhǎng)句理解

電影《Her》講述了主人公西奧多在結(jié)束了一段令他心碎的愛情長(zhǎng)跑之后样眠,他愛上了電腦操作系統(tǒng)里的女聲,這個(gè)叫“薩曼莎”的姑娘不僅有著略微沙啞的性感嗓音翠肘,并且風(fēng)趣幽默檐束、善解人意,讓孤獨(dú)的男主泥足深陷束倍。

薩曼薩其實(shí)就是人工智能被丧,它通過掃描主人公的郵件,閱讀與主人相關(guān)的資料后绪妹,越來像主人公去世的女友甥桂,兩人就開啟了一段人機(jī)戀愛的故事。

這部電影涉及到了一個(gè)很專業(yè)的人工智能領(lǐng)域喂急,如果機(jī)器要和人談戀愛格嘁,首先機(jī)器必須能夠理解自然語言,有關(guān)自然語言理解的最大難點(diǎn)就在于:長(zhǎng)句的閱讀理解廊移!

現(xiàn)在人類已經(jīng)在圖像識(shí)別糕簿、機(jī)器翻譯、語音識(shí)別等領(lǐng)域取得了卓越的成績(jī)狡孔。人類學(xué)家認(rèn)為懂诗,語言是構(gòu)建人類文明的基石。在語言上苗膝,我們構(gòu)建了神話殃恒、宗教;構(gòu)建了城邦、帝國(guó)离唐;構(gòu)建了信任病附、信仰;甚至我們自己還發(fā)明了編程語言亥鬓。很長(zhǎng)一段時(shí)間完沪,自然語言處理研究都是基于句子級(jí)別的閱讀理解,例如給一個(gè)句子嵌戈,理解句子中的主謂賓覆积、定狀補(bǔ)等等,但是長(zhǎng)文的理解一直都是難點(diǎn)熟呛。

舉例:

萊茵河是一條位于歐洲的著名河流宽档,始于瑞士阿爾卑斯山,流經(jīng)瑞士庵朝、奧地利吗冤、列支敦士登、法國(guó)九府、德國(guó)欣孤、荷蘭,最終在荷蘭注入北海昔逗。萊茵河上最大的城市是德國(guó)科隆。它是中歐和西歐區(qū)域的第二長(zhǎng)河流篷朵,位于多瑙河之后勾怒,約1230公里。

若針對(duì)該段內(nèi)容提問:什么河比萊茵河長(zhǎng)声旺?人們可以輕易地給出答案:多瑙河笔链。但目前,即使是最佳的系統(tǒng)模型R-NET給出的答案也并不盡人意腮猖,它的回答是科隆鉴扫。對(duì)人類來說,這是一個(gè)非常簡(jiǎn)單的閱讀理解題澈缺,但對(duì)機(jī)器的閱讀理解能力來說坪创,這是超級(jí)困難的。

科大訊飛在機(jī)器閱讀理解標(biāo)準(zhǔn)水平測(cè)試SQuAD挑戰(zhàn)賽中姐赡,勇奪第一

SQuAD挑戰(zhàn)賽通過眾包的方式構(gòu)建了一個(gè)大規(guī)模的機(jī)器閱讀理解數(shù)據(jù)集(包含10萬個(gè)問題)莱预,就是將一篇幾百詞左右的短文給人工標(biāo)注者閱讀,讓標(biāo)注人員提出最多5個(gè)基于文章內(nèi)容的問題并提供正確答案项滑;短文原文則來源于500多篇維基百科文章依沮。參賽者提交的系統(tǒng)模型在閱讀完數(shù)據(jù)集中的一篇短文之后,回答若干個(gè)基于文章內(nèi)容的問題,然后與人工標(biāo)注的答案進(jìn)行比對(duì)危喉,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果宋渔。

SQuAD挑戰(zhàn)賽主頁(yè)

SQuAD向參賽者提供訓(xùn)練集用于模型訓(xùn)練,以及一個(gè)規(guī)模較小的數(shù)據(jù)集作為開發(fā)集辜限,用于模型的調(diào)優(yōu)和選型皇拣。與此同時(shí),SQuAD還提供了一個(gè)開放平臺(tái)供參賽者提交自己的算法列粪,由SQuAD官方利用隱藏的測(cè)試集對(duì)參賽系統(tǒng)進(jìn)行評(píng)分审磁,并在SQuAD官方確認(rèn)后將相關(guān)結(jié)果更新到官網(wǎng)上。得益于SQuAD提供的大規(guī)模高質(zhì)量的訓(xùn)練數(shù)據(jù)以及層出不窮的模型岂座,該挑戰(zhàn)賽的榜單一次又一次的刷新态蒂。目前,科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室提交的系統(tǒng)模型取得了精確匹配77.845%和模糊匹配85.297%的成績(jī)费什,位列世界第一钾恢。

科大訊飛,是如何做到的鸳址?

在SQuAD官網(wǎng)的成績(jī)榜單上瘩蚪,可以看到科大訊飛與哈工大聯(lián)合實(shí)驗(yàn)室提交的模型名為“Interactive AoA Reader”,這是訊飛經(jīng)過不斷摸索之后提出的“基于交互式層疊注意力模型”(Interactive Attention-over-Attention Model)稿黍。正是這個(gè)與眾不同的模型疹瘦,讓科大訊飛在全球自然語言理解研究領(lǐng)域脫穎而出、躍居頭名巡球。

機(jī)器閱讀理解問題的解決言沐,傳統(tǒng)的自然語言處理(NLP)方式是采用分拆任務(wù)的方法將其分成問題分析、篇章分析酣栈、關(guān)鍵句抽取等一些步驟险胰,但這種方法容易造成級(jí)聯(lián)誤差的積累,很難得到很好的效果矿筝。

目前在機(jī)器閱讀理解領(lǐng)域中起便,則多采用完全端到端的神經(jīng)網(wǎng)絡(luò)建模,消除了分步驟產(chǎn)生的級(jí)聯(lián)誤差窖维。除此之外榆综,采用神經(jīng)網(wǎng)絡(luò)的方法能夠通過大量的訓(xùn)練數(shù)據(jù)學(xué)習(xí)到泛化的知識(shí)表示,對(duì)篇章和問題從語義層面上高度抽象化陈辱。

訊飛同樣也采用了端到端的神經(jīng)網(wǎng)絡(luò)模型奖年,但把精力更多放在如何能夠模擬人類在做閱讀理解問題時(shí)的一些方法。訊飛提出的基于交互式層疊注意力模型沛贪,主要思想是根據(jù)給定的問題對(duì)篇章進(jìn)行多次的過濾陋守,同時(shí)根據(jù)已經(jīng)被過濾的文章進(jìn)一步篩選出問題中的關(guān)鍵提問點(diǎn)震贵。這樣“交互式”地逐步精確答案的范圍,與其他參賽者的做法不太相同水评,最終收獲了令人矚目的成績(jī)猩系。

讓機(jī)器能夠閱讀理解,究竟有什么意義中燥?

首先寇甸,讓機(jī)器實(shí)現(xiàn)“能聽會(huì)說”到“能理解會(huì)思考”,也一直是科大訊飛所肩負(fù)的使命和方向疗涉∧妹梗科大訊飛認(rèn)為,人工智能的發(fā)展主要分為運(yùn)算智能咱扣、感知智能和認(rèn)知智能绽淘。機(jī)器在運(yùn)算智能上有極大的優(yōu)勢(shì),在感知智能上也已經(jīng)取得了很大的進(jìn)展闹伪,例如語音識(shí)別沪铭、語音合成、圖像識(shí)別偏瓤、機(jī)器翻譯等∩钡。現(xiàn)在全球的研究機(jī)構(gòu)都在尋找由感知智能向認(rèn)知智能突破的關(guān)鍵缺口,在認(rèn)知智能方面厅克,自然語言處理一直是實(shí)現(xiàn)人機(jī)交互赔退、人工智能的重要技術(shù)基石,機(jī)器閱讀理解正是實(shí)現(xiàn)這一領(lǐng)域突破的一個(gè)研究焦點(diǎn)证舟。只有人工智能突破了閱讀理解离钝,才能真正進(jìn)入認(rèn)知智能領(lǐng)域,人工智能才會(huì)越來越智能褪储、聰明!

早在2014年慧域,科大訊飛與哈爾濱工業(yè)大學(xué)就聯(lián)合成立了聯(lián)合實(shí)驗(yàn)室(HFL)鲤竹,作為“訊飛超腦”計(jì)劃的核心研發(fā)團(tuán)隊(duì)之一,聯(lián)合實(shí)驗(yàn)室致力于在語言認(rèn)知計(jì)算領(lǐng)域進(jìn)行長(zhǎng)期昔榴、深入的技術(shù)創(chuàng)新辛藻,重點(diǎn)突破深層語義理解、邏輯推理決策互订、自主學(xué)習(xí)進(jìn)化等認(rèn)知智能關(guān)鍵技術(shù)吱肌,并圍繞教育學(xué)習(xí)、人機(jī)語音交互仰禽、信息安全等領(lǐng)域?qū)崿F(xiàn)科研成果的規(guī)牡化應(yīng)用纺蛆。

科大訊飛不僅能夠提供各類人工智能教育產(chǎn)品,為廣大師生提供教學(xué)系統(tǒng)解決方案规揪,更是推出了專門針對(duì)考試評(píng)分的全學(xué)科閱卷系統(tǒng)桥氏,能讓機(jī)器人做考試評(píng)分,特別是給考卷的主觀題評(píng)分猛铅。以語文考試的作文為例字支,在閱卷之前老師們先設(shè)置一套通用的打分標(biāo)準(zhǔn),包括字跡工整度奸忽、詞匯豐富性堕伪、句子通順度、文采栗菜、篇章結(jié)構(gòu)欠雌、立意等多個(gè)層次,研究人員讓機(jī)器來學(xué)習(xí)這套方案后進(jìn)行閱卷苛萎。這每一項(xiàng)標(biāo)準(zhǔn)背后都需要精密復(fù)雜的技術(shù)支持桨昙,比如手寫識(shí)別、主題模型腌歉、人工神經(jīng)網(wǎng)絡(luò)等蛙酪。

目前,科大訊飛的全學(xué)科閱卷技術(shù)在四六級(jí)翘盖、部分省份的高考桂塞、中考等大規(guī)模考試中進(jìn)行了試點(diǎn)驗(yàn)證馍驯,驗(yàn)證結(jié)果表明計(jì)算機(jī)評(píng)分結(jié)果已經(jīng)達(dá)到了現(xiàn)場(chǎng)閱卷老師的水平阁危,完全滿足大規(guī)模考試的需要汰瘫。這項(xiàng)技術(shù)應(yīng)用到正式考試中狂打,就可以輔助人工閱卷,減少人員投入混弥,降低人工閱卷中疲勞趴乡、情緒等因素的影響,進(jìn)一步提升閱卷效率和準(zhǔn)確性蝗拿。

此前晾捏,哈工大訊飛聯(lián)合實(shí)驗(yàn)室曾先后在Google DeepMind閱讀理解公開數(shù)據(jù)測(cè)試集、Facebook閱讀理解公開數(shù)據(jù)測(cè)試集取得世界最好成績(jī)哀托,本次在SQuAD測(cè)試集再獲全球最佳惦辛,包攬了機(jī)器閱讀理解權(quán)威測(cè)試集的“大滿貫”。機(jī)器閱讀理解技術(shù)擁有廣闊的應(yīng)用場(chǎng)景仓手,例如在產(chǎn)品的精準(zhǔn)問答胖齐、開放域的問答上都會(huì)起到有力的支撐作用玻淑,訊飛也在不斷探索機(jī)器閱讀理解技術(shù)的應(yīng)用落地。但對(duì)于機(jī)器閱讀理解的“能理解會(huì)思考”的終極目標(biāo)來說市怎,現(xiàn)在還只是萬里長(zhǎng)征的開始岁忘,對(duì)自然語言的更深層次的歸納、總結(jié)区匠、推理干像,一定是未來機(jī)器閱讀理解不可缺少的部分。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末驰弄,一起剝皮案震驚了整個(gè)濱河市麻汰,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌戚篙,老刑警劉巖五鲫,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異岔擂,居然都是意外死亡位喂,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門乱灵,熙熙樓的掌柜王于貴愁眉苦臉地迎上來塑崖,“玉大人,你說我怎么就攤上這事痛倚」嫫牛” “怎么了?”我有些...
    開封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵蝉稳,是天一觀的道長(zhǎng)抒蚜。 經(jīng)常有香客問我,道長(zhǎng)耘戚,這世上最難降的妖魔是什么嗡髓? 我笑而不...
    開封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮收津,結(jié)果婚禮上器贩,老公的妹妹穿的比我還像新娘。我一直安慰自己朋截,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開白布吧黄。 她就那樣靜靜地躺著部服,像睡著了一般。 火紅的嫁衣襯著肌膚如雪拗慨。 梳的紋絲不亂的頭發(fā)上廓八,一...
    開封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天奉芦,我揣著相機(jī)與錄音,去河邊找鬼剧蹂。 笑死声功,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的宠叼。 我是一名探鬼主播先巴,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼冒冬!你這毒婦竟也來了伸蚯?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤简烤,失蹤者是張志新(化名)和其女友劉穎剂邮,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體横侦,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡挥萌,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了枉侧。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片引瀑。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖棵逊,靈堂內(nèi)的尸體忽然破棺而出伤疙,到底是詐尸還是另有隱情,我是刑警寧澤辆影,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布徒像,位于F島的核電站,受9級(jí)特大地震影響蛙讥,放射性物質(zhì)發(fā)生泄漏锯蛀。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一次慢、第九天 我趴在偏房一處隱蔽的房頂上張望旁涤。 院中可真熱鬧,春花似錦迫像、人聲如沸劈愚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽菌羽。三九已至,卻和暖如春由缆,著一層夾襖步出監(jiān)牢的瞬間注祖,已是汗流浹背猾蒂。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留是晨,地道東北人肚菠。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像罩缴,于是被迫代替她去往敵國(guó)和親蚊逢。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容