近日青灼,斯坦福大學(xué)發(fā)起的機器閱讀理解領(lǐng)域頂級賽事SQuAD刷新排名,阿里巴巴憑借82.440的精準率打破了世界紀錄竣付,并且超越了人類82.304的成績馆匿。
SQuAD負責(zé)人Pranav Rajpurkar表示,2018年一個強勁的開始梨撞,第一個模型(阿里巴巴iDST團隊提交的SLQA +)在精準度匹配上超越人類表現(xiàn)雹洗,下一個挑戰(zhàn):模糊匹配,人類仍然領(lǐng)先2.5分卧波。
據(jù)了解时肿,SQuAD比賽構(gòu)建了一個大規(guī)模的機器閱讀理解數(shù)據(jù)集(包含10萬個問題),文章來源于500多篇維基百科文章港粱。人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后嗜侮,需要回答若干個基于文章內(nèi)容的問題,然后與標準答案進行比對,得出精確匹配(Exact Match)和模糊匹配(F1-score)的結(jié)果锈颗。
SQuAD是行業(yè)內(nèi)公認的機器閱讀理解頂級賽事顷霹,吸引了包括谷歌、卡內(nèi)基·梅隆大學(xué)击吱、斯坦福大學(xué)淋淀、微軟亞洲研究院、艾倫研究院覆醇、IBM朵纷、Facebook等知名企業(yè)研究機構(gòu)和高校的深度參與。
此次技術(shù)的重大突破源于阿里巴巴研究團隊提出的"基于分層融合注意力機制"的深度神經(jīng)網(wǎng)絡(luò)模型永脓。該模型能夠模擬人類在做閱讀理解問題時的一些行為袍辞,包括結(jié)合篇章內(nèi)容審題,帶著問題反復(fù)閱讀文章常摧,避免閱讀中遺忘而進行相關(guān)標注等搅吁。
據(jù)介紹,模型可以在捕捉問題和文章中特定區(qū)域關(guān)聯(lián)的同時落午,借助分層策略谎懦,逐步集中注意力,使答案邊界清晰溃斋;另一方面界拦,為避免過于關(guān)注細節(jié),采用融合方式將全局信息加入注意力機制梗劫,進行適度糾正享甸,確保關(guān)注點正確。
阿里巴巴自然語言處理首席科學(xué)家司羅表示梳侨,對于解決wiki類客觀知識問答蛉威,機器已經(jīng)取得非常好的結(jié)果,我們將繼續(xù)向?qū)νㄓ脙?nèi)容的"能理解會思考"的終極目標邁進猫妙。今后瓷翻,研發(fā)的重點在于把這項技術(shù)真正應(yīng)用在廣大實際場景聚凹,讓機器智能普惠生活割坠。
實事上,這項技術(shù)已經(jīng)在阿里巴巴內(nèi)部被廣泛使用妒牙。比如彼哼,每年雙11都會有大量的顧客對活動規(guī)則進行咨詢。阿里小蜜團隊通過使用司羅團隊的技術(shù)湘今,讓機器直接對規(guī)則進行閱讀敢朱,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。
再比如拴签,顧客還會針對單個商品詢問大量的基礎(chǔ)問題孝常,而這些問題其實在商品詳情頁都是有答案的。現(xiàn)在通過機器閱讀理解技術(shù)蚓哩,能夠讓機器對詳情頁中的商品描述文本進行更為智能地閱讀和回答构灸,降低服務(wù)成本的同時提高購買轉(zhuǎn)化率。
由司羅領(lǐng)導(dǎo)的自然語言處理團隊支撐了阿里巴巴整個生態(tài)的技術(shù)需求岸梨。由他們研發(fā)的AliNLP自然語言技術(shù)平臺每日調(diào)用1200億+次喜颁,Alitranx翻譯系統(tǒng)提供20個語種在線服務(wù)日調(diào)用量超過7億+次。此前曾在2016年ACM CIKM個性化電商搜索曹阔、2017年IJCNLP中文語法檢測CGED評測半开、2017年年美國標準計量局TAC評比英文實體分類等大賽中取得全球第一的成績。
作為國內(nèi)互聯(lián)網(wǎng)三巨頭之一赃份,阿里巴巴最近兩年開始加速在人工智能領(lǐng)域的布局寂拆。人工智能的主要布局方向:一是在電商和商家融合,二是給廠商技術(shù)支持。
2017年7月芥炭,阿里巴巴人工智能實驗室正式亮相漓库。其研究方向:消費級 AI產(chǎn)品的研發(fā)。第一款產(chǎn)品就是最近大家熟悉的智能語音終端設(shè)備"天貓精靈 X1"园蝠。
此外渺蒿,iDST(數(shù)據(jù)科學(xué)與技術(shù)研究院):被稱為是阿里巴巴最神秘的研究機構(gòu),分布在杭州彪薛、北京茂装、西雅圖、硅谷等地善延,是阿里巴巴負責(zé)人工智能技術(shù)研發(fā)的核心團隊少态、阿里巴巴NASA計劃的人工智能大腦。
除了人工智能實驗室易遣、數(shù)據(jù)科學(xué)與技術(shù)研究院iDST彼妻,阿里研究院、VR實驗室等在人工智能研究方面也有涉獵豆茫,螞蟻金服也具備自己的人工智能團隊侨歉。
此外,2017年3月阿里宣布推出"NASA"計劃揩魂,面向機器學(xué)習(xí)幽邓、芯片、IoT作系統(tǒng)火脉、生物識別這些核心技術(shù)組建新團隊牵舵,建立新的機制和方法柒啤。
與百度在無人駕駛領(lǐng)域的高調(diào)不同的是,阿里巴巴在人工智能領(lǐng)域畸颅,似乎更接地氣一些担巩。2017年6月,在阿里云棲大會上海峰會上没炒,阿里云發(fā)布了一系列云計算兵睛、大數(shù)據(jù)、人工智能等產(chǎn)品窥浪。
而且祖很,更為關(guān)鍵的是,阿里在本次大會上漾脂,還展示了人工智能技術(shù)落地的實際應(yīng)用場景假颇。比如阿里的ET環(huán)境大腦,一個可構(gòu)建出數(shù)字化的地球的人工智能云計算產(chǎn)品骨稿,具備分析全球植被綠化變遷笨鸡、自然災(zāi)害監(jiān)測、極端天氣預(yù)警等功能坦冠。
此外形耗,包括ET城市大腦、ET工業(yè)大腦辙浑、ET醫(yī)療大腦等也已經(jīng)開始落地應(yīng)用激涤。譬如,用ET城市大腦來解決杭州的交通擁堵問題判呕,交警到達現(xiàn)場的時間從15分鐘降到3分鐘;再如倦踢,ET醫(yī)療大腦幫助浙江大學(xué)附屬醫(yī)院以及很多的醫(yī)院合作,預(yù)防及早期發(fā)現(xiàn)甲狀腺結(jié)節(jié)與肺癌侠草,醫(yī)療準確性大幅提升辱挥,這是造福人類的大事;還有,ET工業(yè)大腦讓光伏生產(chǎn)商協(xié)鑫的良品率提升了1%边涕,一年節(jié)省成本上億晤碘,徐工集團、中策橡膠功蜓、吉利等制造領(lǐng)域標桿企業(yè)园爷,也都引入了ET工業(yè)大腦。
阿里云的人工智能場景落地之路
在這次大會上霞赫,阿里云總裁胡曉在分享中腮介,還提到了電力肥矢、金融端衰、公共安全叠洗、教育等行業(yè),這意味著將來阿里云應(yīng)該會面向更多行業(yè)推出相應(yīng)的ET大腦旅东。
而此次阿里在全球頂級競賽中的表現(xiàn)灭抑,也為其下一步在行業(yè)人工智能應(yīng)用方面的拓展,增加了更大的砝碼抵代。
西安北郵在線人工智能課程正在火熱報名中腾节,2018,選擇北郵在線IT教育荤牍,幫你找份好工作0赶佟!康吵!