NIPS?現場:一文看清阿里巴巴三大部門如何發(fā)力人工智能

姓名:張萌? ? ? ? ? 學號17021211113

轉自:http://mp.weixin.qq.com/s/lLTSmENldxQW0CwyOIOLqQ

【嵌牛導讀】:作為世界最頂尖的機器學習和神經網絡學術會議今野,NIPS(神經信息處理系統(tǒng)進展大會)在過去的兩年敞開大門枉昏,邀請工業(yè)界的巨頭們搭設展臺咱娶,展示他們在人工智能上的研究和商業(yè)成果膜赃。今年是阿里巴巴第二次參加 NIPS夫偶。相比去年,今年的阿里巴巴顯得底氣十足只恨。

【嵌牛鼻子】:阿里巴巴? 人工智能

【嵌牛提問】:阿里在人工智能上的研究和商業(yè)成果是什么运怖?

【嵌牛正文】:過去一年,阿里巴巴在人工智能商業(yè)化道路上碩果累累搀矫。7 月抹沪,阿里巴巴發(fā)布了首款智能語音音箱天貓精靈,在雙 11 當天售出了 100 萬臺瓤球;10 月融欧,阿里巴巴在杭州云棲大會上推出了 AliGenie 語音開放平臺,以及 AR 開放平臺卦羡;11 月噪馏,剛剛從烏鎮(zhèn)參加完世界互聯網大會的馬云,在上海的申通地鐵上用語音交互的方式購買了一張地鐵票绿饵,向其構想的城市大腦近了一步欠肾。

在學術研究上,阿里巴巴也交了份不錯的答題卷拟赊。ACM MM2020 會議主辦權落戶阿里巴巴刺桃,使其成為首個獲得主辦權的中國企業(yè)。城市大腦成為首批入選國家新一代人工智能開放創(chuàng)新平臺的人工智能技術服務吸祟。在此前的 IJCAI 會議上瑟慈,阿里巴巴有 11 篇論文入選,CVPR 會議入選 4 篇屋匕、KDD 會議入選 5 篇葛碧,ACM MM 會議入選 3 篇。此次 NIPS 大會上过吻,阿里巴巴有兩篇論文入選 Workshop 并進行 Oral 和 Poster 形式報告进泼。

阿里巴巴在人工智能上的光鮮,歸功于其底層技術疮装。在烏鎮(zhèn)缘琅、在上海,你看不到的研究人員和科學家們廓推,來到了洛杉磯長灘的 NIPS 大會上刷袍,展示了這些技術孵化的全過程。阿里巴巴 iDST 院長金榕樊展、阿里巴巴人工智能實驗室的高級專家張碩呻纹、阿里巴巴搜索事業(yè)部的研究員李欣博士分別開設了迷你研討會堆生,介紹阿里巴巴在人工智能領域的創(chuàng)新。

iDST:多媒體信息檢索和模型壓縮

如今的阿里巴巴不再只是定位于一家電子商務公司雷酪,在除了包括淘寶淑仆、天貓等電子商務業(yè)務以外,阿里巴巴更著眼于生態(tài)系統(tǒng)的建設哥力,囊括數字營銷(阿里媽媽)蔗怠、視頻(優(yōu)酷)、金融科技(螞蟻金服)吩跋、社交媒體(微博)寞射、地圖(高德)、物流(菜鳥)等不同的業(yè)務锌钮。

這就需要阿里巴巴 iDST(數據科學與技術研究院)的人工智能技術賦能桥温。在 NIPS 阿里巴巴的展區(qū),iDST 院長金榕展示了今年在計算機視覺和深度學習模型優(yōu)化方面的技術成果梁丘。

圖片發(fā)自簡書App

阿里巴巴 iDST 院長金榕

在計算機視覺領域侵浸,金榕提到了 2014 年上線移動端淘寶的拍立淘。簡單而言就是通過搜索圖片找到相應的產品氛谜。拍立淘剛上線時還無人問津掏觉,但現在已經成為移動端淘寶最重要的商品搜索功能之一,擁有超過千萬級日活躍用戶混蔼,幾十億商品圖片的離線索引構和在線查詢履腋。

拍立淘主要通過深度學習對商品進行排序。模型通過輸入用戶記錄的三元組數據(查詢圖片惭嚣、點擊圖片和未點擊圖片)來訓練模型的排序損失函數遵湖,按照從高到底的順序列出最有可能匹配的商品。

拍立淘的技術也被應用到跨媒介的信息檢索晚吞,比如通過文字來搜索相應的圖片延旧。下圖中,你可以輸入不同的文字描述槽地,從裙子到紅色 V 領短裙迁沫,輸出的結果也更加精準。

圖片發(fā)自簡書App

另一個展示成果是模型壓縮捌蚊。深度學習模型的層級數動輒成百上千集畅,擁有幾十億個參數,這對存儲和預測時間都帶來困難缅糟。

iDST 研究員采用了低比特量化的方法挺智,所有的權值不用浮點數表示,而是用 +1窗宦、0赦颇、-1 表示二鳄。原來一個 32bit 權值現在只需要三個 bit 就可以表示,可以極大地減小模型尺寸媒怯。

同時订讼,為了解決低比特量化所帶來的不穩(wěn)定性,iDST 引入了交替方向乘子法(Alternating Direction Method of Multipliers扇苞,ADMM)欺殿。這是一種最優(yōu)化算法,主要針對帶約束的凸優(yōu)化問題鳖敷。此外為了更有效地運行 ADMM祈餐,iDST 開發(fā)了額外梯度下架方法(extra gradient descent method)來解決優(yōu)化問題。

試驗結果顯示哄陶,三比特(-1、0哺壶、1)方法相比全精確度幾乎沒有明顯的損失屋吨。

圖片發(fā)自簡書App

人工智能實驗室:AliGenie 語音助手和 AR 開放平臺

在 2016 年低調成立的阿里巴巴人工智能實驗室,目前已經擁有了 200 多位科學家和研究員山宾。相比于 iDST 偏向深度學習領域的研發(fā)至扰,人工智能實驗室的定位是研究消費級產品。

據人工智能實驗室的高級專家張碩介紹资锰,人工智能實驗室的主要任務是打造下一代的人機交互平臺敢课,并且在三個方面帶來人性化的機器:感知和推理能力(語音識別、語言理解和計算機視覺)绷杜;知識數據庫(包括知識圖譜和用戶配置文件)直秆;按需行為(服務和流動性)。

圖片發(fā)自簡書App

張碩在介紹阿里巴巴人工智能實驗室

隨后鞭盟,張碩介紹了實驗室在今年推出的三個主要產品:智能音箱圾结、語音開放平臺 AliGenie、和 AR 開放平臺齿诉。

天貓精靈 X1 是阿里巴巴推出的首款智能音箱筝野。搭載了 AliGenie 人機交互系統(tǒng),類似于亞馬遜的 Alexa粤剧。除了繼承了大部分智能音箱的特點外歇竟,天貓精靈 X1 采用了聲紋識別技術,能夠直接識別用戶聲音抵恋,直接進入用戶賬號實現語音購物焕议。

圖片發(fā)自簡書App

天貓精靈 X1 智能音箱

天貓精靈 X1 背后的交互系統(tǒng) AliGenie 也在云棲大會上實現了升級,成為了可以讓普通智能硬件搭載的語音開放平臺馋记。目前号坡,AliGenie 平臺面向硬件品牌商和方案商提供語音交互技術懊烤、自然語言處理能力、云服務系統(tǒng)宽堆、開發(fā)工具包和軟硬件及量化標準腌紧。針對個人和行業(yè)應用開發(fā)者,AliGenie 平臺提供包括語音喚醒畜隶、語音識別壁肋、聲紋識別、語意理解籽慢、語音合成的開發(fā)者套件浸遗。

同時與 AliGenie 推出的 AR 開放平臺意味著阿里巴巴發(fā)力機器視覺。AR 開放平臺將面向開發(fā)者開放 2D 識別追蹤箱亿、3D 識別追蹤跛锌、內容制作平臺、高質量渲染引擎等核心能力届惋。開發(fā)者通過接入套件髓帽,即可快速創(chuàng)建 AR 內容,無需擔心開發(fā)算法脑豹,使用傳感器郑藏,GPU 優(yōu)化等難題。

搜索事業(yè)部:用戶個性化搜索引擎

從電商起步的阿里巴巴瘩欺,重視在商品搜索的提升必盖。來自阿里巴巴搜索事業(yè)部的研究員李欣博士在 NIPS 大會第三天帶來了有關深度學習優(yōu)化商品搜索的演講。

圖片發(fā)自簡書App

李欣博士在介紹深度學習優(yōu)化商品搜索

阿里巴巴的商品搜索技術從 2013 至今經歷過五次重大的迭代俱饿。如今歌粥,阿里巴巴的搜索平臺都依賴于深度學習技術。

商品搜索的基礎架構主要分三層:最底層是數據平臺稍途,實時處理用戶需求和用戶標簽阁吝,同時做線下預測和線下模型訓練;中間層主要負責關鍵詞索引和個性化索引械拍;最上層是做搜索平臺突勇、個性化引擎和圖像引擎。

目前坷虑,阿里巴巴的商品搜索團隊的發(fā)展方向主要有三個:構建更大規(guī)模的排序系統(tǒng)的機器學習平臺甲馋;提升排序系統(tǒng)對用戶行為的快速反應能力;提高算法的效率迄损。

搜索團隊使用了一種叫做深度用戶個性化網絡(Deep User Perception Network定躏,DUPN),通過輸入用戶信息和商品信息,實現多個不同的任務痊远,比如預測用戶的商品點擊率垮抗、預測用戶對商品的價格偏好、以及最終的商品排序碧聪。

圖片發(fā)自簡書App

「這個網絡最大的特點的是基于環(huán)境變化的注意力機制冒版。個性化搜索會基于當前時段的熱門商品和用戶興趣而改變,比如在雙 11 的時候逞姿,超過 100 萬的用戶購買了阿里巴巴最新推出的智能語音音箱天貓精靈 X1辞嗡,商品價格和用戶興趣都因為雙 11 這一天而發(fā)生改變≈驮欤」李欣博士表示续室。

正是基于這一點,DUPN 增加了 Attention 用于線上模型捕捉環(huán)境變化谒养,然后調整參數挺狰。

在表示商品特征時,DUPN 采用了多模態(tài)的表征买窟,比如商品 ID她渴、文字描述、圖片描述蔑祟、統(tǒng)計描述。從結果看沉唠,基于多模態(tài)的模型能夠比單一模態(tài)的模型在學習等級信息檢索(LETOR)疆虚,用戶點擊率(CTR)和價格預測上取得更好的準確率。

相比于 DNN满葛,CNN 和 LSTM径簿,訓練后的 DUPN 有著更好的效果,而 end-to-end DUPN 則基于 pre-DUPN 在價格預測上有著進一步的提升嘀韧。

圖片發(fā)自簡書App

為了提升模型的效率篇亭。阿里巴巴團隊采用了 Cascade Learning,將數據分成不同層級锄贷。如下圖所示译蒂,一開始的數據只采用商品的幾個特征,之后會逐步增加特征谊却。

而在算法推理加速上柔昼,阿里巴巴團隊加入了 Binary-Value Network,能夠得到更小的模型炎辨、更快的速度捕透,代價是損害一些準確率。從結果上看,相比于原始矩陣乙嘀,采用 BNN 之后的信息吞吐量可以提升至三倍末购。

在購物搜索這個領域,李欣博士指出還存在很多挑戰(zhàn)虎谢。比如:如何覆蓋新用戶和新物品盟榴;多模態(tài)交互則是一個有趣的話題,可以利用商品圖片的特征來提升排序算法的質量嘉冒;同時斟湃,阿里巴巴自己研發(fā)的虛擬語音機器人阿里小蜜也可以和搜索系統(tǒng)相結合,用基于語音或者文字的交互來推薦商品甘邀。

近兩年葵腹,阿里巴巴一直在加大技術研究,以實現在基礎科學和顛覆性技術上取得進展银觅。在今年杭州云棲大會上礼饱,阿里巴巴成立全球性技術研究機構「達摩院」,未來三年在技術上總投入將超過 1000 億人民幣究驴,并公布涵蓋機器智能镊绪、智聯網、金融科技等多個產業(yè)領域的技術研究內容洒忧。

阿里巴巴表示蝴韭,明年乃至于之后的每年,阿里巴巴都將會是 NIPS 的澄跏蹋客榄鉴,并在這個舞臺展示其人工智能的創(chuàng)新。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末蛉抓,一起剝皮案震驚了整個濱河市庆尘,隨后出現的幾起案子,更是在濱河造成了極大的恐慌巷送,老刑警劉巖驶忌,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異笑跛,居然都是意外死亡付魔,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進店門飞蹂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來抒抬,“玉大人,你說我怎么就攤上這事晤柄〔两#” “怎么了?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長惠勒。 經常有香客問我赚抡,道長,這世上最難降的妖魔是什么纠屋? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任涂臣,我火速辦了婚禮,結果婚禮上售担,老公的妹妹穿的比我還像新娘赁遗。我一直安慰自己,他們只是感情好族铆,可當我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布岩四。 她就那樣靜靜地躺著,像睡著了一般哥攘。 火紅的嫁衣襯著肌膚如雪剖煌。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天逝淹,我揣著相機與錄音耕姊,去河邊找鬼。 笑死栅葡,一個胖子當著我的面吹牛茉兰,可吹牛的內容都是我干的。 我是一名探鬼主播欣簇,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼邦邦,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了醉蚁?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤鬼店,失蹤者是張志新(化名)和其女友劉穎网棍,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體妇智,經...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡滥玷,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了巍棱。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片惑畴。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖航徙,靈堂內的尸體忽然破棺而出如贷,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布杠袱,位于F島的核電站尚猿,受9級特大地震影響,放射性物質發(fā)生泄漏楣富。R本人自食惡果不足惜凿掂,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望纹蝴。 院中可真熱鬧庄萎,春花似錦、人聲如沸塘安。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽耙旦。三九已至脱羡,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間免都,已是汗流浹背锉罐。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留绕娘,地道東北人脓规。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像险领,于是被迫代替她去往敵國和親侨舆。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內容