摘要:閔萬里將在10月的云棲大會·阿里云生態(tài)峰會上分享阿里云ET大腦的項目實踐翠桦,并重點介紹ET大腦的應用場景横蜒、技術挑戰(zhàn)和未來發(fā)展。
編者按:10月11-14日,為期四天的2017杭州云棲大會(門票火熱搶購中4陨巍)將再度在杭州云棲小鎮(zhèn)起航仅炊,作為全球最具影響力的科技展會之一,本屆大會將有不少阿里集團專家以及各企業(yè)行業(yè)領袖的精彩演講澎蛛。從今天開始抚垄,云棲社區(qū)將會對大會嘉賓做一系列專訪(關注“云棲大會”社區(qū)公眾號了解更多大會信息)。本期我們采訪的是阿里云人工智能科學家閔萬里谋逻,他將在10月的云棲大會·阿里云生態(tài)峰會上分享阿里云ET大腦的項目實踐督勺,并重點介紹ET大腦的應用場景、技術挑戰(zhàn)和未來發(fā)展斤贰。
2017杭州云棲大會詳情請戳這里智哀!
閔萬里,阿里云人工智能科學家荧恍,ET大腦負責人瓷叫。2004年博士畢業(yè)以后加入IBM,參與IBM智慧城市研究送巡,主攻大數據的研發(fā)和運用摹菠,2010-2012年在IBM新加坡做智慧城市,推動創(chuàng)新項目落地骗爆。2012年加入Google次氨,擔任數據科學家,做廣告競價的競價模型摘投。2013年9月加入阿里巴巴煮寡,組建了數據科學團隊,支持聚劃算和天貓做數據化運營犀呼。2015年加入阿里云幸撕,組建大數據孵化器團隊,探索DT技術在垂直行業(yè)的創(chuàng)新及落地外臂。2017年開始擔任阿里云大數據事業(yè)部的總經理繼續(xù)推動DT技術在各行各業(yè)的普及應用坐儿。
數據智能在阿里云的應用
閔萬里加入阿里后,便迅速組建了一直能夠兼顧項目研究和商業(yè)化落地的人工智能團隊宋光,這其中不得不提阿里云ET貌矿。
2016年4月,阿里云ET首次亮相罪佳,與此同時這也是首次以人工智能技術為背景逛漫,在歌唱比賽垂直業(yè)務場景中運用ET。
“這是ET首次直面公眾菇民,風險還是比較高的尽楔⊥洞ⅲ”閔萬里回憶道。
而最后的結果還是在這支團隊的意料之中阔馋,最終ET以42%的勝率一舉命中總決賽歌王李玟玛荞,并且在三輪比賽中都預測準確∨磺蓿“這個項目集合了阿里巴巴實時流計算的能力和多元數據實時分析的能力勋眯,還有實時預測的能力”,閔萬里表示下梢,這也阿里巴巴實時數據處理能力的一個集中展示客蹋。
和阿里巴巴其它人工智能應用場景不同,ET的首次亮相綜合運用了多數據來源孽江,包括互聯網采集數據讶坯、湖南衛(wèi)視的收視率數據、還有ET對上百萬首歌曲的學習和理解(包括每首歌好聽的層度岗屏、演繹好壞的層度辆琅、現場歌手的聲調)。閔萬里告訴云棲社區(qū)这刷,ET能夠對多種信號做實時解析婉烟,動態(tài)更新,每五秒做一次預測更新暇屋,而要處理這樣的任務對技術的挑戰(zhàn)是巨大的似袁。
“這里體現了很多能力,包括對歌曲的理解咐刨,以及對歌手每一句唱得好不好的分析昙衅。因為歌曲唱得好不好本身是很主觀的判斷,沒有明顯的客觀標準所宰∪拮穑”在開始比賽之前的一次性預測是很好實現的,但要收集這么大的數據量仔粥,五秒預測一次并更新,這就非常有挑戰(zhàn)性了蟹但。
閔萬里提到躯泰,為此,前期項目團隊花了很長的時間來準備數據华糖,以及讓ET學習歌曲并且做出預測麦向。用機器學習歌曲的特征,需要結合網絡上歌曲的點播量客叉、下載量诵竭、好評量等指標來判斷這是不是一首好的歌话告,這個主要體現了項目的實時計算能力。
2016年卵慰,正值人工智能最火的那段時間沙郭,而ET憑借優(yōu)異的表現毫無懸念的成為了業(yè)界關注的焦點。
不過對于閔萬里而言裳朋,如何把技術對外賦能病线,如何讓人工智能成為普惠技術,才是最終的目的鲤嫡。
阿里云ET項目之后送挑,閔萬里便開始推動ET大腦項目。ET大腦起初是從幾個垂直行業(yè)中孵化出來的暖眼,如城市大腦惕耕、工業(yè)大腦、環(huán)境大腦诫肠、醫(yī)療大腦這些具有明顯行業(yè)背景的赡突。可以說区赵,ET可以歸屬于音樂大腦惭缰。
在閔萬里看來,ET用于音樂笼才,而城市大腦用于城市管理漱受,工業(yè)大腦用于工業(yè)生產線,它們都是實時數據骡送、活數據昂羡、在線更新的。云棲社區(qū)了解到摔踱,ET城市大腦項目在杭州虐先、蕭山、蘇州等地與相關部門合作派敷,用城市大腦協助城市管理蛹批,具體內容包括實時信號燈控制——用互聯網、高德數據實時控制信號燈篮愉,這也意味著腐芍,大腦能消費的數據變得更多。
除了信號燈的控制试躏,利用iDST團隊研發(fā)的專有算法猪勇, ET大腦還可以自動巡檢幾千路的視頻信號,自動發(fā)現其中的異常點颠蕴,極大降低人工巡查的時間和精力泣刹;另外助析,城市大腦還能分析市民的出行意愿,調整公交班次椅您,自動調配外冀;除此之外,閔萬里還透露襟沮,他們正在做一些新的嘗試,比如在杭州某地最近進行的城市綠波帶嘗試开伏,把單個智能設備膀跌、單個智能系統串聯起來,形成一個全局的智能系統固灵,形成智能設備之間的有效聯動捅伤,來最大限度的服務社會,激發(fā)數據的價值巫玻。
在這樣的復雜場景下丛忆,ET大腦集成了多種人工智能技術,而這樣的項目研發(fā)所遇到的挑戰(zhàn)包括技術上的挑戰(zhàn)和社會環(huán)境的挑戰(zhàn)仍秤。
閔萬里談到熄诡,技術上的挑戰(zhàn)主要來自數據源和產品化兩方面:數據源的挑戰(zhàn)是指在很多垂直場景下,很多數據拿不出來诗力,或者沒辦法實時拿出來凰浮。一是因為數據獲取比較復雜,或者數據擁有者有很多顧慮苇本;二是因為有的數據擁有者雖然積極配合袜茧,但是數據殘次不齊,例如說有的城市的交警數據瓣窄,地面上很多線圈已經壞了笛厦,有的工業(yè)上的數據讀取中有很多工業(yè)協議讀取不了。
而產品化的挑戰(zhàn)則是大多人工智能應用場景的通舶诚Α:很多先進的人工智能技術和算法在實驗室里效果很好裳凸,但是移植到實戰(zhàn)當中部署的時候,需要面臨實驗室產品運用到行業(yè)的挑戰(zhàn)啥么,包括運行效率登舞、穩(wěn)健性等,比如出現數據斷傳的情況怎么辦悬荣,出現數據被污染的情況怎么辦,這些都是項目需要解決的問題疙剑。除了技術上的挑戰(zhàn)氯迂,團隊也面臨環(huán)境的挑戰(zhàn)践叠。很多人對這種出現的新技術是質疑的,當大家看不到價值的時候都喜歡問做這些有什么價值嚼蚀。對于一個創(chuàng)新者來說禁灼,沒有機會去證明他自己是很難回答這個問題的。
堅持普惠的ET大腦項目應用
目前轿曙,ET大腦涵蓋了城市大腦弄捕、工業(yè)大腦、醫(yī)療大腦以及環(huán)境大腦导帝。對于這些領域的選擇守谓,閔萬里給出了他的解答:第一,項目始終堅持普惠的理念您单,這些行業(yè)服務的是全人類斋荞,工業(yè)制造的效率提升可以讓老百姓從中受益;第二虐秦,技術上說這幾個行業(yè)都是數據密集型行業(yè)平酿,數據密度夠高,價值密度也很大悦陋;第三蜈彼,這些行業(yè)痛點尤其突出,因為大量的數據沒有被利用起來俺驶,數據不流動就成為了“庫存”幸逆,就會導致資產負擔,所以要把負債變成價值痒钝。
迄今各個大腦的進展都很順利秉颗,并且表現出了驚人的成績。城市大腦方面送矩,項目在杭州和蘇州與相關單位已經開始合作蚕甥,逐步推廣落地。目前在部分區(qū)域的視頻自動巡檢和交通狀態(tài)報警已經初見成效栋荸。工業(yè)大腦方面已經有不少成功的案例菇怀,比如流程制造的中策橡膠、協鑫晌块、天合光能爱沟。除此之外,在裝備制造匆背、離散制造中也開始了初步嘗試呼伸。醫(yī)療大腦方面,項目通過生態(tài)的力量推進醫(yī)療大腦在各個細分領域的研發(fā)钝尸,提供計算能力與算法服務括享。項目舉辦的醫(yī)療肺結節(jié)診斷大賽搂根,在本次云棲大會中即將完美收官,并且在肺結節(jié)的診斷上已經取得了階段性成果铃辖。環(huán)境大腦方面正在推進內蒙古自治區(qū)和阿里云ET環(huán)境大腦的合作剩愧,通過人工智能技術尋找保護環(huán)境的新方式,還利用環(huán)境大腦在江蘇對固廢污染源實現了智能感知娇斩。
事實上仁卷,現在的ET大腦已然成為了阿里云人工智能的代名詞,它很好地解決了兩方面的問題犬第。第一锦积,ET大腦能夠解決更多行業(yè)的問題,創(chuàng)新性的問題瓶殃;第二充包,ET大腦能夠承載一個平臺的使命,讓更多有想法的人利用ET大腦的開放架構來探索更多創(chuàng)新應用遥椿。ET大腦的身先士卒基矮,在一些垂直行業(yè)做出了創(chuàng)新的示范,極大證明了阿里云計算及大數據產品的潛力冠场。此外家浇,城市大腦、工業(yè)大腦碴裙、交通大腦钢悲、醫(yī)療大腦則會在接下來的航空、能源舔株、新零售甚至安全領域做一些創(chuàng)新性的示范莺琳。閔萬里表示,“我們希望通過這些示范能夠激活更多的外腦载慈,讓社會上一些有創(chuàng)造性想法惭等、有技術的公司能在ET大腦的架構上做自主創(chuàng)新,讓ET大腦不僅僅成為阿里云自主創(chuàng)新的大腦办铡,更是成為一個平臺支持全民創(chuàng)新辞做。”所以可以說寡具,ET大腦希望的是把公共數據資源的價值與業(yè)務的場景快速結合秤茅,產生實戰(zhàn)效果。
撥云見“智”童叠,人工智能協同共生的未來
談到阿里云ET大腦時框喳,閔萬里表示,這實質上都屬于數據智能范疇——用新技術(云計算和數智技術)加上新能源(數據),來打造新物種(新零售帖努、新制造等等)撰豺。他認為粪般,在數據智能的實踐上拼余,要找準業(yè)務場景、痛點以及最佳應用場景亩歹,要場景化和垂直化匙监,因為數據智能不止是一門技術,它還是技術與業(yè)務的結合小作,更是一種理念亭姥。
除了阿里集團本身擁有更多的算法和和計算能力之外,閔萬里的成功秘訣就是敢于想別人不敢想的事兒顾稀,挑戰(zhàn)不可能达罗。“當所有人都說不可能的時候静秆,有可能你就要成功了粮揉。”
當然抚笔,現在的人工智能遠遠沒有達到大眾的預期扶认。而對于未來的趨勢,閔萬里也給出了他的答案——語言視頻圖像等單維度功能的綜合協調是人工智能的下一步殊橙。
“未來的人工智能不止是視頻或者語音辐宾,一定是多種功能的協同,其核心就是協同膨蛮。另外叠纹,人工智能要回歸到認知的本質,要在類腦的研究上下功夫敞葛∮欤”他所帶領的團隊已經做出了下一步規(guī)劃:一是ET大腦要產品化,要開放制肮,ET大腦產品化正在推進中冒窍,同時項目會開放平臺,邀請和鼓勵生態(tài)伙伴一起在ET大腦的架構上做行業(yè)化豺鼻、垂直化的創(chuàng)新運用综液;二是在一些從沒有涉及的垂直領域,預計會去率先打造一些垂直示范的項目儒飒,再激活對應行業(yè)中的ISV(獨立軟件開發(fā)商)谬莹。
而項目的具體情況他將在杭州云棲大會上逐一公布,屆時閔萬里將分享撥云見“智”的話題,聚焦數據智能的生態(tài)和復合多體智能附帽。
PS:ET大腦是一個普惠科技埠戳,致力于讓更多的人在這個平臺上成功,包括有想法的數據科學家蕉扮、數據愛好者和合作伙伴整胃。此外,項目天池能夠提供平臺喳钟、課程屁使、數據并且定期發(fā)布任務,已經吸引了全球73個國家和地區(qū)的十萬多名開發(fā)者奔则,借助人工智能和大數據解決生產生活中的實際問題蛮寂。另一方面,復合多體智能是團隊對人工智能在具體場景中落地的終極判斷易茬,最近也有了一些新的嘗試和實地試運行:通過對單個智能設備的串聯形成了一個全局的智能系統酬蹋,讓系統內的各個智能設備可以群策群力,形成從感知抽莱、指揮范抓、全局協調的智慧城市。