誰是AI開源世界之王妈候?

谷歌靠它一統(tǒng)江湖敢靡,微軟狂砸百億美元,BAT奮起直追苦银,AI開源的魔力是什么啸胧?

在人工智能的江湖,2015年是個關(guān)鍵時間節(jié)點幔虏,這一年之前和之后纺念,似乎是兩個截然不同的世界。

此前數(shù)年間想括,歷經(jīng)AI吊打在圖像識別賽吊打傳統(tǒng)算法陷谱、AI戰(zhàn)勝世界圍棋冠軍、DeepMind“委身”谷歌等標(biāo)志性事件瑟蜈,AI逐漸走出學(xué)術(shù)殿堂叭首,開始用科幻般的“超能力”改變?nèi)藗兊恼J(rèn)知。

從這一年開始踪栋,科技巨頭的AI戰(zhàn)事從暗戰(zhàn)變?yōu)槊骶直焊瘢珹I也開始以前所未有的速度在全球爆發(fā),逐漸演化成為如今AI格局的雛形夷都。

每當(dāng)我們提及第三次AI浪潮是如何復(fù)興的眷唉,數(shù)據(jù)爆發(fā)、算力崛起已成為標(biāo)準(zhǔn)答案囤官,而一股隱形卻強(qiáng)大的力量卻往往被視而不見冬阳。

而這股力量,不僅是使得AI再度興盛的關(guān)鍵推手党饮,也是科技巨頭贏得AI話語權(quán)的“上甘嶺”肝陪。

這股力量,就是開源刑顺。

當(dāng)國外谷歌Facebook微軟為升級迭代AI開源框架各顯其能氯窍,國內(nèi)以BAT領(lǐng)銜推進(jìn)的AI開源項目亦在暗流涌動饲常。

開源,黑客文化中誕生的奇跡

什么是開源的力量狼讨?這是包括AI在內(nèi)的計算機(jī)發(fā)展史中贝淤,一個熠熠生輝的話題。

開源政供,英文名Open Source播聪,即開放源代碼,任何人可以在源代碼的基礎(chǔ)上進(jìn)行學(xué)習(xí)與修改布隔。它從58年前的黑客文化中緩緩演進(jìn)离陶,而最早催生這一文化的MIT技術(shù)模型鐵路俱樂部的黑客們(Hackers),大都成為MIT AI實驗室的核心成員衅檀。

如果說AI是一場饕餮盛宴招刨,數(shù)據(jù)是原材料,算力是天然氣术吝,算法是菜譜计济,那么開源就猶如無數(shù)廚師經(jīng)驗與智慧合著成的一本永不完結(jié)的烹飪百科全書茸苇,其他廚師可以從中汲取經(jīng)驗來快速完成菜品排苍,也可以指出書中的問題、貢獻(xiàn)更多創(chuàng)意学密,讓這本書經(jīng)過無數(shù)人的完善后逐漸成為神作淘衙。

image

可以想象一下,一個人專門檢查代碼bug腻暮,它可能需要好幾天的時間還有紕漏彤守;而如果一群開發(fā)者和測試者來查bug,那么代碼排錯與演化的效率將得到驚人的提升哭靖。

如果能創(chuàng)建一個開放具垫、有改進(jìn)能力的環(huán)境,驅(qū)動成千上百的人才庫去反饋并提供設(shè)計空間拓展试幽、代碼貢獻(xiàn)筝蚕、Bug定位以及其他的改進(jìn),而一個封閉項目中铺坞,要多么頂級的黑客才能僅依靠自己就做到與這成千上百人抗衡起宽。

在開源文化中,黑客們追求的是更高質(zhì)量的代碼济榨、更完善的項目坯沪,其動力也許是單純的熱愛,也許是對證明個人能力的渴望擒滑,但絕不是追求接近物質(zhì)財富的東西腐晾。

與之相悖的是閉源叉弦,由專門的研究團(tuán)隊開發(fā)一個軟件項目,不讓別人知道源代碼赴魁。選擇閉源的機(jī)構(gòu)無外乎幾種目的卸奉,擔(dān)心泄露機(jī)密,不想讓競爭者使用它颖御,或者想用它來賣錢榄棵。

這并不難理解,充斥著共享理念的開源文化潘拱,似乎與以營利為核心目標(biāo)的商業(yè)世界天然不搭疹鳄。即便是對在商業(yè)的考量中,開源的直接目的也不是為了營收芦岂,而是為了借此開拓市場和生態(tài)以獲得更長遠(yuǎn)的收益瘪弓。同時,開源也能有效防止閉源產(chǎn)品壟斷市場的局面出現(xiàn)禽最。

相較而言腺怯,傳統(tǒng)開源項目會給開發(fā)者帶來更大的壓力,而開源開發(fā)者更為自由川无,他們只需專注在自己想要做的事情上呛占,不必被上層的需求抽著鞭子往前走。

AI開源全棧示意圖

微軟就曾是閉源的典型代表懦趋,早期它采用軟件授權(quán)的模式晾虑,為其商業(yè)軟件建立起一整套完整定價。Windows操作系統(tǒng)正是微軟典型的閉源商業(yè)力作之一仅叫。盡管開源之光Linux操作系統(tǒng)沒能在商業(yè)戰(zhàn)場上干過微軟帜篇,但長期站在開源對立面的微軟,最終還是選擇了擁抱開源诫咱。

開源既然要開放代碼笙隙,讓成千上萬人協(xié)作,那就需要一個足夠友好和安全的開源托管服務(wù)坎缭,在這一背景下竟痰,GitHub應(yīng)運(yùn)而生。

2008年幻锁,克里斯·萬斯克拉斯已從辛辛那提大學(xué)英語專業(yè)輟學(xué)了三年凯亮,同普雷斯頓一起經(jīng)過夜以繼日地合作寫代碼,終于打造出能提供優(yōu)秀協(xié)作服務(wù)的代碼托管平臺GitHub哄尔,并專程找Twitter經(jīng)典logo的設(shè)計者西蒙·奧克斯利設(shè)計出其吉祥物章魚貓Octopuss假消。

克里斯·萬斯克拉斯(左上),普雷斯頓(右上)岭接,Github吉祥物章魚貓(圖下)

經(jīng)過十一年的發(fā)展富拗,Github早已成為“全球最大程序員交友平臺”臼予,它每年發(fā)布的Octoverse年報已成為呈現(xiàn)這一年度熱門開發(fā)項目、頂級編程語言等趨勢的權(quán)威榜單啃沪。

例如從Github上我們可以看到粘拾,近年數(shù)據(jù)科學(xué)、深度學(xué)習(xí)创千、自然語言處理缰雇、機(jī)器學(xué)習(xí)等主題的存儲庫正變得愈發(fā)流行,新的框架正吸引著成千上萬的貢獻(xiàn)者追驴。

2016~2019年Github自然語言處理存儲庫的增長變化

大約也是從Github成立那年起械哟,微軟對開源文化的態(tài)度開始發(fā)生轉(zhuǎn)變。

2009年殿雪,微軟向Linux貢獻(xiàn)2萬行設(shè)備驅(qū)動代碼暇咆;2011年,微軟一度躋身Linux 3.0五大公司貢獻(xiàn)者之一丙曙;2014年爸业,“重塑”微軟的CEO納德拉喊出著名的“微軟愛Linux”;2016年亏镰,微軟推出了兼容 Linux 的 SQL 服務(wù)器數(shù)據(jù)庫軟件扯旷;2017年,微軟成為GitHub上貢獻(xiàn)代碼最多的公司拆挥,這一寶座蟬聯(lián)至今薄霜。

2018年6月某抓,微軟斥資75億美元收購Github纸兔,全球轟動。

截至當(dāng)時否副,GitHub上汉矿,聚集了約2800萬開發(fā)者、高達(dá)8500萬代碼庫备禀,僅是在去年洲拇,70%的全球財富50強(qiáng)公司均使用Github為開源做出貢獻(xiàn),包括微軟在AI時代的主要對手曲尸,蘋果赋续、谷歌、亞馬遜等科技巨頭另患。

群雄混戰(zhàn)AI開源框架

部分主流AI框架項目社區(qū)活躍度指標(biāo)統(tǒng)計

AI框架上承應(yīng)用纽乱、下接芯片,堪稱智能時代的核心軟件支柱昆箕。

11月7日鸦列,GitHub發(fā)布年度報告租冠,貢獻(xiàn)者最多的TOP10開源項目中,谷歌AI框架TensorFlow排名第五(9.9K)薯嗤。

image

TensorFlow顽爹,當(dāng)前AI開源框架的扛把子,承載了“業(yè)界開源典范”谷歌在AI時代的野心骆姐。

憑借一個開源手機(jī)操作系統(tǒng)“安卓”镜粤,谷歌占據(jù)全球80~90%的智能手機(jī),坐擁超過40萬的開發(fā)人員和十多億用戶玻褪,據(jù)說憑借廣告繁仁、應(yīng)用、授權(quán)及付費(fèi)內(nèi)容等收入归园,一年能給谷歌賺30億美元黄虱。

“贏者通吃”的價值在安卓身上發(fā)揮的淋漓盡致,如今其在智能手機(jī)界的地位早已穩(wěn)如泰山庸诱,令其他未入局的大公司屢屢扼腕捻浦。連微軟創(chuàng)始人比爾·蓋茨都公開表示,自己犯下最大的錯誤就是“因為管理不善桥爽,導(dǎo)致微軟沒有推出像安卓那樣標(biāo)準(zhǔn)化的朱灿、非蘋果的手機(jī)操作平臺”。

2015年11月钠四,谷歌第二代深度學(xué)習(xí)框架TensorFlow橫空出世盗扒。

背靠谷歌這座開源大山,TensorFlow強(qiáng)勢崛起缀去,借助于英特爾侣灶、NVIDIA等硬件平臺的配合打法,向全球開發(fā)者免費(fèi)供給AI庫與工具缕碎,成為Github上最受開發(fā)者歡迎的平臺之一褥影。

去年4.6萬個項目依賴于這一平臺,貢獻(xiàn)人數(shù)從2238位直接貢獻(xiàn)者增長到25166位社區(qū)貢獻(xiàn)者咏雌。開發(fā)人數(shù)凡怎、貢獻(xiàn)人數(shù)、受歡迎程度(star數(shù))赊抖、谷歌搜索量都碾壓其他一眾開源AI框架统倒。

image

去年,國外數(shù)據(jù)科學(xué)研究者Jeff Hale調(diào)查了多個主流求職平臺的AI相關(guān)在線職位搜索列表氛雪,其中TensorFlow的搜索量一騎絕塵房匆。綜合職位搜索、KDnuggets使用調(diào)查、Github活躍度坛缕、谷歌搜索量墓猎、ArXiv文章、亞馬遜書籍赚楚、Medium文章等指標(biāo)的評判毙沾,TensorFlow仍然遙遙領(lǐng)先。

image
image

眼見AI接棒移動互聯(lián)網(wǎng)高調(diào)歸來宠页,顯然左胞,其他科技巨頭們不打算坐看谷歌獨(dú)享AI開源的紅利。

幾乎在TensorFlow開源的同一時期举户,微軟亞洲研究院開源機(jī)器學(xué)習(xí)工具包DMTK烤宙,通過Apache軟件基金會免費(fèi)向外界程序員提供System ML AI工具的源代碼。

有些AI開源項目比TensorFlow更早出現(xiàn)俭嘁。

比如躺枕,2015年1月,F(xiàn)acebook人工智能研究院(FAIR)就推出一組基于Torch機(jī)器學(xué)習(xí)框架的開源深度學(xué)習(xí)工具供填。同年4月拐云,亞馬遜推出機(jī)器學(xué)習(xí)托管服務(wù)Amazon Machine Learning,允許任何開發(fā)者輕松使用歷史數(shù)據(jù)開發(fā)并部署預(yù)測模型近她。

不過這些項目尚不足為懼叉瘩,在TensorFlow開源一年又兩個月后,它最大的宿敵終于現(xiàn)身粘捎。

image

2017年1月薇缅,F(xiàn)acebook推出機(jī)器學(xué)習(xí)框架PyTorch。近兩年來攒磨,PyTorch持續(xù)大舉收割A(yù)I學(xué)術(shù)開發(fā)者泳桦,并且今年在視覺、語言咧纠、通用機(jī)器學(xué)習(xí)等多個頂會的論文流行度碾壓TensorFlow蓬痒,成為AI學(xué)術(shù)界新的王者泻骤。

許多研究人員表示漆羔,相比TensorFlow,PyTorch的集成方式狱掂、API都設(shè)計的更好演痒,而且業(yè)界有傳聞?wù)fPyTorch的速度要比TensorFlow更快。甚至相傳谷歌內(nèi)部許多人員也希望使用TensorFlow意外的框架趋惨,這意味著谷歌早早鋪路的AI生態(tài)建設(shè)并不如安卓那般一帆風(fēng)順鸟顺,相反危機(jī)四伏。

image

TF與PY之爭也成為AI領(lǐng)域熱議的話題。有趣的是讯嫂,去年谷歌Facebook接連發(fā)布TensorFlow和PyTorch新版本蹦锋。

前者有谷歌深度學(xué)習(xí)科學(xué)家、Keras作者Franois稱贊為來自未來的機(jī)器學(xué)習(xí)平臺欧芽,蘋果公司AI研究員Goku Mohandas說他們正從PyTorch轉(zhuǎn)向TensorFlow 2.0+Keras莉掂。后者則獲得圖靈獎得主、深度學(xué)習(xí)鼻祖之一Yann LeCun的轉(zhuǎn)發(fā)支持千扔。

image

曾因開源問題引發(fā)爭議的微軟和亞馬遜憎妙,近幾年也走在AI開源的路上。

亞馬遜對出身學(xué)界的MXNet框架情有獨(dú)鐘曲楚。2016年11月宣布將其作為官方深度學(xué)習(xí)平臺厘唾,用于亞馬遜AWS,并于今年1月決定開源其機(jī)器學(xué)習(xí)服務(wù)平臺SageMaker Neo龙誊。微軟則在2017年開源了其內(nèi)部深度學(xué)習(xí)框架CNTK的2.0版本抚垃,重命名為微軟認(rèn)知工具包(Microsoft Cogntive Toolkit)。

面對擁有龐大獨(dú)立AI生態(tài)的谷歌趟大,微軟讯柔、Facebook、亞馬遜等巨頭選擇聯(lián)合护昧。2017年9月魂迄,他們發(fā)起深度學(xué)習(xí)開源聯(lián)盟ONNX,旨在提高各種AI工具間的通用性惋耙。阿里捣炬、騰訊、百度绽榛、華為湿酸、小米等國內(nèi)科技公司以及英特爾、NVIDIA灭美、高通推溃、AMD、Arm届腐、IBM铁坎、惠普等芯片及服務(wù)器巨頭紛紛加入其中。

image

去年智東西采訪微軟項目總經(jīng)理Venky Veeraraghavan時犁苏,他曾表示微軟已和谷歌做了充分溝通硬萍,但當(dāng)時谷歌決定暫時不會積極參與到ONNX的工作中。

而截至目前围详,谷歌仍未公開表現(xiàn)出加入這一陣營的意向朴乖。

大神云集拴还,AI開源中的華人之光

MXNet号坡、TensorFlow语御、PyTorch等世界一流的開源AI框架背后柱徙,都有著不容忽視的中國身影。

亞馬遜所青睞的MXNet由DMLC(Distributed/Deep Machine Learning Community)打造畜普,其核心成員均為中國人魁兼。

MXNet源起三個不同的開源項目,一是在美國的陳天奇漠嵌、在加拿大的許冰和在香港的王乃巖牽頭的CXXNet咐汞,二是上海張錚及其學(xué)生牽頭的Minerva,三是在新加坡的李沐牽頭的purine2儒鹿。

陳天奇

在2014年NIPS上化撕,同為上海交大校友的陳天奇和李沐經(jīng)過交流,發(fā)現(xiàn)大家普遍在做重復(fù)性工作约炎,于是決定合作開發(fā)MXNet植阴。隨后,越來越多的開源貢獻(xiàn)者參與到MXNet的開發(fā)和維護(hù)工作中圾浅。在亞馬遜將MXNet定為官方框架前掠手,圖森、地平線狸捕、Wolfram等公司都為MXNet貢獻(xiàn)了很多代碼喷鸽。

清華大學(xué)畢業(yè)生賈揚(yáng)清在加州大學(xué)伯克利分校攻讀計算機(jī)科學(xué)博士期間,創(chuàng)立了對移動端友好的開源深度學(xué)習(xí)框架Caffe灸拍,被微軟做祝、雅虎、NVIDIA鸡岗、Adobe等公司看好并采用混槐。

畢業(yè)后他到谷歌任科學(xué)家,同Jeff Dean等大神參與TensorFlow的開發(fā)轩性,然后又在2016年跳槽去了Facebook声登,并主導(dǎo)了Caffe2移動端深度學(xué)習(xí)框架和ONNX項目的開發(fā)。

賈揚(yáng)清

因為傳統(tǒng)PyTorch偏研究揣苏,Caffe2偏應(yīng)用實踐悯嗓,兩個框架之間存在很難跨越的鴻溝,一年半前舒岸,F(xiàn)acebook決定將這兩套框架合并成PyTorch 1.0绅作,實現(xiàn)從研究開發(fā)到生產(chǎn)實踐的無縫對接。

image

如今蛾派,陳天奇已加入美國機(jī)器學(xué)習(xí)創(chuàng)企OctoML任CTO,明年秋季將加入卡內(nèi)基·梅隆大學(xué)任助理教授。李沐現(xiàn)任亞馬遜AI主任科學(xué)家洪乍。賈揚(yáng)清則于今年3月作別Facebook眯杏,加盟阿里巴巴任副總裁、阿里云智能計算平臺事業(yè)部總裁壳澳,并擔(dān)任阿里巴巴開源技術(shù)委員會負(fù)責(zé)人岂贩。

image

BAT入場,中國開源AI起步中

國外開源AI框架的廝殺正緊巷波,國內(nèi)AI企業(yè)在AI開源項目上的格局則相對更為分明萎津。

BAT在Github上的AI開源項目不完全統(tǒng)計

目前唯一躋身Github全球最受歡迎AI框架排行榜,能與TensorFlow抹镊、PyTorch等相提并論的是百度飛槳锉屈。

百度飛槳源自于百度深度學(xué)習(xí)實驗室于2013年創(chuàng)建的內(nèi)部工具“Paddle”,2016年9月正式宣布開源垮耳。這使得百度成為繼谷歌颈渊、Facebook、IBM后第四家將AI技術(shù)開源的公司终佛,同時也是打造國內(nèi)第一個且唯一中文開源深度學(xué)習(xí)平臺的公司俊嗽。

飛槳根據(jù)本土化特點將開源框架與應(yīng)用層面做了更好的結(jié)合,比許多現(xiàn)有深度學(xué)習(xí)框架更快铃彰、更好用绍豁。賈揚(yáng)清曾評價它在簡潔、靈活牙捉、快速等領(lǐng)域功力不俗妹田,且解決了Caffe早期存在的一些遺留問題。

今年8月鹃共,百度還對外發(fā)布了面向終端和邊緣設(shè)備的端側(cè)推理引擎Paddle Lite Beta版鬼佣,不僅支持飛槳,還支持TensorFlow霜浴、PyTorch和ONNX模型格式晶衷。

很有意思的是,2016年7月9日阴孟,美國NASA在Github上公開了47年前登陸月球的Apollo 11源代碼晌纫。

恰好一年后,百度宣布開源其自動駕駛系統(tǒng)Apollo永丝,其自動駕駛軟件可供任何人免費(fèi)下載及修改使用锹漱。

目前飛槳在Github上的star數(shù)達(dá)1.02萬,fork數(shù)達(dá)2700慕嚷,有264位貢獻(xiàn)者哥牍,提交超過2.5萬commits毕泌。而Apollo比飛槳還要受歡迎,star數(shù)達(dá)到1.53萬嗅辣,fork數(shù)超5200撼泛。

image

騰訊也大約從2016年起不斷將內(nèi)部開源出來的優(yōu)質(zhì)項目發(fā)布在Github上,如今它在Github全球公司貢獻(xiàn)榜上位居前十澡谭。

截至今年8月愿题,騰訊已在Github上發(fā)布82個開源項目,其中包括7個方向的AI開源項目蛙奖。

Angel是騰訊第一個AI開源項目潘酗,最新3.0版本升級為全棧機(jī)器學(xué)習(xí)平臺,擅長稀疏數(shù)據(jù)高維模型的訓(xùn)練雁仲,可支持多類圖計算算法仔夺,覆蓋了機(jī)器學(xué)習(xí)全流程。它可以與TensorFlow伯顶、Caffe等業(yè)界主流深度學(xué)習(xí)框架很好地兼容囚灼。

Angel早在2016年年初就在騰訊內(nèi)部上線,應(yīng)用在微信支付祭衩、QQ灶体、騰訊視頻、騰訊社交廣告掐暮、用戶畫像挖掘等業(yè)務(wù)中蝎抽,2017年6月在Github上低調(diào)開源。

當(dāng)前Angel平臺包含超過50萬行代碼量路克,其star數(shù)已經(jīng)超過5400樟结,fork數(shù)達(dá)1400,總計有40位貢獻(xiàn)者精算,提交2300多次commits瓢宦。

除了Angel之外,騰訊還開源了面向手機(jī)端的跨平臺高性能神經(jīng)網(wǎng)絡(luò)前向計算框架NCNN灰羽、首個醫(yī)療AI深度學(xué)習(xí)預(yù)訓(xùn)練模型MedicalNet驮履、AI圍棋程序Phoenix Go、包含800多萬中文詞匯的高質(zhì)量中文詞向量NLP數(shù)據(jù)集廉嚼、業(yè)內(nèi)最大規(guī)模的多標(biāo)簽圖像數(shù)據(jù)集ML-Images玫镐、全球首款自動化深度學(xué)習(xí)模型壓縮框架PocketFlow。

image

阿里巴巴在Github上主體賬號的總項目數(shù)是國內(nèi)最多的怠噪,據(jù)賈揚(yáng)清介紹恐似,在AI和大數(shù)據(jù)領(lǐng)域,阿里已經(jīng)貢獻(xiàn)超過100萬行的代碼傍念,深度參與超過10個開源項目矫夷。

賈揚(yáng)清在今年9月的阿里云棲大會上說葛闷,阿里的AI與開源、開放的生態(tài)是分不開的口四,會通過開源與云平臺的合作孵运,推進(jìn)開發(fā)者生態(tài)建設(shè)秦陋,在擁抱開源的同時貢獻(xiàn)開源蔓彩。

單從近一年來看,阿里在AI領(lǐng)域先后開源面向高維稀疏數(shù)據(jù)場景的深度學(xué)習(xí)框架XDL驳概、輕量級深度神經(jīng)網(wǎng)絡(luò)推理引擎MNN赤嚼、基于PAISoar的分布式神經(jīng)網(wǎng)絡(luò)倉庫PAI-FastNN。

而隨著阿里云與Facebook宣布在AI開源項目上展開合作顺又,雙方計劃開源更卒、共享、合作開發(fā)框架稚照、AI模型蹂空、文件等,將成果以 PyTorch 的形式共享到 GitHub果录,阿里云機(jī)器學(xué)習(xí)平臺將能支持PyTorch框架上枕。這會進(jìn)一步降低AI開發(fā)和應(yīng)用門檻,同時推動PyTorch框架在產(chǎn)業(yè)界的普及弱恒。

另外辨萍,阿里也通過攜手Facebook,擬將PyTorch項目文獻(xiàn)返弹、教程等資料更快锈玉、更準(zhǔn)地翻譯成中文版本,讓國內(nèi)開發(fā)者能第一時間學(xué)到最新PyTorch义起。

image

商湯和港中大看起來也是PyTorch擁護(hù)者拉背,開源的最大目標(biāo)跟蹤庫PySOT、物體檢測工具包MMDetection默终、時空圖卷積網(wǎng)絡(luò)(ST-GCN)骨架動作識別MMSkeleton均基于PyTorch椅棺。

就現(xiàn)在來看,國內(nèi)自主研發(fā)開源深度學(xué)習(xí)框架的企業(yè)還屬于“稀缺物種”穷蛹。

目前有苗頭成為新成員的是華為和曠視土陪,華為預(yù)告將在明年第一季度開源其全場景AI計算框架MindSpore,曠視的深度學(xué)習(xí)框架Brain++也已經(jīng)在計劃開源肴熏,此前曠視研究院的原創(chuàng)ShuffleNet Series算法已經(jīng)開源在Github上鬼雀。

產(chǎn)學(xué)研合力加速中國AI開源進(jìn)程

除了開源AI項目之外,國內(nèi)外公司也在積極參與AI開源社區(qū)建設(shè)蛙吏。

比如源哩,百度鞋吉、騰訊、華為谓着、中興赊锚、AT&T等國內(nèi)外知名企業(yè)均加入了LF深度學(xué)習(xí)基金會舷蒲,共同打造中立開源社區(qū)牲平。

目前廣泛存在的專利許可費(fèi)高昂纵柿、專業(yè)人才有限等問題昂儒,均可在AI開源社區(qū)的幫助下有效改善荆忍。另外刹枉,開源還會幫助數(shù)據(jù)科學(xué)家微宝、工程更高效地做大規(guī)模系統(tǒng)性測試虎眨、性能調(diào)優(yōu)嗽桩、實際落地等工作碌冶,帶給他們更好的用戶體驗。

在扶持開發(fā)者和創(chuàng)企的同時譬重,開源社區(qū)也從其模式中構(gòu)建了龐大的反饋循環(huán)臀规。開發(fā)者及團(tuán)隊帶給社區(qū)建設(shè)者的反饋玩徊,是解決問題中的想法佣赖、改進(jìn)平臺的建議外傅、更多的數(shù)據(jù)萎胰、更成熟或更創(chuàng)新的模型和算法技竟、甚至更多的用戶冰肴,這些反饋會反過來推動開源社區(qū)主導(dǎo)者對技術(shù)的理解和業(yè)務(wù)的優(yōu)化,為后續(xù)的數(shù)據(jù)采集及技術(shù)分析鋪路熙尉。

image

根據(jù)最新發(fā)布的Github年度報告搓扯,我國在開放源代碼的使用量上遙遙領(lǐng)先检痰,開發(fā)者fork和clone的項目比去年多了48%。

過去一年铅歼,亞洲開發(fā)者社區(qū)在2019年增長迅速,約36%的私人存儲庫創(chuàng)建自中國换可、印度椎椰、日本等亞洲開發(fā)者。

自2014年以來慨飘,Github上亞洲的貢獻(xiàn)者群體的年增長率已超過歐洲和北美的貢獻(xiàn)者群體

考慮到國內(nèi)AI開源發(fā)展現(xiàn)狀距離國際最領(lǐng)先水平還有距離套媚,政產(chǎn)學(xué)研的力量正更為緊密的集結(jié)在一起玫芦。

今年3月本辐,新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)組織下老虫,新一代人工智能開源開放平臺OpenI啟智發(fā)布,目前啟智平臺開源的項目有七個茫多,包括集成百度飛槳核心功能的啟智VisualDL祈匙、開源AI處理器項目OpenI海藻等。

鵬城實驗室天揖、北京智源人工智能研究院夺欲、清華大學(xué)、北京大學(xué)今膊、國防科技大學(xué)些阅、北京航空航天大學(xué)、浙江大學(xué)斑唬、華為市埋、百度、阿里恕刘、騰訊缤谎、網(wǎng)易、小米雪营、平安弓千、京東、字節(jié)跳動献起、科大訊飛洋访、曠視、商湯谴餐、滴滴姻政、中科類腦等單位均參與這一開源開放平臺。

此外岂嗓,今年4月汁展,國家人工智能標(biāo)準(zhǔn)化總體組發(fā)布《人工智能開源與標(biāo)準(zhǔn)化研究報告》,華為、騰訊食绿、京東侈咕、浪潮、英特爾器紧、IBM耀销、商湯、云從铲汪、云天勵飛熊尉、華夏芯等公司均參與了編寫工作,對AI開源現(xiàn)狀及相關(guān)生態(tài)進(jìn)行了描述和分析掌腰。

image

隨著AI開源項目的蓬勃發(fā)展狰住,這種共享文化正激勵著更多不同行業(yè)的公司嘗試AI,創(chuàng)建符合其自身業(yè)務(wù)需求的平臺齿梁。

借助開源催植,他們無需在尚未構(gòu)建且無法自定義的AI軟件上花費(fèi)數(shù)百萬美元。他們本身擁有海量的行業(yè)數(shù)據(jù)士飒,只需招攬少量的AI開發(fā)者查邢,即可在開源AI平臺及模型的幫助下更高效、低成本的完成智能化任務(wù)酵幕。

根據(jù)Scopus的數(shù)據(jù),從2007至2017年缓苛,中國發(fā)表的AI相關(guān)論文數(shù)量從5995增至15199篇芳撒。

image

許多企業(yè)在構(gòu)建AI解決方案時,都會大量用到開源的算法未桥。在開源的推動下笔刹,AI創(chuàng)業(yè)公司如雨后春筍般涌現(xiàn)。報告顯示冬耿,中國AI企業(yè)數(shù)量達(dá)到745家舌菜,僅次于排名第一的美國。其中亦镶,2018年發(fā)生融資事件的企業(yè)有577家日月,融資總額達(dá)3832.22億元,排名全球第一缤骨。

中國AI開源面臨的困境

盡管我國的AI事業(yè)看起來蒸蒸日上爱咬,但短板一直還存在。在基礎(chǔ)層建設(shè)绊起、創(chuàng)企困局精拟、安全漏洞、道德難題等方面,AI開源還有很多值得探討的空間蜂绎。

而政產(chǎn)學(xué)研的力量正集結(jié)在一起栅表,試圖建立一個更加穩(wěn)健強(qiáng)大的中國AI生態(tài)系統(tǒng)。

人工智能產(chǎn)業(yè)生態(tài)圈全景圖
1师枣、應(yīng)用層強(qiáng)谨读,基礎(chǔ)層弱

根據(jù)科技部發(fā)布的《中國新一代人工智能發(fā)展報告2019》,中國是AI專利布局最多的國家坛吁,在技術(shù)層呈現(xiàn)中美雙寡頭競爭格局劳殖,在應(yīng)用層中國專利領(lǐng)先。

但在AI基礎(chǔ)技術(shù)及工具的研發(fā)方面拨脉,我國仍然相對落后哆姻,AI基礎(chǔ)技術(shù)的核心力量都掌握在美國的手中。

AI開源項目一方面能推動AI技術(shù)更快落地到具體業(yè)務(wù)和應(yīng)用中玫膀,但也可能致使更少的開發(fā)者愿意去從事難度大矛缨、成效未知的基礎(chǔ)性研發(fā)工作。而隨著我國高校AI教育體系的逐步完善帖旨,對研究項目方向的設(shè)置箕昭、對學(xué)生的引導(dǎo)將起到關(guān)鍵作用。

2解阅、開源基礎(chǔ)設(shè)施環(huán)節(jié)薄弱

就目前來看落竹,我國唯一在國際上拿得出手的AI框架只有百度飛槳。而飛槳的受歡迎程度尚不足以排進(jìn)全球AI框架前十名货抄。

即便是在國內(nèi)的企業(yè)和高校中述召,TensorFlow、PyTorch等美國公司研發(fā)的開源框架更受開發(fā)者的青睞蟹地。而更令人擔(dān)憂的是积暖,開發(fā)者最熱衷于上傳代碼的Github平臺同樣在美國公司手中。

image

誠然怪与,絕大多數(shù)程序員都崇尚公平夺刑、開放的開源共享文化,但此前已經(jīng)有各種例證顯示了政治和狹隘觀念可能造成的負(fù)面影響分别。

比如上周全球第二大開源代碼托管平臺GitLab公然發(fā)文遍愿,稱考慮“當(dāng)前地緣環(huán)境”,拒收中茎杂、俄公民错览,并且禁止現(xiàn)員工前往這兩個國家。

image

如果美國執(zhí)意要豎起“數(shù)字鐵幕”煌往,那么我國建立完全獨(dú)立自主的開源基礎(chǔ)設(shè)施已成當(dāng)務(wù)之急倾哺。

3轧邪、小公司做AI開源不占優(yōu)勢

無論國內(nèi)還是國外,AI開源更像是巨頭的專場羞海。亞馬遜忌愚、谷歌、BAT等公司却邓,除了本身技術(shù)實力過硬外硕糊,可直接豪擲千金買技術(shù)、團(tuán)隊腊徙、人才简十,建設(shè)一套更為完整的開源體系。

但對于剛剛起步的小公司而言撬腾,資金螟蝙、技術(shù)、人才等壓力往往使得他們在通往開源的路上更為束手束腳民傻。比如美國公司Mycroft開源的語音平臺需要支持幾十種語言胰默,它不得不與Mozilla以及更大的開源社區(qū)合作進(jìn)行一些國際化工作,但這些需要耗費(fèi)很多時間漓踢。

少數(shù)技術(shù)實力雄厚的初創(chuàng)企業(yè)搭建了自己的深度學(xué)習(xí)框架牵署。但現(xiàn)實中,人們更容易傾向于信賴已經(jīng)得到大眾認(rèn)可的事物喧半,即便創(chuàng)企能提供更高性價比的產(chǎn)品及服務(wù)奴迅,一些客戶出于安全等考量仍會更信任搶先培養(yǎng)了用戶習(xí)慣的軟件產(chǎn)品。

即便是國內(nèi)大公司都要思考如何吸引更多開發(fā)者選擇自己的AI框架薯酝,小公司面臨的阻礙往往更多半沽。

4、安全漏洞防范與標(biāo)準(zhǔn)規(guī)范

和信息技術(shù)相關(guān)的所有軟硬件一樣吴菠,開源AI框架也存在技術(shù)漏洞、人為缺陷等造成的安全風(fēng)險浩村。

開源社區(qū)通過不斷監(jiān)控軟件代碼中的缺陷和漏洞做葵,提供額外的安全性,這對像AI這樣的新興技術(shù)尤為有益心墅,但仍不可避免會存在一些潛在的威脅酿矢。

去年,谷歌TensorFlow曾爆出重大安全漏洞怎燥,雖未造成實質(zhì)影響瘫筐,卻引發(fā)業(yè)界擔(dān)憂。當(dāng)時有專家評估铐姚,類似的漏洞可能摧毀所有基于該平臺開發(fā)出的AI模型策肝,而這些模型可能大量涉及安防肛捍、識別、城市交通之众、公共服務(wù)等事關(guān)社會民生的關(guān)鍵應(yīng)用拙毫。

這也給我們敲響警鐘,在建設(shè)開源AI框架過程中棺禾,必須嚴(yán)格防范可能的安全漏洞問題缀蹄,同時逐步構(gòu)建完善的安全要求與測評評估標(biāo)準(zhǔn)工作。

5膘婶、數(shù)據(jù)隱私保護(hù)與技術(shù)濫用

AI開源項目被用地不得當(dāng)缺前,可能引發(fā)道德上的災(zāi)難。關(guān)于數(shù)據(jù)隱私保護(hù)引發(fā)的爭議已經(jīng)屢見不鮮悬襟,除此之外衅码,近期技術(shù)濫用問題一度引起軒然大波。

就拿今年AI換臉開源項目DeepFake來說古胆,已經(jīng)有一些人利用這一技術(shù)去從事一些灰產(chǎn)肆良,甚至對許多無辜群體造成人身攻擊和心理傷害。智東西曾對國內(nèi)AI換臉產(chǎn)業(yè)做深入調(diào)查(AI換臉黑產(chǎn):100元打包200部換臉情色片逸绎,5張照片就可定制視頻)惹恃。

被調(diào)查的10個賣家資料整理

今年AI技術(shù)與道德審查的法規(guī)制定也成為全球多個AI會議探討的核心話題之一。

另外由于AI開源項目降低了AI落地的門檻棺牧,一定程度上也導(dǎo)致市場上現(xiàn)有的AI產(chǎn)品良莠不齊巫糙。比如一些做智能門禁的企業(yè)直接借用開源平臺中的模型,沒有結(jié)合實際數(shù)據(jù)做進(jìn)一步的優(yōu)化颊乘,投入實際應(yīng)用后参淹,對人們的生命財產(chǎn)安全也會造成一定風(fēng)險。

結(jié)語:國內(nèi)AI開源建設(shè)需要更多開發(fā)者支持

上層軟件走向開源開放是大勢所趨乏悄,封閉知識產(chǎn)權(quán)會逐漸融入到開源基礎(chǔ)架構(gòu)之中浙值。

AI于開源而言,或許與其他軟件別無二致檩小。而開源于AI而言开呐,卻是促進(jìn)AI應(yīng)用創(chuàng)新與更多行業(yè)智能化普及的重要驅(qū)動力。從當(dāng)下AI在各國的戰(zhàn)略地位來看规求,開源AI框架有望成為像云API那樣成為主宰AI市場的核心引擎筐付。

近年隨著AI算法的持續(xù)豐富,開源與科研阻肿、工程的結(jié)合也越來越緊密瓦戚。開發(fā)者所關(guān)注的開源AI核心要素,也從更高的性能轉(zhuǎn)為如何能讓算法在應(yīng)用中更快更好的落地丛塌。而更快速较解、更好用的AI框架畜疾,以及與各種硬件更加優(yōu)化的協(xié)同,都有望為AI發(fā)展注入新的活力哨坪。

當(dāng)前我國在AI應(yīng)用層基本站穩(wěn)腳跟庸疾,在數(shù)據(jù)資源、數(shù)理人才当编、市場環(huán)境等方面均有很大優(yōu)勢届慈,再加上戰(zhàn)略引領(lǐng)、政策支持助力忿偷,AI開源開放平臺金顿、完整AI生態(tài)鏈的相關(guān)建設(shè)正在持續(xù)推動中。這或許會是一個長期的工作鲤桥,不僅需要產(chǎn)學(xué)研各類機(jī)構(gòu)的協(xié)同努力揍拆,也需要更多開發(fā)者的鼓勵與支持。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末茶凳,一起剝皮案震驚了整個濱河市嫂拴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌贮喧,老刑警劉巖筒狠,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異箱沦,居然都是意外死亡辩恼,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進(jìn)店門谓形,熙熙樓的掌柜王于貴愁眉苦臉地迎上來灶伊,“玉大人,你說我怎么就攤上這事寒跳∑溉” “怎么了?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵童太,是天一觀的道長匈挖。 經(jīng)常有香客問我,道長康愤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任舶吗,我火速辦了婚禮征冷,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘誓琼。我一直安慰自己检激,他們只是感情好肴捉,可當(dāng)我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著叔收,像睡著了一般齿穗。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上饺律,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天窃页,我揣著相機(jī)與錄音,去河邊找鬼复濒。 笑死脖卖,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的巧颈。 我是一名探鬼主播畦木,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼砸泛!你這毒婦竟也來了十籍?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤唇礁,失蹤者是張志新(化名)和其女友劉穎勾栗,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體垒迂,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡械姻,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了机断。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片楷拳。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖吏奸,靈堂內(nèi)的尸體忽然破棺而出欢揖,到底是詐尸還是另有隱情,我是刑警寧澤奋蔚,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布她混,位于F島的核電站,受9級特大地震影響泊碑,放射性物質(zhì)發(fā)生泄漏坤按。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一馒过、第九天 我趴在偏房一處隱蔽的房頂上張望臭脓。 院中可真熱鬧,春花似錦腹忽、人聲如沸来累。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嘹锁。三九已至葫录,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間领猾,已是汗流浹背米同。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留瘤运,地道東北人窍霞。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓,卻偏偏與公主長得像拯坟,于是被迫代替她去往敵國和親但金。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,647評論 2 354