兩年追蹤170個(gè)AI團(tuán)隊(duì)的原型設(shè)計(jì):初創(chuàng)公司該選擇做研究還是做外包?

編輯|Emily

AI前線出品|ID:ai-front

本文作者在研究驅(qū)動(dòng)型團(tuán)隊(duì)生態(tài)系統(tǒng)的過程當(dāng)中,總結(jié)出以下經(jīng)驗(yàn):

1. 研究驅(qū)動(dòng)型團(tuán)隊(duì)在初創(chuàng)領(lǐng)域開始越來越多地扮演生力軍角色。ArXiv 則是新型實(shí)現(xiàn)方法模型推廣領(lǐng)域的一大卓有成效的實(shí)例。

2. 盡管如此诗轻,大多數(shù)研究型初創(chuàng)企業(yè)仍然作為大型企業(yè)的外包研究團(tuán)隊(duì)存在。

為了實(shí)現(xiàn)產(chǎn)品與市場間的契合揭北,這些初創(chuàng)企業(yè)首先需要專注于數(shù)據(jù)時(shí)間扳炬,并在開始測試數(shù)據(jù)獲取戰(zhàn)略之前保證實(shí)現(xiàn)快速迭代。

更多精彩文章請?zhí)砑游⑿拧癆I 前線”(ID:ai-front)

關(guān)注人工智能的落地實(shí)踐搔体,與企業(yè)一起探尋 AI 的邊界鞠柄,AICon 全球人工智能技術(shù)大會火熱售票中,6 折倒計(jì)時(shí)一周搶票嫉柴,詳情點(diǎn)擊:

https://aicon.geekbang.org/apply?utm_source=wechat&utm_medium=ai-front

幫助研究驅(qū)動(dòng)型原型設(shè)計(jì)團(tuán)隊(duì)成為初創(chuàng)企業(yè)帶來的意外收益

兩年之前厌杜,一位朋友鼓勵(lì)我以導(dǎo)師身份參加柏林 Techstars 首屆選擇日活動(dòng)。自那時(shí)開始计螺,我就一直作為 Techstars 導(dǎo)師不斷幫助“深度技術(shù)”(對我個(gè)人而言夯尽,這一表述專指大規(guī)模并行處理(簡稱 MPP)數(shù)據(jù)庫、人工智能(簡稱 AI)/ 機(jī)器學(xué)習(xí)(簡稱 ML)以及開源企業(yè))初創(chuàng)企業(yè)由原型設(shè)計(jì)階段順利過渡至產(chǎn)品與市場相契合的層面登馒。在參加柏林 Techstars 首日活動(dòng)時(shí)匙握,我結(jié)識了 Rasa 團(tuán)隊(duì)——時(shí)至今日,我已經(jīng)成為 Rasa 團(tuán)隊(duì)的投資人兼運(yùn)營顧問陈轿。Rasa 如今則成長為市場上開源對話 AI 軟件領(lǐng)域的領(lǐng)導(dǎo)者圈纺,其去年 12 月推出的首款 NLU 工具已經(jīng)得到數(shù)千家企業(yè)的使用。

然而麦射,Rasa 其實(shí)屬于一種例外蛾娶,事實(shí)上我所見到的大多數(shù)的初創(chuàng)企業(yè)仍處于原型設(shè)計(jì)階段。從定義角度來講潜秋,他們的原型設(shè)計(jì)尚未完成蛔琅。

原型設(shè)計(jì)顯然不足以令風(fēng)險(xiǎn)投資商滿意。不過峻呛,打造新事物對于初創(chuàng)企業(yè)而言罗售,在價(jià)值上要高于提供演示或者發(fā)布市場研究結(jié)論辜窑。全程追蹤數(shù)十套原型設(shè)計(jì)方案在特定領(lǐng)域遭遇的難題以及茁壯成長的經(jīng)歷,正是我不斷完善自己投資水平的主要學(xué)習(xí)資源寨躁。

顛覆性成果距離很遠(yuǎn)穆碎,但特定應(yīng)用卻距離很近

舉例來說,從研發(fā)角度來講职恳,顛覆性成果似乎已經(jīng)離我們不遠(yuǎn)——?dú)v史上對于 AI 的研發(fā)目標(biāo)一直在于超越人類的智慧水平所禀,并給整個(gè)人類社會帶來難以想象的深遠(yuǎn)革命。但從另一方面看话肖,第一代聊天機(jī)器人給我們帶來的用戶體驗(yàn)幾乎可以證明北秽,這樣的深遠(yuǎn)革命確實(shí)夠“遠(yuǎn)”葡幸。深入觀察最筒,我們只看到了數(shù)十款不再以規(guī)則為基礎(chǔ)的機(jī)器人方案。相比之下蔚叨,過去兩年當(dāng)中則出現(xiàn)了超過 170 多種更為出色的原型設(shè)計(jì)——其確實(shí)在一定程度上實(shí)現(xiàn)了 AI 超越人類的奇跡床蜘,只不過僅限于特定行業(yè)垂直領(lǐng)域內(nèi)的專業(yè)應(yīng)用,即在非常具體且狹義的任務(wù)上實(shí)現(xiàn)這樣的效果蔑水。

平臺并不足以消化這一切

另一項(xiàng)深受認(rèn)同的論據(jù)邢锯,認(rèn)為各大(美國與中國)互聯(lián)網(wǎng)平臺將在本質(zhì)上“擁有”多個(gè)行業(yè) AI 市場泻云。這是因?yàn)椤癆I 是一類強(qiáng)者愈強(qiáng)的行業(yè):你擁有的數(shù)據(jù)越多腹躁,產(chǎn)品就越好 ; 你的產(chǎn)品越好,能夠收集到的數(shù)據(jù)越多镰踏⌒福”這樣的結(jié)論在一定程度上的確屬實(shí)蒂培,具體包括圖像識別、自動(dòng)駕駛車輛榜苫、語音到文本以及基本上任何人皆傾向得出“正確”答案的應(yīng)用場景护戳。然而,很多問題并不具備惟一的正確答案垂睬。因此如果大家嘗試?yán)脵C(jī)器學(xué)習(xí)構(gòu)建新型內(nèi)容媳荒,或者利用數(shù)據(jù)學(xué)習(xí)新的內(nèi)容,那么這將建立起完全不同的市場體系驹饺,且其中完全能夠容納眾多垂直贏家钳枕。

另外,數(shù)據(jù)本身的作用其實(shí)并不像以上論點(diǎn)當(dāng)中表達(dá)的那么顯著赏壹。

根據(jù)我所看到的諸多原型設(shè)計(jì)么伯,我發(fā)現(xiàn)利用以往數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練其實(shí)實(shí)踐價(jià)值相當(dāng)有限。

雖然這也許有助于加速初始原型設(shè)計(jì)卡儒,但也就僅限于此了田柔。大型企業(yè)可能確實(shí)掌握著多年以來的消費(fèi)者數(shù)據(jù)與交互記錄俐巴,但在對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),其仍然需要從頭開始硬爆。初創(chuàng)企業(yè)的競爭環(huán)境則更令人驚訝欣舵。在我看來,財(cái)富五百強(qiáng)企業(yè)中的大部分都已經(jīng)意識到缀磕,AI 實(shí)現(xiàn)方案所需要的數(shù)據(jù)量要比他們想象的少得多缘圈。

除此之外,我還發(fā)現(xiàn)這些研究驅(qū)動(dòng)型團(tuán)隊(duì)存在兩大主要趨勢:其一是這些研究型團(tuán)隊(duì)經(jīng)常受到科學(xué)論文平臺 ArXiv 社區(qū)的啟發(fā)袜蚕,且目前開始邁入初創(chuàng)階段糟把。在大多數(shù)情況下,他們都作為大型集團(tuán)的小規(guī)模外包研究型團(tuán)隊(duì)存在牲剃。

ArXiv 啟發(fā)下的研究型團(tuán)隊(duì)逐步邁入初創(chuàng)舞臺

也許正是由于存在這樣一個(gè)公平的競爭環(huán)境遣疯,才促使眾多研究驅(qū)動(dòng)型團(tuán)隊(duì)參與到柏林的初創(chuàng)市場當(dāng)中。

這一切對于柏林亦屬于新鮮事物凿傅。柏林的初創(chuàng)環(huán)境長久以來一直以學(xué)生創(chuàng)業(yè)為主要表現(xiàn)形式缠犀,并培養(yǎng)起大量來自本地的所謂“運(yùn)營型”初創(chuàng)企業(yè)。Rocket Internet 公司的成功憑借的是他們自身的才能以及硅谷對于市場上現(xiàn)有技術(shù)的漠視聪舒。然而辨液,如今此類機(jī)遇似乎已經(jīng)不復(fù)存在。但包括我自己建立的 Xyo 公司在內(nèi)的各類研究型初創(chuàng)企業(yè)則成為一種寶貴的例外箱残。很多人并不知道滔迈,柏林充斥著大量獨(dú)立的開發(fā)人員。他們既可以在公司內(nèi)工作被辑,也可以參與一些業(yè)余愛好性質(zhì)的項(xiàng)目燎悍,甚至成為柏林當(dāng)?shù)馗髌髽I(yè)的外包商。從 2011 年開始敷待,我記得 Android 團(tuán)隊(duì)的 Reto Meier 就開始邀請我參加柏林的 Android 大會间涵,這一活動(dòng)吸引到了超過 1500 名開發(fā)者。除我之外榜揖,沒有任何一家柏林當(dāng)?shù)爻鮿?chuàng)企業(yè)參與其中勾哩,在這里出現(xiàn)的只是一群充滿愛好與熱情的開發(fā)人員。

這樣的情況目前仍然存在举哟。走出校園的博士們?nèi)匀粚⒅饕聡髽I(yè)(包括工程思劳、銀行、金融以及各類中型企業(yè))作為就業(yè)目標(biāo)妨猩。然而潜叛,我們現(xiàn)在已經(jīng)擁有了一波根基穩(wěn)固的研究型創(chuàng)始者群體。另外,他們中有很多人來自柏林以外的地區(qū)威兜。在我們遇到的 170 個(gè)團(tuán)隊(duì)當(dāng)中销斟,有超過六成來自柏林之外(我們分別與來自劍橋、倫敦椒舵、愛丁堡蚂踊、波茨坦、圖賓根笔宿、卡爾斯魯厄犁钟、蘇黎世以及華沙的博士團(tuán)隊(duì)見過面)。事實(shí)上泼橘,來自美國與亞洲的眾多研究團(tuán)隊(duì)同樣相當(dāng)活躍且令人矚目涝动。柏林能夠僅以 4000 歐元的成本養(yǎng)活一支包含三位成員的技術(shù)團(tuán)隊(duì),這樣的物價(jià)水平在全球范圍內(nèi)都極具競爭力炬灭。

受 ArXiv 啟發(fā)的初創(chuàng)企業(yè)的興起

人們一再向我強(qiáng)調(diào)醋粟,研究型團(tuán)隊(duì)轉(zhuǎn)化為初創(chuàng)企業(yè)的另一大動(dòng)力在于,初創(chuàng)企業(yè)如今面對著應(yīng)用研究領(lǐng)域的巨大發(fā)展空間——事實(shí)上担败,初創(chuàng)企業(yè)的研究方向相較主流企業(yè)要更為自由且靈活昔穴。

以開放性的心態(tài)進(jìn)行方法共享镰官、討論與辯論提前,再加上開源成果的快速采用周期(幾乎能夠立即發(fā)布在 GitHub 之上)使得初創(chuàng)企業(yè)對研究人員而言極具吸引力。網(wǎng)絡(luò)論壇與各類平臺也一直在推動(dòng)這一觀念泳唠,即沒有任何其它企業(yè)能夠像 ArXiv 這樣充滿活力——在這一由康奈大學(xué)最初建立的在線科學(xué)論文庫平臺當(dāng)中狈网,各類團(tuán)隊(duì)能夠隨意參與各類討論。這里為研究人員提供的生活方式——即隨時(shí)發(fā)布他們的想法 / 研究成果并進(jìn)行公開參與——能夠帶來極強(qiáng)的鼓勵(lì)性作用笨腥。人們對此通常抱有一種(誤導(dǎo)性)假設(shè)拓哺,即初創(chuàng)企業(yè)能夠給研究人員提供遠(yuǎn)勝過高校或者大型企業(yè)的自由發(fā)揮空間脖母。一般來講士鸥,AI 團(tuán)隊(duì)只負(fù)責(zé)發(fā)布研究成果,而無需考慮構(gòu)建具體產(chǎn)品或者商業(yè)模式——他們只需要等待收購即可谆级。

要駁斥這樣的固有觀念烤礁,我們可以列舉一個(gè)實(shí)例——Prisma 應(yīng)用如今已經(jīng)擁有極高人氣,其允許用戶根據(jù)主題將一幅圖片的風(fēng)格轉(zhuǎn)換為另一種完全不同的形式肥照。

最初脚仔,一組來自圖賓根大學(xué) Bethgelab 的研究人員于 2015 年 9 月發(fā)表了一篇題為《藝術(shù)風(fēng)格中的神經(jīng)算法》的論文。

此項(xiàng)研究立即得到了關(guān)注舆绎,并在幾天之后開始在 GitHub 上進(jìn)行應(yīng)用程序開發(fā)鲤脏。相關(guān)的高人氣論文及應(yīng)用程序不久后開始陸續(xù)出現(xiàn),且直到今天仍擁有相當(dāng)?shù)臒岫取5?16 年 6 月猎醇,Prisma 應(yīng)用由數(shù)位俄羅斯年輕人開發(fā)完成窥突,并在被引入 Facebook Feed 后得到了公眾的廣泛認(rèn)可。

目前人們普遍認(rèn)為硫嘶,Prisma 的廣泛普及使得公眾開始對神經(jīng)網(wǎng)絡(luò)的應(yīng)用方向抱有好奇心波岛。但在另一方面,這也為初創(chuàng)企業(yè)指出一條新的發(fā)展途徑——先面向公眾音半,而后面向研究社區(qū)则拷。

突然之間彻桃,很多人開始將初創(chuàng)企業(yè)視為一種理想的工作選擇坛善。最終,Bethelab 團(tuán)隊(duì)也建立起一個(gè) Prisma 風(fēng)格的網(wǎng)站。據(jù)我所知葫督,至少有 15 家初創(chuàng)企業(yè)的靈感源自 ArXiv 上發(fā)表的論文冯乘。更多初創(chuàng)企業(yè)則通過 ArXiv 建立起嘗試實(shí)業(yè)的信念。

正如 Roobie Allen 所言他膳,這是一場 ArXiv 啟發(fā)下初創(chuàng)企業(yè)的崛起浪潮:

“與大多數(shù)其它技術(shù)相比,AI 的關(guān)鍵在于其強(qiáng)大的學(xué)術(shù)研究背景。(……)不同于在獲得支持之前長期停滯的創(chuàng)新或者等待傾向矛洞,絕大多數(shù) AI 研究成果皆基于為期僅數(shù)個(gè)月的工作以及有限的代碼量锭沟。其中的關(guān)鍵在于盡快將思路提交至社區(qū),以便其他人能夠?qū)ζ浼右愿纳疲ú⒃谒俗龅街按_立思路的歸屬權(quán)與地位)。”

ArXiv 啟發(fā)型初創(chuàng)企業(yè)的局限

與此同時(shí)滤馍,AI 研究與進(jìn)展不僅體現(xiàn)在風(fēng)格轉(zhuǎn)換層面槐瑞,同時(shí)亦在視覺與圖像建模領(lǐng)域擁有出色表現(xiàn)(具體包括圖像識別悼沿、視覺問題回答义郑、圖像語義標(biāo)簽、視頻識別以及圖像生成等)。書面與口頭語言的研究工作在活躍度與開放性方面相對較低栋盹,機(jī)器學(xué)習(xí)系統(tǒng)在這兩方面的水平則更為有限。

舉例來說榨汤,沒有人會在推文當(dāng)中像 Alex Champandard 或者 Nicholas Guttenberg 那樣討論自己的思路 / 研究成果蠕搜。語言本身也非常復(fù)雜妓灌,這是因?yàn)槠渑c族群狀態(tài)關(guān)系密切圃验。有人認(rèn)為深度學(xué)習(xí)將徹底解決自然語言處理(簡稱 NLP)問題,意味著大家不再需要學(xué)習(xí)語言知識。然而鹿寨,計(jì)算機(jī)語言學(xué)家們在面對計(jì)算機(jī)視覺 / 深度學(xué)習(xí)研究人員時(shí)卻顯得非常無力——他們對文本數(shù)據(jù)進(jìn)行了一些實(shí)驗(yàn)新博,并發(fā)現(xiàn)自己根本無法在自然語言處理層面拿出同樣份量的成果。

服務(wù)于大型企業(yè)的小規(guī)模外包研究團(tuán)隊(duì)仍面臨挑戰(zhàn)

對于大多數(shù)此類團(tuán)隊(duì)而言馏慨,通往初創(chuàng)企業(yè)的轉(zhuǎn)型之中和仍然挑戰(zhàn)重重埂淮。其中部分挑戰(zhàn)屬于創(chuàng)業(yè)工作當(dāng)中的“常態(tài)”,換言之大部分此類團(tuán)隊(duì)都會提出類似的問題写隶。

其中還存在一些具體的模式倔撞。就我所見到的情況,超過九成的 AI 原型設(shè)計(jì)方案以企業(yè)為中心慕趴,而非以消費(fèi)者為中心痪蝇。在這樣的引導(dǎo)之下,相關(guān)團(tuán)隊(duì)大多數(shù)會將少數(shù)大型企業(yè)(買家)作為目標(biāo)客戶冕房。

在這種意義上躏啰,此類團(tuán)隊(duì)更應(yīng)被視為“企業(yè)外包研究機(jī)構(gòu)”,而非真正具有爆炸式增長潛力的“風(fēng)投級初創(chuàng)企業(yè)”耙册。正視并深入探討這個(gè)問題顯然不是什么壞事给僵。就 2017 年來看,大量成規(guī)模的企業(yè)開始與初創(chuàng)公司合作详拙。在柏林帝际,目前存在著超過 160 個(gè)企業(yè)加速器與創(chuàng)新團(tuán)隊(duì)。而本地也存在著不少受眾饶辙,愿意為這些年輕團(tuán)隊(duì)的聰明才智買單蹲诀。

給大家舉個(gè)實(shí)例。最近畸悬,我發(fā)現(xiàn)一家初創(chuàng)企業(yè)正在與兩家物聯(lián)網(wǎng)冰箱制造商合作侧甫。就具體功能而言,這些冰箱產(chǎn)品在關(guān)門之后蹋宦,其中的內(nèi)部攝像機(jī)將能夠幫助用戶查看存放內(nèi)容。其中一部分產(chǎn)品可以實(shí)現(xiàn)條碼識別咒锻,但另一些則不能冷冗。接下來,這些日常數(shù)據(jù)將被發(fā)送至廠商處進(jìn)行分析惑艇。

毫不意外蒿辙,這家企業(yè)希望將 “大數(shù)據(jù)”作出的模糊承諾轉(zhuǎn)化為更具體的收益拇泛。

這家企業(yè)無法弄清如何追蹤 ETL 問題并在內(nèi)部將數(shù)據(jù)轉(zhuǎn)化為實(shí)際價(jià)值。這就給我們的研究人員帶來了創(chuàng)業(yè)機(jī)遇思灌。在實(shí)際接觸中俺叭,這家初創(chuàng)企業(yè)提出了很多關(guān)于解決各類挑戰(zhàn)的好辦法。其中之一在于建立一套出色的模型泰偿,而后設(shè)計(jì)訓(xùn)練神經(jīng)網(wǎng)絡(luò)以識別各類品牌標(biāo)志圖像熄守,最終以此為基礎(chǔ)構(gòu)建部分分析功能。

對于研究驅(qū)動(dòng)型團(tuán)隊(duì)而言耗跛,達(dá)到上述目標(biāo)已經(jīng)相當(dāng)值得稱道裕照,更遑論其能夠通過自己的工作獲得報(bào)酬。然而调塌,他們只是重復(fù)了以往他人已經(jīng)實(shí)現(xiàn)過的成績晋南,因?yàn)檫@樣的結(jié)果并不足以使其成為風(fēng)投眼中的黃金“初創(chuàng)企業(yè)”。雖然他們?nèi)杂锌赡艹蔀槲磥淼某鮿?chuàng)明星羔砾,但就目前而言负间,其方案仍然只是一種早期原型,且其堆棧與初始代理客戶端當(dāng)中仍存在不少漏洞姜凄。與他人一樣唉擂,Eyeem 公司的 Ramzi Rizk 也認(rèn)為:成為一家符合風(fēng)險(xiǎn)投資要求的 AI 初創(chuàng)企業(yè)其實(shí)非常艱難。

未來展望:時(shí)間到數(shù)據(jù)與快速迭代

那么這些小型外包研究機(jī)構(gòu)要如何才能發(fā)展為真正的初創(chuàng)企業(yè)檀葛?以下兩項(xiàng)目標(biāo)值得大家加以借鑒玩祟。

時(shí)間到數(shù)據(jù)

正如 AI 風(fēng)投方 Merantix 公司的 Rasmus Rothe 所言:

“在機(jī)器學(xué)習(xí)學(xué)術(shù)界,人們幾乎不會關(guān)注數(shù)據(jù)集的獲取方法屿聋。相反:為了將深度學(xué)習(xí)技術(shù)與其它方法相比較空扎,同時(shí)確保其中一種方法優(yōu)于另一種方法,標(biāo)準(zhǔn)流程要求以相同的評估程序來衡量標(biāo)準(zhǔn)數(shù)據(jù)集的處理成效润讥。然而在現(xiàn)實(shí)世界當(dāng)中转锈,新型算法與其它方法相比在成效方面反而下降了 1%。這里的重點(diǎn)在于構(gòu)建起一套強(qiáng)大的系統(tǒng)楚殿,確保其能夠以足夠的準(zhǔn)確性解決所需任務(wù)撮慨。對于一切機(jī)器學(xué)習(xí)系統(tǒng),這都需要進(jìn)行標(biāo)記訓(xùn)練脆粥,并幫助算法以此為基礎(chǔ)完成學(xué)習(xí)砌溺。”

實(shí)際上变隔,人們可能往往會假設(shè)能夠?qū)崿F(xiàn) AI 突破的關(guān)鍵性算法如寶藏般靜靜躺在某處规伐,等待著研究人員通過大量高質(zhì)量數(shù)據(jù)集將其從現(xiàn)有文獻(xiàn)當(dāng)中挖掘出來,而后立足當(dāng)前可用的硬件加以針對性優(yōu)化匣缘。

在演講當(dāng)中猖闪,我通常建議此類機(jī)構(gòu)依靠以下方式運(yùn)行測試鲜棠。

讓企業(yè)付費(fèi)以確保研究工作的正常運(yùn)行。

堅(jiān)持投入同樣的時(shí)間服務(wù)于其它客戶培慌。

在這些“其它”客戶當(dāng)中豁陆,需要優(yōu)化的重點(diǎn)在于獲取數(shù)據(jù)的時(shí)間。對于那些愿意測試自己粗糙的 beta 原型方案并提供反饋的朋友而言吵护,這無疑是一種福利盒音。通過這種方式,我們通常能夠與其它初創(chuàng)企業(yè)(以免費(fèi)方式)進(jìn)行初步對接何址,而后與這些小型且通常由初創(chuàng)者主導(dǎo)的年輕公司組隊(duì)里逆,從而在無需正式數(shù)據(jù)獲取流程的前提下作出明智決策。

更快迭代周期

另一條建議則與數(shù)據(jù)分析相關(guān)用爪。在這方面原押,大家需要找到哪些模型能夠確切實(shí)現(xiàn)效果,而哪些模式適用于特定數(shù)據(jù)集偎血。

這意味著研究團(tuán)隊(duì)不可能以上百萬個(gè)數(shù)據(jù)點(diǎn)為規(guī)模進(jìn)行運(yùn)營诸衔,因?yàn)檫@將帶來 3000 甚至是 10000 套數(shù)據(jù)集。相反颇玷,著眼于數(shù)據(jù)并發(fā)現(xiàn)模式才是最好的選擇笨农。

其中最簡單且成本低廉的處理方法就是在 AWS S3 存儲桶上執(zhí)行無服務(wù)器 MySQL 查詢,或者立足 Redshift 構(gòu)建起一些簡單項(xiàng)目帖渠。如此一來谒亦,各研究團(tuán)隊(duì)即可將大量數(shù)據(jù)導(dǎo)入 AWS 并運(yùn)行 SQL 查詢,最終查看這些重要模式——而無需自行構(gòu)建基礎(chǔ)設(shè)施空郊。

到這里份招,研究團(tuán)隊(duì)需要投入更多時(shí)間對數(shù)據(jù)進(jìn)行整理(占總體工作時(shí)間的七成到九成),而后發(fā)現(xiàn)模式并在短時(shí)間內(nèi)構(gòu)建起算法狞甚。對于大多數(shù)研究型初創(chuàng)企業(yè)而言锁摔,這種作法與直覺存在沖突。然而哼审,通過這樣的方式谐腰,研究團(tuán)隊(duì)將能夠在兩到三周之內(nèi)順利前往下一次組隊(duì)迭代——而非像以往那樣耗費(fèi)更長時(shí)間。

一旦找到志趣相投的組隊(duì)伙伴涩盾,接下來就可以審視初創(chuàng)企業(yè)的數(shù)據(jù)收集策略并調(diào)查其可行性十气。事實(shí)上,通過計(jì)算得出這些數(shù)據(jù)策略很可能是研究型團(tuán)隊(duì)所面臨的旁赊、最為艱巨的反直覺挑戰(zhàn)桦踊。

事實(shí)上,其中一些策略甚至可能引起爭議终畅,并讓整個(gè)團(tuán)隊(duì)重新思考是否還應(yīng)繼續(xù)朝著初創(chuàng)企業(yè)努力籍胯。以 Babylon Health 為例,這款聊天機(jī)器人應(yīng)用允許用戶在無需親臨診所的前提下就自身癥狀提出問題离福,且最近籌集到 6000 萬美元杖狼。該團(tuán)隊(duì)認(rèn)為,“Babylon 的科學(xué)家們預(yù)測稱妖爷,我們將能夠很快實(shí)現(xiàn)比醫(yī)生更出色的個(gè)人健康問題診斷與預(yù)測能力蝶涩。”在西方世界當(dāng)中絮识,從診斷到健康狀況預(yù)測涉及大量數(shù)據(jù)绿聘、科學(xué)、法律以及商業(yè)化問題次舌。

不過單純從技術(shù)角度來講熄攘,醫(yī)療團(tuán)隊(duì)確實(shí)能夠打造出一套比人類更強(qiáng)大的特定健康問題檢測或預(yù)測方案。如果能夠在理論層面將診斷準(zhǔn)確率由 30% 提升到 60%彼念,即可拯救許多鮮活的生命挪圾。然而,40% 的準(zhǔn)確率時(shí)可能出現(xiàn)的訴訟足以毀滅初創(chuàng)企業(yè)的發(fā)展道路逐沙。也正因?yàn)槿绱苏芩迹姸噌t(yī)療衛(wèi)生團(tuán)隊(duì)選擇在數(shù)據(jù)保護(hù)措施較弱或者被起訴可能性較低的國家進(jìn)行早期實(shí)驗(yàn)。舉例來說吩案,Babylon Health 在盧旺達(dá)擁有 45 萬名用戶棚赔。而西方各國的健康預(yù)防相關(guān)組織則通過各大型企業(yè)處理醫(yī)療系統(tǒng)及健康預(yù)測的監(jiān)管工作。

到這一階段徘郭,研究型團(tuán)隊(duì)亦開始需要轉(zhuǎn)化為數(shù)據(jù)驅(qū)動(dòng)型團(tuán)隊(duì)靠益。

數(shù)據(jù)是否(仍)未實(shí)現(xiàn)民主化?

可以理解的是崎岂,Zeroth.ai 公司(AI 創(chuàng)新初創(chuàng)企業(yè)之一)的 Tak Lo 認(rèn)為“數(shù)據(jù)鴻溝是 AI 創(chuàng)新所面臨的最大威脅”捆毫,并極力呼吁數(shù)據(jù)民主化。

Tak 呼吁建立一套類似于維基百科的 AI 數(shù)據(jù)庫冲甘,這也從一個(gè)側(cè)面證明如今 AI 研究團(tuán)隊(duì)的主要挑戰(zhàn)也許正在于數(shù)據(jù)訪問能力绩卤。各團(tuán)隊(duì)創(chuàng)始人在努力為合法技術(shù)或金融技術(shù)等平臺當(dāng)中的垂直領(lǐng)域構(gòu)建特定用途的產(chǎn)品,并希望借此回避與谷歌或者微軟等技術(shù)巨頭的直接競爭江醇。

然而總體而言濒憋,如今的數(shù)據(jù)還遠(yuǎn)沒有實(shí)現(xiàn)民主化。盡管近來人們正在為建立數(shù)據(jù)民主化平臺而紛紛發(fā)聲陶夜,Helix 等垂直應(yīng)用商店也得到陸續(xù)啟動(dòng)凛驮,但 AI 當(dāng)前仍沒有達(dá)到“蘋果 App Store”這一徹底實(shí)現(xiàn)移動(dòng)開發(fā)與發(fā)布民主化的重量級成果的級別。

我們才剛剛踏上征途

目前對于研究驅(qū)動(dòng)型團(tuán)隊(duì)而言堪稱理想的歷史時(shí)機(jī)条辟,大家可以將自己的想法塑造出來黔夭,并在創(chuàng)業(yè)領(lǐng)域當(dāng)中進(jìn)行測試宏胯。而我們也將越來越多地看到 ArXiv 在其中發(fā)揮的重要促進(jìn)作用。相當(dāng)一部分研究團(tuán)隊(duì)未來將繼續(xù)作為大型企業(yè)的外包機(jī)構(gòu)進(jìn)行工作本姥,單就這一點(diǎn)而言已經(jīng)是一項(xiàng)了不起的成就肩袍。而其中一部分團(tuán)隊(duì)還將進(jìn)一步發(fā)展:找到自身產(chǎn)品的市場適應(yīng)度,同時(shí)發(fā)現(xiàn)最佳數(shù)據(jù)收集策略婚惫,最終徹底改變世界氛赐。

作者簡介

Matth?us Krzykowski,作為專司初創(chuàng)企業(yè)業(yè)務(wù)的運(yùn)營顧問先舷,過去兩年以來艰管,我在柏林關(guān)注過圍繞 AI/ML 與 MPP 數(shù)據(jù)庫建立起 170 多個(gè)原型設(shè)計(jì)研究團(tuán)隊(duì)。

原文鏈接:https://medium.com/techstars/the-ai-race-to-the-top-observations-on-research-driven-teams-berlin-arxiv-4e14fee9d28e

-全文完-

《深入淺出TensorFlow》迷你書現(xiàn)已發(fā)布蒋川,關(guān)注公眾號“AI前線”牲芋,ID:ai-front,回復(fù)關(guān)鍵字:TF尔破,獲取下載鏈接街图!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市懒构,隨后出現(xiàn)的幾起案子餐济,更是在濱河造成了極大的恐慌,老刑警劉巖胆剧,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件絮姆,死亡現(xiàn)場離奇詭異,居然都是意外死亡秩霍,警方通過查閱死者的電腦和手機(jī)篙悯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來铃绒,“玉大人鸽照,你說我怎么就攤上這事〉咝” “怎么了矮燎?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長赔癌。 經(jīng)常有香客問我诞外,道長,這世上最難降的妖魔是什么灾票? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任峡谊,我火速辦了婚禮,結(jié)果婚禮上既们,老公的妹妹穿的比我還像新娘濒析。我一直安慰自己贤壁,他們只是感情好莹妒,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布旨怠。 她就那樣靜靜地躺著迷扇,像睡著了一般。 火紅的嫁衣襯著肌膚如雪厨内。 梳的紋絲不亂的頭發(fā)上瞭亮,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天唆缴,我揣著相機(jī)與錄音氮双,去河邊找鬼铛嘱。 笑死墨吓,一個(gè)胖子當(dāng)著我的面吹牛亮曹,可吹牛的內(nèi)容都是我干的秘症。 我是一名探鬼主播,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼邻邮,長吁一口氣:“原來是場噩夢啊……” “哼丹泉!你這毒婦竟也來了晒哄?” 一聲冷哼從身側(cè)響起较木,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤雌桑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后千诬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年蔑舞,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了低零。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片掏婶。...
    茶點(diǎn)故事閱讀 39,902評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖潭陪,靈堂內(nèi)的尸體忽然破棺而出雄妥,到底是詐尸還是另有隱情,我是刑警寧澤依溯,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布老厌,位于F島的核電站,受9級特大地震影響黎炉,放射性物質(zhì)發(fā)生泄漏枝秤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一慷嗜、第九天 我趴在偏房一處隱蔽的房頂上張望淀弹。 院中可真熱鬧,春花似錦庆械、人聲如沸薇溃。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽痊焊。三九已至,卻和暖如春忿峻,著一層夾襖步出監(jiān)牢的瞬間薄啥,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工逛尚, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留垄惧,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓绰寞,卻偏偏與公主長得像到逊,于是被迫代替她去往敵國和親铣口。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,843評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 內(nèi)容屬性: 生產(chǎn)時(shí)間2017年7月29日觉壶,內(nèi)容保鮮期18個(gè)月脑题,內(nèi)容省略度5%, 內(nèi)容類型:干貨型铜靶。內(nèi)容制作視角:全...
    青陽的桌邊談資兒閱讀 29,780評論 9 169
  • 2017.11.27 星期一 晴天 今天是特種兵內(nèi)訓(xùn)第8天叔遂,新的訓(xùn)練周,細(xì)數(shù)了一下争剿,今天我們的作業(yè)一共有八項(xiàng)已艰。一早...
    e74a499bf42d閱讀 245評論 0 0
  • 這一系列,寫的是朋友的一個(gè)夢中的各個(gè)角色的悲歡蚕苇。 悲歡一并粘連 斑駁了張張笑臉 是前世與今生的再現(xiàn) 還是從來世反射...
    晴柒陌沫閱讀 401評論 0 3
  • 小時(shí)候哩掺,她 優(yōu)雅、博學(xué)涩笤、親和 渺小的我 因?yàn)樗赂业膲?去追嚼吞,去拼搏 長大后,我便成了她 無助辆它、疲倦誊薄、艱辛 席卷...
    珺柒齋閱讀 145評論 0 0