在過去伏恐,每年雙11,設(shè)計師們都會開啟狂加班模式:做海報栓霜、改文字翠桦、換商品、調(diào)設(shè)計胳蛮、換 banner销凑,每個設(shè)計師對接幾個運營人員,富士康流水線一樣的重復(fù)性工作仅炊。一年雙 11 下來斗幼,完成上億張海報。
然而抚垄,這一切正在成為過去蜕窿。
AI 改變了圍棋,現(xiàn)在也在改變海報設(shè)計督勺。這是一個名為 " 魯班 " 的 AI 設(shè)計師渠羞,它已擔(dān)綱去年雙 11 的 banner 海報設(shè)計,數(shù)量高達 4 億張智哀。
但考慮到魯班平均 1 秒鐘就能完成 8000 張海報設(shè)計次询,一天可以制作 4000 萬張,4 億只能算一個小小小小目標瓷叫。
這個海報設(shè)計 AI" 魯班 "屯吊,誕生也與雙 11 有關(guān)。
每年雙 11摹菠,都是阿里設(shè)計師的大考:海量的設(shè)計需求盒卸,需要保證所有人都統(tǒng)一規(guī)范,遇到緊急設(shè)計需求次氨,還要快速出稿蔽介,對每一個設(shè)計師都是腦力、體力雙重考驗。
于是虹蓄,2015 年雙 11 后犀呼,阿里內(nèi)部開始萌生想法,當(dāng)年阿里正式在商品推薦上實現(xiàn) " 千人千面 "薇组,所以希望強營銷導(dǎo)向的廣告資源位的設(shè)計也能實現(xiàn) " 千人千面 "外臂。
因此 " 魯班 " 項目正式成立,并不斷發(fā)展至現(xiàn)今的 " 阿里智能設(shè)計實驗室 ":讓魯班學(xué)習(xí)人類設(shè)計師的成果和經(jīng)驗律胀,不斷進化宋光,2017年雙 11,魯班的水平已經(jīng)達到了阿里內(nèi)部 P6 水準炭菌。
魯班的學(xué)習(xí)進化罪佳,主要有三大技術(shù)原理:風(fēng)格學(xué)習(xí)(規(guī)劃 + 元素)、行動器娃兽,以及評估網(wǎng)絡(luò)菇民。
首先是風(fēng)格學(xué)習(xí)模塊。
魯班先將大量設(shè)計素材的設(shè)計數(shù)據(jù)進行結(jié)構(gòu)化標注投储,最后經(jīng)過一系列的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)第练,輸出空間 + 視覺的設(shè)計框架。
框架設(shè)計中玛荞,首先通過人工標注的方式娇掏,讓機器理解該幅設(shè)計有哪些元素組成,比如它的商品主體勋眯,花的背景婴梧,蒙版。往上一層客蹋,還需要通過設(shè)計的經(jīng)驗知識塞蹭,定義一些設(shè)計的手法和風(fēng)格。手法指的是這些元素為什么可以這么構(gòu)成讶坯。最上面這一層是風(fēng)格番电,當(dāng)這些元素構(gòu)成之后,它從美學(xué)或者視覺角度看是一個什么感受辆琅,讓機器知道它是用什么組成漱办。
下一步是準備設(shè)計的原始文件,比如一系列花朵和設(shè)計方法婉烟,輸入到深度學(xué)習(xí)網(wǎng)絡(luò)中娩井。該網(wǎng)絡(luò)具備一定記憶功能,可以記住設(shè)計步驟中復(fù)雜的過程似袁。
經(jīng)過這層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)之后洞辣,會得到一個設(shè)計框架咐刨。從技術(shù)上理解,它是一堆空間特征和視覺特征構(gòu)成的模型屋彪。從設(shè)計師的視角來看所宰,它相當(dāng)于設(shè)計師腦里在做一組設(shè)計之前那個大概的框架印象。
在設(shè)計框架的同時畜挥,元素中心也在批量輸入元素(如底圖,主產(chǎn)品圖婴谱、修飾元素等)蟹但,由元素分類器進行學(xué)習(xí),按照視覺特征和類型分類谭羔。
具體來說华糖,魯班團隊會提前收集一些版權(quán)圖庫,以及自己造設(shè)計元素的方式瘟裸,輸入到元素分類器中客叉。這個分類器會把這些元素分布到各個類型里,比如背景话告、主體兼搏、修飾,也會完成圖片庫的提取沙郭。
其次是行動器佛呻。
行動器的主要作用,是根據(jù)需求從風(fēng)格學(xué)習(xí)模塊中選擇設(shè)計原型病线,并從元素中心中選取元素吓著,規(guī)劃出多個最優(yōu)生成路徑,完成圖片設(shè)計送挑。
這與設(shè)計師實際工作過程非常相似绑莺,如設(shè)計師要設(shè)計一朵花,也會在軟件里會不斷去調(diào)每個位置惕耕、每個像素纺裁、每個角度。同時赡突,整個過程也是一個強化學(xué)習(xí)的過程对扶,行動器會在不斷試錯中更聰明、更智能惭缰。
此過程完成后浪南,將輸出多個設(shè)計圖,并最終交給 " 評估網(wǎng)絡(luò) " 對輸出產(chǎn)品進行評分漱受。
最后是評估網(wǎng)絡(luò)络凿。
評估網(wǎng)絡(luò)的工作原理是輸入大量的設(shè)計圖片和評分數(shù)據(jù)骡送,經(jīng)過訓(xùn)練后,讓機器學(xué)會判斷設(shè)計的好壞絮记。
魯班的基礎(chǔ)是來源于設(shè)計師的設(shè)計模板素材和元素素材摔踱,因此會有兩個設(shè)計師角色每天去訓(xùn)練魯班,一個負責(zé)幫助魯班完成最新的風(fēng)格學(xué)習(xí)(風(fēng)格學(xué)習(xí))怨愤,讓魯班不斷進化派敷,不斷掌握更好的設(shè)計技巧。
另一個的角色則是對魯班設(shè)計出來的成果進行評估(評估網(wǎng)絡(luò))撰洗,告訴魯班什么樣的設(shè)計才是最好的篮愉。
設(shè)計師的核心職責(zé),在于把設(shè)計變成數(shù)據(jù)化差导。目前试躏,魯班已經(jīng)學(xué)習(xí)了百萬級的設(shè)計稿,擁有了演變出上億級的海報設(shè)計能力设褐。
這背后颠蕴,阿里的設(shè)計師和算法工程師做了三大功課。
第一助析,領(lǐng)域研究犀被。找到該領(lǐng)域?qū)<疑钊胙芯吭擃I(lǐng)域的經(jīng)驗知識,構(gòu)建一套機器可以學(xué)習(xí)的數(shù)據(jù)模型貌笨。視覺設(shè)計專家把設(shè)計問題抽象成 " 風(fēng)格 - 手法 - 模板 - 元素 " 這樣一套數(shù)據(jù)模型弱判,即把多年視覺設(shè)計經(jīng)驗變成機器可學(xué)習(xí)的 " 數(shù)據(jù) "。
第二锥惋,數(shù)據(jù)鏈路昌腰。定義好數(shù)據(jù)模型后,抓取和標注數(shù)據(jù)膀跌,并對數(shù)據(jù)集進行分類和管理遭商。在這個過程匯總,如果處理數(shù)據(jù)給算法訓(xùn)練的更新頻次捅伤,用什么數(shù)據(jù)去驗證模型劫流,如何評估模型效果,離線模型與在線數(shù)據(jù)在產(chǎn)品端如何打通丛忆?這一系列的數(shù)據(jù)問題就需要一套清晰的數(shù)據(jù)鏈路設(shè)計祠汇。
第三,算法框架熄诡。算法框架由算法科學(xué)家來制定可很,數(shù)據(jù)和算法的關(guān)系就像汽油和發(fā)動機,兩者密不可分凰浮。產(chǎn)品設(shè)計師需要與算法討論我抠,把業(yè)務(wù)場景和數(shù)據(jù)問題輸入給算法苇本。
這也是阿里內(nèi)部讓產(chǎn)品設(shè)計師學(xué)習(xí)機器學(xué)習(xí)的原因,因為搞懂算法框架和技術(shù)原理菜拓,才能更好理解工作原理瓣窄。
但三方面功課背后,也不是沒有挑戰(zhàn)纳鼎。整個魯班打造過程中俺夕,遭遇了三方面技術(shù)挑戰(zhàn)。
首先是缺少標注數(shù)據(jù)贱鄙。今天所有的人工智能都基于大規(guī)模結(jié)構(gòu)化標注數(shù)據(jù)啥么,設(shè)計這件事情連數(shù)據(jù)都沒有完成在線化,更別說標準化贰逾、結(jié)構(gòu)化的數(shù)據(jù)。
其次是設(shè)計的不確定性菠秒。設(shè)計是個很不確定的東西疙剑,設(shè)計需求把握和結(jié)果評估都存在人類主觀意識。比如你無法給機器輸入 " 高端大氣的海報 " 這樣的指令践叠。
最后是無先例可循言缤。整個行業(yè)中沒有一些現(xiàn)成的技術(shù)或者框架可以參考,這和 AlphaGo 帶來的福利不同禁灼。當(dāng)時 AlphaGo 團隊公布論文后管挟,全世界圍棋 AI 都照此提升了戰(zhàn)力。但對于魯班來說弄捕,并無先前經(jīng)驗可以參考僻孝,一切全憑自己摸索。不過也并非完全沒有收獲守谓,在探索中的一年穿铆,阿里魯班團隊對 AI 產(chǎn)品有了更為清晰的定義。
他們內(nèi)部認為斋荞,魯班做的 AI 是可控的視覺生成荞雏。可控平酿,指的是根據(jù)商業(yè)的需求凤优、業(yè)務(wù)的需求,智能地進行控制蜈彼;視覺生成筑辨,則表明魯班解決的是視覺從無到有的問題。
在 2016 年雙 11柳刮,魯班首次登場挖垛。它最終制作了 1.7 億張廣告 banner痒钝,點擊率提升 100%。
與人類對比的話痢毒,假設(shè)每張圖送矩,人類設(shè)計師需要耗時 20 分鐘,滿打滿算也需要 100 個設(shè)計師連續(xù)做 300 年哪替。
而現(xiàn)在栋荸,魯班也被進行了進一步迭代。設(shè)計水平顯著提升凭舶,最新的數(shù)據(jù)情況是:
魯班已經(jīng)學(xué)習(xí)了百萬級的設(shè)計稿晌块,擁有演變出上億級的海報設(shè)計能力。去年雙 11帅霜,魯班已經(jīng)可以實現(xiàn)一天制作 4000 萬張海報匆背,平均每秒可實現(xiàn)設(shè)計 8000 張海報,并且每張海報會根據(jù)商品圖像特征專門設(shè)計身冀,換句話說說钝尸,魯班設(shè)計出的海報,沒有一張會完全一樣的搂根。
按照當(dāng)前阿里內(nèi)部對技術(shù)崗位的評判體系珍促,海報設(shè)計 AI 魯班,已經(jīng)達到了 P6 水準剩愧,后續(xù)進階也只會越來越快猪叙。
那設(shè)計師會就此被 AI 替代嗎?
當(dāng)然不會仁卷!
" 魯班去年花了半個月時間學(xué)會雙 11 設(shè)計風(fēng)格穴翩,目前已經(jīng)開始產(chǎn)出一部分人類沒教過它的設(shè)計了。但是最具創(chuàng)新意義的創(chuàng)造類設(shè)計五督,目前只能通過人機協(xié)同的方式完成藏否。" 魯班負責(zé)人樂剩介紹說。
機器智能只是社會新生產(chǎn)力的一部分充包。機器人與人合作副签,既提升了效率和質(zhì)量,又讓天貓雙11超級工程變得如此“輕松”基矮。