漫畫,讓AI頭疼的問題

17101212468?黃翊杰

轉(zhuǎn)載自http://www.zishu010.com/z/newdetail/9811903.html耕漱,原文標(biāo)題“終于發(fā)現(xiàn)一個AI替代不了的工作——畫漫畫,因為AI看不懂漫畫”,原始文章發(fā)布在微信公眾號“腦極體”(ID:unity007)孵运,作者:腦極體。

【嵌牛導(dǎo)讀】:我們經(jīng)常討論一些AI對我們生活造成的影響和改變蔓彩,討論中更多的是關(guān)注其可能會對我們這個社會系統(tǒng)帶來的負面影響和威脅治笨,但其實目前的AI水平仍是停留在低智能的機械水平上,比如赤嚼,AI拿漫畫就一點辦法沒有旷赖。

【嵌牛鼻子】:二次元,漫畫家更卒,人工智能

【嵌牛提問】:漫畫是一種人類獨有表述能力的體現(xiàn)等孵,還有哪些方面像漫畫一樣可以為難一下AI?

【嵌牛正文】:

AI工程師的很大一部分工作就是替AI“帶路”蹂空,然后告訴人類俯萌,你們的這項和那項工作都要被AI替代了。

一直以來上枕,人類似乎都站在一個毫無還手之力的弱勢地位绳瘟,或許未來真的像一些悲觀者想象中那樣,我們有AI司機姿骏、AI售貨員糖声、AI詩人,但人類自己卻成了可憐的乞討者。

直到今天蘸泻,他們第一次發(fā)現(xiàn)有一項工作AI在一段時間以內(nèi)都無法超越人類琉苇,而這次勝利屬于二次元——不會被AI代替的工作,是漫畫家悦施。

連漫畫都看不懂并扇,談什么毀滅世界?

漫畫家不會AI代替的原因很簡單抡诞,因為馬里蘭大學(xué)的一位教授進行了一項研究穷蛹,最終發(fā)現(xiàn)AI根本看不懂漫畫。

以上是一則非常簡單的四格漫畫昼汗,對于人類來說理解起來非常容易:小貓在思考創(chuàng)作素材肴熏,然后發(fā)現(xiàn)了小狗,要求小狗講個笑話顷窒,小狗說“你很漂亮”導(dǎo)致小貓非常憤怒蛙吏。

實際上,在最后一個畫面中鞋吉,小狗沒有入鏡鸦做,而“你很漂亮”本來是表揚,要和上一個畫面中的“笑話”連接起來谓着,才能解釋出小貓的情緒泼诱。

對于AI來說,理解這些呈現(xiàn)在畫面之外的信息赊锚,簡直太困難了治筒。

在馬里蘭大學(xué)的實驗中,研究者搭建了一個由120萬張漫畫畫格組成的數(shù)據(jù)集改抡,并提取出了每個畫格中的文本矢炼,利用LSTM模型系瓢,希望AI能對漫畫進行一個連貫的了解阿纤。

關(guān)于LSTM(長短期記憶網(wǎng)絡(luò))此前已經(jīng)介紹過很多,這一模型的特點就是加入了記憶的概念夷陋,可以處理和預(yù)測時間序列較長元素欠拾。雖然在長文本纳像、機器翻譯等等方面表現(xiàn)的都不錯轻黑,但在看漫畫這件事上,LSTM徹底挫敗了楞慈。

在經(jīng)過大量訓(xùn)練后酬土,研究人員給了AI一組以前沒見過的漫畫荆忍,要求AI理解并預(yù)測下一個畫面中的文字信息或畫面內(nèi)容,結(jié)果AI的成績一塌糊涂。而人類的預(yù)測正確程度刹枉,通常能達到80%的正確率叽唱。

視覺敘事?何必強人工智能所難

嚴(yán)格來說微宝,漫畫這種東西屬于“視覺敘事”——把信息隱藏于圖像之中棺亭。同樣是視覺敘事,AI理解電影就比理解漫畫容易的多蟋软,電影的主角是人镶摘,而人臉長的都是一個樣子,想要訓(xùn)練AI讀出人臉表情岳守、識別情緒是件很簡單的事凄敢,更何況電影還會有詳細的劇本。

但漫畫最大的特點棺耍,就是視覺上不具有連貫性贡未。就像上文的四格漫畫一樣,第三張圖小狗還在畫面中蒙袍,第四張圖就不在了俊卤。人類可以很快的理解到,名為淡定狗的小狗扔下一句話就淡定的離開害幅∠校可對于AI來說,讀出這種在畫面和文字之外的信息實在是強人工智能所難以现。

其次狠怨,不同漫畫的繪畫、敘事風(fēng)格迥異邑遏,對于AI的訓(xùn)練來說也是個難點佣赖。簡單的四格漫畫中,每一格的場景都是相同的记盒,可在其他漫畫中憎蛤,可能這一格是打斗的場景,下一格就是一張憤怒的人臉纪吮。能看懂四格漫畫AI俩檬,再去看那種有鏡頭切換感的漫畫,也是一頭霧水碾盟。至于畫風(fēng)方面棚辽,不同漫畫家對于人臉描繪方式都有很大差異,換成AI來理解冰肴,難度又會加大了屈藐。

還有一點榔组,視覺敘事這件事是建立在“邏輯”和“常識”兩個概念基礎(chǔ)之上的。比如小貓說講個笑話联逻,小狗說“你好漂亮”瓷患,理解這個情節(jié)就需要“你說我漂亮是笑話=你說我丑”這一基礎(chǔ)的邏輯。又比如哆啦A夢中常見的老鼠梗也需要“貓通常不怕老鼠”這一基礎(chǔ)常識遣妥。這些東西對于人類來說都很簡單擅编,可是AI是不具備這些常識和邏輯概念的,我們也不能像編百科全書那樣箫踩,把這些概念灌輸?shù)紸I的大腦之中爱态。

圍棋界的大手,到了甄嬛傳里也是一集死

其實結(jié)合AI在圍棋領(lǐng)域的勝利和在漫畫上的失敗境钟,我們可以看出,AI在完全信息信息領(lǐng)域中的表現(xiàn)和不完全信息領(lǐng)域中的表現(xiàn)完全不同慨削。

完全信息本來是經(jīng)濟學(xué)中的一個屬于,意思是參與者可以理解整個市場的所有信息缚态。在這里,我們可以看做一項工作的數(shù)據(jù)集玫芦。在圍棋這項工作中浆熔,所有的信息都可以歸納為數(shù)據(jù)集:游戲的規(guī)則、每一步的打法桥帆。可在漫畫中老虫,我們最多能把畫面中做上詳細的標(biāo)注,把文本信息都提取出來祈匙『龉簦可隱藏在圖片文字之外的邏輯關(guān)系、常識等等只可意會不可言傳的東西菊卷,是無法向AI提供的缔恳。

而AI做的最差的洁闰,就是read between the lines万细。

以此類推扑眉,AI在戲劇、歇后語聘裁、四國軍棋的暗棋(一種包含了欺騙的軍旗玩法)包括談戀愛等等一切充滿了不完全信息、欺騙與反欺騙衡便、解讀意象、常識和邏輯的游戲中表現(xiàn)都不會太好镣陕。

這么看來姻政,AI有點像《三體》里初期的智子呆抑,不會隱藏自己的想法汁展,也不能明白隱瞞、欺騙這種概念侈咕。所以,我們真的不必對AI的勝利感到恐懼乎完,它會是辦公室里人緣最差的那位同事和后宮里一集死的路人品洛,某一項能力的突出并不能彌補它在不完全信息方面的短板。更何況意象桥状、類比、反諷辅斟、隱喻這種東西,是人類最擅長的手段士飒。

我相信,未來世界最好的樣子一定是人類和AI各司其職扰藕,做各自最擅長的事情芳撒。在視覺敘事這類AI特別不擅長的事情上邓深,它們依然能給人類提供很多幫助未桥。

比如用生成對抗神經(jīng)網(wǎng)絡(luò)創(chuàng)造人物形象芥备、用監(jiān)督學(xué)習(xí)+卷積網(wǎng)絡(luò)來為線稿上色冬耿、甚至開發(fā)一款會自動放大文字的漫畫閱讀App。這些并不是幻想亦镶,而是正在發(fā)生的現(xiàn)實。當(dāng)這些繁復(fù)的機械勞動被AI代勞后染乌,我們也就能更多的投入到自己擅長的事情中來:利用不完全信息環(huán)境講好更多故事懂讯,讓這個世界保持應(yīng)有的趣味。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末勒庄,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子实蔽,更是在濱河造成了極大的恐慌谨读,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件劳殖,死亡現(xiàn)場離奇詭異,居然都是意外死亡宣增,警方通過查閱死者的電腦和手機矛缨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來灵妨,“玉大人,你說我怎么就攤上這事泌霍〗盍浚” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵桨武,是天一觀的道長。 經(jīng)常有香客問我凉蜂,道長性誉,這世上最難降的妖魔是什么窿吩? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任纫雁,我火速辦了婚禮倾哺,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘羞海。我一直安慰自己,他們只是感情好却邓,可當(dāng)我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著简十,像睡著了一般撬腾。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上时鸵,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天,我揣著相機與錄音初坠,去河邊找鬼彭雾。 笑死,一個胖子當(dāng)著我的面吹牛薯酝,可吹牛的內(nèi)容都是我干的爽柒。 我是一名探鬼主播者填,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼占哟!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起怎燥,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤蜜暑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后肛捍,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡氢橙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年恬偷,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片袍患。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡诡延,死狀恐怖滞欠,靈堂內(nèi)的尸體忽然破棺而出肆良,到底是詐尸還是另有隱情,我是刑警寧澤惹恃,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布巫糙,位于F島的核電站朗儒,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏乏悄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一檩小、第九天 我趴在偏房一處隱蔽的房頂上張望妆够。 院中可真熱鬧负蚊,春花似錦、人聲如沸家妆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至庸疾,卻和暖如春当编,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背忿偷。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留鲤桥,地道東北人。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓嫂拴,卻偏偏與公主長得像贮喧,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子塞淹,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容