我看到了一個“假視頻”——AI能讓圖片變成視頻蝴蜓,還讓人開口說話 | 潮科技
梁風(fēng)?2017-05-22?明星公司
你看到的也未必是真的
都說耳聽為虛仅颇,眼見為實(shí)单默,可是技術(shù)將會顛覆這句話。實(shí)實(shí)在在的視頻擺在那里忘瓦,也可能是一個“假視頻”搁廓。
牛津大學(xué)的研究人員開發(fā)了一種AI系統(tǒng),可以把靜態(tài)的圖片變成動態(tài)的視頻耕皮,甚至可以讓圖片里的人開口說話境蜕。他們使用一個人的圖片和音頻片段,來創(chuàng)建這段視頻凌停。
雖然這個系統(tǒng)目前還比較粗糙粱年,不太真實(shí),可是研究人員表示罚拟,這款軟件很快就能使“假視頻”變得真實(shí)起來台诗。
在這個系統(tǒng)中,研究人員使用圖片識別赐俗,來確認(rèn)人物的面孔拉队。
然后,AI系統(tǒng)操縱靜態(tài)圖片中人的口型阻逮,使其讓真實(shí)人物一樣說話氏仗。
作者在論文中表示,該系統(tǒng)適用于前所未有的面孔和音頻,也就是說皆尔,這些面孔即使沒有作為訓(xùn)練數(shù)據(jù)出現(xiàn)的話,也可以使用這個系統(tǒng)币励,合成”假視頻”的效果慷蠕。
為了實(shí)現(xiàn)這個目標(biāo),他們提出一個編解碼CNN模型(encoder-decoder CNN model)食呻,將人的面孔和音頻聯(lián)合嵌入流炕,來合成人在視頻中可以說話的效果。這個模型經(jīng)過了數(shù)萬小時的未標(biāo)記視頻的訓(xùn)練仅胞。
牛津大學(xué)研究生Joon Son Chung是兼該系統(tǒng)的創(chuàng)造者之一每辟。Joon Son Chung表示,他們正在考慮將視頻分制成多種語言干旧。
他希望渠欺,最后能將新聞視頻自動翻譯成不同語言的版本,并且口型也能同步對應(yīng)椎眯。這樣一來挠将,對于國際化的新聞平臺,新聞輸出的效率就會大大提高编整,并且會削減翻譯的成本舔稀。
在此之前,其實(shí)已有不少可以把圖片轉(zhuǎn)變成視頻的系統(tǒng)掌测。
不過内贮,這些系統(tǒng)需要大量的視頻積累才能正常運(yùn)行,它們會自動匹配人體發(fā)聲時的口型汞斧,然后再將這些口型重新組合成新視頻夜郁。
Joon Son Chung介紹說,這對于那些知名人士來說断箫,比如說英國前首相戴維?卡梅倫拂酣,利用他的圖片構(gòu)建視頻,將會很容易仲义,但是對沒什么名氣的普通人來說婶熬,這項(xiàng)工作將變得非常困難,因?yàn)闆]有太多的圖像資料可以從中獲取埃撵。
此外赵颅,Chung還認(rèn)為,他開發(fā)的系統(tǒng)對配音動畫來說暂刘,也非常有效饺谬。
另一人工智能專家Alex Champandard表示,雖然這些系統(tǒng)目前專注于改變口型,但在未來將可以改變面部表情和姿勢募寨。他還表示族展,人們很快將無法分清哪些視頻是偽造的,哪些是真實(shí)的拔鹰。
Champandard是Creative AI的聯(lián)合創(chuàng)始人仪缸,這個網(wǎng)站為藝術(shù)家提供人工智能的工具。
假以時日列肢,人工智能專家們將會造出足以以假亂真的視頻恰画。
這對于執(zhí)法人員來說,可并不是什么好消息瓷马,這相當(dāng)于添加了新的干擾因素拴还。這項(xiàng)技術(shù)的發(fā)展可能會導(dǎo)致一些案件中的視頻,不足以成為可靠的判案證據(jù)欧聘。法院將不得不更多地依賴司法鑒定片林、科學(xué)證據(jù)和證人證詞。
另外树瞭,由于人工智能工具讓這個過程變得快速拇厢、簡單,制作的門檻也就大大降低了晒喷,最后任何人都可以作出這樣的視頻孝偎。
這樣一來,假視頻會不會泛濫成災(zāi)呢凉敲?就像今天的P圖一樣衣盾,無處不在。
沒有尋找到這個軟件地址阿