技術(shù)
導(dǎo)讀:實(shí)現(xiàn)這一這款名叫ZAO的場(chǎng)景化換臉軟件,并且迅速在一夜之間,攀升至app免費(fèi)娛樂(lè)榜榜單第2名,超越了愛(ài)奇藝等視頻軟件。#Zao AI 換臉# 話題甚至一度快速登上微博熱搜榜第7位。
ZAO一夜之間就火了。
前晚,文摘菌的朋友圈被各種經(jīng)典影視劇的片段刷屏,有意思的是,這些視頻的男女主角都被換上了朋友們的“臉”。
比如,和自己的女裝大佬版演對(duì)角戲??
或者,給自己換一個(gè)吳彥祖或者金城武的身體??
實(shí)現(xiàn)這一這款名叫ZAO的場(chǎng)景化換臉軟件,并且迅速在一夜之間,攀升至app免費(fèi)娛樂(lè)榜榜單第2名,超越了愛(ài)奇藝等視頻軟件。#Zao AI 換臉# 話題甚至一度快速登上微博熱搜榜第7位。
文摘菌也和朋友們迅速去試用了一下,你可以在“ZAO”上選定想要換臉的視頻或表情包,上傳自拍或本地圖片,即可一鍵完成“換臉”。方便快捷,而且,如果照片足夠清晰的話,效果還不錯(cuò)。
整個(gè)使用過(guò)程中,文摘菌發(fā)現(xiàn)了幾個(gè)有意思的點(diǎn):
首先,如果你授權(quán)了app訪問(wèn)你的照片庫(kù),那么其會(huì)非常迅速的查找你的所有照片,并自動(dòng)找到其中清晰度合適的頭像定位。
此外,一張清晰度過(guò)關(guān)的照片就能合成各類視頻,而且合成速度非???,即使是在使用高峰期,也基本不超過(guò)10秒鐘!
創(chuàng)建這家app的公司是大家早已熟知的陌陌。不過(guò)據(jù)新浪報(bào)道,ZAO官方表示的精髓在于加好友,其定位主要在于社交而不僅僅是換臉工具。
其實(shí)早在今年四月份,類似的AI換臉就曾經(jīng)風(fēng)靡海外。今年4月份,一款可幫助用戶變臉、變性的應(yīng)用Facetify火遍全球,這款app實(shí)際上也是主打換臉,稱能讓用戶看到“30年后的自己”。
這樣的技術(shù)和場(chǎng)景看似新鮮,但熟悉文摘菌的讀者一定都知道,其背后的“換臉”技術(shù)已經(jīng)火了一段時(shí)間了。雖然ZAO沒(méi)有直接表示其技術(shù)來(lái)自deepfake,但二者有極大的相似性。
爆火的同時(shí),這款app也將deepfake技術(shù),以及其面臨的法律和道德窘境,更進(jìn)一步的帶到了國(guó)內(nèi)公眾面前。
新瓶老酒:換臉背后的技術(shù)支撐——Deep fakes
換臉技術(shù)如此成熟,離不開(kāi)一個(gè)名為Deep fakes的軟件被匿名開(kāi)源發(fā)布。它本質(zhì)上是一種使用AI深度學(xué)習(xí),能夠?qū)⒁粡垐D片中人的臉換到其他人的圖片上的技術(shù)。通過(guò)這種技術(shù),我們可以創(chuàng)建一個(gè)非常逼真的“假”視頻或圖片,“換臉”因此得名。
這項(xiàng)技術(shù)對(duì)硬件和視頻、換臉人圖片的質(zhì)量甚至是數(shù)量要求極高,在硬件方面,盡量1060往上,內(nèi)存至少8g,這只是標(biāo)配,當(dāng)然低于這個(gè)配置也能運(yùn)行,但是效果怎么樣就不好說(shuō)了。而且在標(biāo)準(zhǔn)配置下,圖片訓(xùn)練時(shí)間至少為6小時(shí)。
其實(shí)說(shuō),視頻在此技術(shù)用也是被拆分為圖片了,所以它和換臉人的圖片要求基本一樣,視頻要清晰,但是也不用過(guò)分清晰,視頻中要只出現(xiàn)被換臉人的一個(gè)人的臉,如果有其他人的臉,需要把它去掉。
有了數(shù)據(jù)和質(zhì)量的要求,如果你想自己訓(xùn)練一個(gè)AI換臉模型需要3個(gè)步驟:一是提取數(shù)據(jù),二是訓(xùn)練,三是轉(zhuǎn)換。其中第一和第三步都需要用到數(shù)據(jù)預(yù)處理,另外第三步還用到了圖片融合技術(shù)。所以主要包含的內(nèi)容有:圖像預(yù)處理、網(wǎng)絡(luò)模型、圖像融合。
具體原理思路為:對(duì)于每張臉,都訓(xùn)練一套編碼器和相應(yīng)的解碼神經(jīng)網(wǎng)絡(luò)。編碼時(shí),使用的是第一個(gè)人的圖片。而解碼時(shí),卻是使用第二個(gè)人解碼器。
也就是說(shuō),既然我們想要將兩張臉互換,那么我們可以設(shè)計(jì)兩個(gè)不同的解碼網(wǎng)絡(luò),也就是使用一個(gè)編碼網(wǎng)絡(luò)去學(xué)習(xí)兩張不同人臉的共同特征,而使用兩個(gè)解碼器去分別生成他們。
如上圖,也就是設(shè)計(jì)一個(gè)輸入端或者說(shuō)一個(gè)編碼器,分別輸入兩個(gè)不同的臉,然后兩個(gè)輸出端或者說(shuō)兩個(gè)解碼器,這樣我們就可以通過(guò)隱含層來(lái)分別生成兩張不同的人臉了。
對(duì)于訓(xùn)練部分,在這個(gè)網(wǎng)站中,其用復(fù)仇者聯(lián)盟里面的明星來(lái)做訓(xùn)練很容易,畢竟有大量的網(wǎng)絡(luò)公開(kāi)圖片視頻。
圖片不足時(shí),還可以從現(xiàn)有視頻中提取。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練并學(xué)習(xí)了關(guān)于每個(gè)人面部的特征之后,它自己就能預(yù)測(cè)想出這個(gè)人還沒(méi)擺出來(lái)的姿勢(shì)。
比如,訓(xùn)練生成John Oliver。
在此技術(shù)出現(xiàn)之前,人們想換個(gè)臉只能依賴手動(dòng)PS。這就要花費(fèi)很多人工和時(shí)間,而且想在視頻里換個(gè)臉更難,每一幀都得換。
但自從這個(gè)叫做“deep fakes”的軟件被匿名開(kāi)源發(fā)布,一切都不一樣了。
類似的換臉軟件還有一款叫做DeepFaceLab
在Github上有開(kāi)源??
鏈接:https://github.com/iperov/DeepFaceLab
DeepFaceLab是一種利用機(jī)器學(xué)習(xí)來(lái)替換視頻中的面部的工具,通過(guò)運(yùn)行腳本可以直接使用。收集原圖像和替換圖像的大量視頻和圖片素材,將素材剪輯成為段視頻,替換data_src.mp4和data_dst.mp4,然后使用一些腳本修改其中的參數(shù),可以得到訓(xùn)練之后的模型,最后會(huì)將換臉后的圖片合成視頻。
在法律邊緣試探:換臉技術(shù)的一系列版權(quán)+用戶隱私問(wèn)題
deepfake大火之后就曾帶來(lái)侵犯隱私等一系列法律問(wèn)題。
更遭受爭(zhēng)議的deepfake例子例如最近走紅網(wǎng)絡(luò)的一鍵生成裸照軟件DeepNude,只要輸入一張完整的女性圖片就可自動(dòng)生成相應(yīng)的裸照,由于廣泛傳播而造成了預(yù)料之外的后果,開(kāi)發(fā)者最終將APP下架。
被一鍵脫衣的霉霉
這幾個(gè)例子背后都用到了深度偽造技術(shù),即一種利用AI程序和深度學(xué)習(xí)算法實(shí)現(xiàn)視、音頻模擬和偽造的技術(shù),投入深度學(xué)習(xí)的內(nèi)容庫(kù)越大,合成的視音頻真實(shí)性越高,甚至可以達(dá)到以假亂真的程度。
更值得一提的是,深度偽造技術(shù)目前已經(jīng)不僅能實(shí)現(xiàn)換臉(face swap),更可以通過(guò)深度學(xué)習(xí)模擬真人聲音、創(chuàng)造出現(xiàn)實(shí)不存在的人物肖像。利用該技術(shù),可以以視頻這一較為可信的方式讓某人說(shuō)不曾說(shuō)過(guò)的話,做不曾做的事,達(dá)到混淆觀眾的目的。具備極高欺騙性的深度偽造也引發(fā)諸多爭(zhēng)議,例如楊冪換臉,AI軟件自動(dòng)生成裸照,奧巴馬、普京等政治人物的深度偽造視頻等等,給個(gè)人和社會(huì)帶來(lái)風(fēng)險(xiǎn)挑戰(zhàn)。
前段時(shí)間,美國(guó)眾議院議長(zhǎng)Nancy Pelosi的一段深度偽造的談話視頻出現(xiàn)在社交媒體上,這段視頻經(jīng)由特朗普總統(tǒng)分享,在Facebook上獲得了超過(guò)250萬(wàn)次的瀏覽量。早些的時(shí)候,美國(guó)前總統(tǒng)奧巴馬的臉被“借用”來(lái)攻擊特朗普總統(tǒng),該視頻在網(wǎng)站上也獲得480萬(wàn)的瀏覽量。特朗普總統(tǒng)本人也難逃一劫,西雅圖電視網(wǎng)曾播放過(guò)一段深度偽造的特朗普演講視頻,視頻中特朗普總統(tǒng)滿臉通紅,還不時(shí)做一些滑稽的表情。由于深度偽造技術(shù)可以運(yùn)用在包括總統(tǒng)在內(nèi)的任何官員身上,美國(guó)兩黨開(kāi)始擔(dān)心該技術(shù)將成為針對(duì)美國(guó)和其他西方國(guó)家發(fā)起虛假信息戰(zhàn)爭(zhēng)的最新武器。
2019年6月13日,美國(guó)眾議院情報(bào)委員會(huì)召開(kāi)關(guān)于人工智能深度偽造的聽(tīng)證會(huì),公開(kāi)談?wù)摿松疃葌卧旒夹g(shù)對(duì)國(guó)家、社會(huì)和個(gè)人的風(fēng)險(xiǎn)及防范和應(yīng)對(duì)措施。
和deepfake一樣,ZAO的大火也讓更多中國(guó)公眾了解了這一“偽造”技術(shù),是否會(huì)因此而引發(fā)相應(yīng)問(wèn)題,我們還不得而知。
但更重要的是,ZAO作為一款帶有視頻編輯功能的軟件,其還需要面臨兩個(gè)方面的法律問(wèn)題,視頻素材的版權(quán)問(wèn)題和用戶的隱私問(wèn)題。
ZAO APP的官方版權(quán)說(shuō)明表示:ZAO產(chǎn)品上存在的短視頻和表情等素材,除了特別聲明是ZAO跟合作方進(jìn)行版權(quán)合作的之外,均來(lái)源于ZAO用戶自發(fā)的上傳,ZAO不享有素材的商業(yè)版權(quán)。
ZAO上面有很多網(wǎng)友們“喜聞樂(lè)見(jiàn)”的視頻素材,用戶可以上傳一張照片就將這些素材里面的人物換成自己或者其他人的臉,這些應(yīng)該就是ZAO所說(shuō)的官方版權(quán)合作。
但是當(dāng)文摘菌隨便點(diǎn)進(jìn)去一個(gè)《武林外傳》的視頻,點(diǎn)擊視頻右下角有個(gè)版權(quán)說(shuō)明的按鈕時(shí),顯示是“404 not found”。
另外是用戶上傳的視頻素材,按照Z(yǔ)AO官方聲明的說(shuō)法,版權(quán)是屬于上傳者的,ZAO不享有素材的商業(yè)版權(quán),但是在注冊(cè)APP時(shí)需要同意的“用戶協(xié)議”中,用戶對(duì)于自己上傳的視頻擁有所有權(quán),同時(shí)也承擔(dān)責(zé)任,但是ZAO以及其用戶在全球范圍內(nèi)享有完全免費(fèi)、不可撤銷、永久、可轉(zhuǎn)載授權(quán)和可再生的權(quán)利,也就是說(shuō):用戶上傳的視頻素材版權(quán)歸用戶所有,但是其他任何人都可以進(jìn)行修改和編輯,然后再進(jìn)行傳播。
這引發(fā)了一眾網(wǎng)友的擔(dān)心,這會(huì)不會(huì)產(chǎn)生新的網(wǎng)絡(luò)詐騙手段?
圖片來(lái)源:知乎
而在用戶隱私方面,ZAO有一個(gè)單獨(dú)的隱私協(xié)議,這個(gè)隱私協(xié)議和其他APP的協(xié)議并沒(méi)有太多差別,包括采集一些瀏覽信息、設(shè)備信息、位置信息來(lái)進(jìn)行用戶畫(huà)像和推送。
但是由于ZAO主打的是視頻換臉這樣的功能,隱私保護(hù)除了考慮用戶數(shù)據(jù)的泄露,還應(yīng)該考慮到用戶的照片、聲紋等信息是否會(huì)被不法利用,畢竟這是一個(gè)支付寶能刷臉支付的時(shí)代。
圖片來(lái)源:知乎
其實(shí),我國(guó)的有關(guān)部門也充分注意到了這一點(diǎn),日前,全國(guó)人大常委會(huì)審議的《民法典人格權(quán)編(草案)》里,正式加了一條:任何組織和個(gè)人不得以利用信息技術(shù)手段偽造的方式侵害他人的肖像權(quán)。
而草案的第八百零三條也被修改為:其他人格權(quán)的許可使用和自然人聲音的保護(hù),參照適用本章的有關(guān)規(guī)定。
如果草案通過(guò)了正式的立法流程審核,民法典正式頒布施行,如果你不經(jīng)過(guò)別人的同意,隨便的把明星或者其他公眾的肖像進(jìn)行處理,妥妥的,你違法了。另外,不僅是臉,根據(jù)草案的第八百零三條,聲音也是不能隨便換的!
如果情節(jié)嚴(yán)重的還可能觸犯刑法,例如《刑法》第246條:“以暴力或者其他方法公然侮辱他人或者捏造事實(shí)誹謗他人,情節(jié)嚴(yán)重的,處以三年以下有期徒刑、拘役、管制或者剝奪政治權(quán)利?!?/p>
也就是說(shuō),如果用DeepFakes、鬼畜等各種方式處理別人的臉,還沒(méi)經(jīng)過(guò)別人同意。很有可能觸及到“惡意誹謗”、“惡意剪輯”、“侵犯名譽(yù)權(quán)”等刑法管轄范圍。
這樣看來(lái),也就能理解為什么ZAO會(huì)對(duì)用戶協(xié)議規(guī)定的如此復(fù)雜了。
最后,文摘菌還是想提醒大家:圖片千萬(wàn)張,謹(jǐn)慎最保險(xiǎn),換臉一時(shí)爽, 親人兩行淚。