#359
2019 / 公開文章 / 文章 / 評析

一個人喜歡偽裝,一群人需要真實

閱讀時間 9 分鐘

人們喜歡展現自己最美麗的樣子,因此整形、濾鏡與修圖等科技層出不窮。現在更進一步,可以製作自己的數位替身(digital avatar),在死後還能用生前的容貌說話。例如 78 歲的 Andrew Kaplan 就決定留下替身(華盛頓郵報):

Andrew Kaplan 回顧豐富的一生,相當於別人的數輩子: 20 歲時走遍全球報導新聞,效命以色列軍隊參與第三次中東戰爭,成功的創業家,以及成為許多間諜小說與好萊塢電影的編劇。

現在 78 歲的他白髮蒼蒼,與結縭 39 年的妻子在棕梠泉外的郊區綠洲退休 — 他希望在離開之後,他所愛的人也能聽到這些故事。於是 Kaplan 同意成為 AndyBot,一個虛擬身份,可在雲端上存活數百,甚至數千年之久。

若一切順利,他的下一代將可用手機或語音運算平台如 Alexa 來跟他說話,問他問題,甚至是向他尋求諮詢,即便他的肉身已經消逝。

這其實也是一種深偽(deepfake)。只是此處不是用來傷害他人,而是用來撫慰傷痛。我刻意用此破題,是為了說明這種科技可以為善,也可以為惡。

然而大部分新聞談的都是深偽的邪惡。例如上一週就有兩則新聞。首先是駭客用偽造的聲音詐騙成功(科技新報):

. . . . 有騙子透過 AI 合成的語音,冒充一家英國能源公司德國母公司的 CEO ,成功詐騙該公司員工進行大額轉帳,成功騙走了 22 萬歐元(近台幣 770 萬元)。

. . . . 據稱這家英國能源公司的 CEO 接到自稱是德國母公司 CEO 的電話,要求他將一筆 22 萬歐元資金轉帳給一個匈牙利供應商,十萬火急,必須在一個小時之內完成。

這位英國 CEO 一開始並沒有意識到有什麼問題,他表示對方操著德國口音,語調也跟德國母公司的 CEO 幾乎一樣,因此他不覺得可疑,就把款項轉了過去。

另一則新聞則是中國的 ZAO app。這是一個「換臉」app。用戶只要上傳一張正面照,就能出現在許多知名電影畫面中,號稱「僅需一張照片,出演天下好戲」。

圖:CGTN

ZAO app 引發一陣炫風,登上許多 App Store 的前三名,接著旋即在中國被下架。主要是因為使用者條款中有一條「霸王」條款 — 「您同意或確保肖像權利人同意授予 ZAO 及其關聯公司全球範圍內完全免費、不可撤銷、永久、可轉授權和可再許可的權利。」中國用戶對臉部辨識科技非常敏感,馬上抨擊 ZAO app 過分積極地收集臉部資料。

從上述新聞可知,「偽造真實」的技術正在快速進步。過去只有好萊塢能創造的效果,現在一般人也能做到相當水準。其中的關鍵之一是機器學習。

深偽的自動化

「偽造」的歷史淵遠流長,從古代的偽造傳位詔書到現代的 Photoshop 都是。然而過去的偽造是一門手工藝,需要一個像素一個像素地調整。偽造者也必須有相當的美學素養。

深偽的特色是更加地自動化。深偽是機器學習的一種應用,由電腦負責辨識要偽造的特徵(pattern)。以「換臉」為例,使用者先「餵」給模型許多範例(sample),利如美國總統川普的照片、影片。由模型去辨識其中的特徵,許多是人類不會注意到或是無法描述的。例如「眉毛到眼睛的距離」、「皺紋的相對長度」、「呼吸時鼻孔的擴張面積」等等。模型會建立川普臉孔「地圖」。

接著針對目標影片,再次由電腦擷取臉孔「地圖」。最後把川普的臉孔地圖「對應」到目標的臉孔地圖,就完成換臉。模擬聲音的做法也類似。

重點是機器學習降低了門檻,能自動化地運行,使得一般人都能使用。再加上社群網路也降低了資訊傳遞的門檻,就成為了可怕的力量。萬一在香港示威情緒高漲的時刻,有人偽造香港特首的聲音,命令港警開真槍?或是在台灣總統大選的關鍵時刻,偽造國台辦(或是美國)與候選人的通話錄音?

偽造也會削弱真實的可信度。香港群眾要求港警交出太子地鐵站的 CCTV 錄影;但等到警方終於交出時,誰還能信任影片的真實性?這對港警的信譽同樣是一種傷害。

如果將深偽視為一種武器,目前處於武器不平等的狀態。「壞人」可以用深偽製造動盪,而既有的社會組織招架不住,原有的信任也會分崩離析。直到一系列在科技社會上的結構性改變完成,才會帶來新的平衡。

用科技保護真實

科技將進入軍備競賽:偽造者致力於偽造真實,守護者致力於保護真實。

如果只看內容本身,那麼偽造者將取得最終的勝利。因為圖片、影像等都只是像素,本來就沒有所謂的「真實」。不論守護者發現什麼辨識偽造的方式,偽造者都可以馬上補上。

例如守護者發現「偽造影片中的人比較少眨眼」— 因為範例通常都是睜眼的照片 — 偽造者馬上就用程式來提高眨眼的頻率。雙方的成本也不平等:偽造方只要騙過一般人即可,守護者卻要找出越來越精細的疏失。

當深偽普及,你我都無法無法等待守護者檢驗每一則內容,必須用其他方法建立信任。這包含三個層次:內容的製造、傳遞與擴散。

建立對內容製造的信任

首先要確認內容的製造是真實的。這可能要依賴區塊鏈。例如,未來的相機會把擷取的資料變成一串雜湊值(hash),存在區塊鏈上。這是一個時間戳記(time stamp),紀錄此一照片的最早製作時刻。而資料除了影像本身之外,還包含拍攝當時的情境資料,例如 GPS 座標、氣溫、電信訊號等。未來人們可以憑這些資料檢驗內容的真實性。

建立對遞送的信任

接著要確保內容遞送的通路是安全的。這牽涉到加密、VPN 等技術。臉書前一陣子大力推動訊息加密化,便是理解用戶對通路的要求越來越高。未來的瀏覽器不但會驗證網址的加密認證(如 SSL),也會驗證內容本身的雜湊值。碰到可疑的內容,就會像跳出「404 網頁」警示一般,跳出「圖片真實性可疑」警示。

建立對內容擴散的信任

以上兩步可以確保我們自己收到的內容是真實的。但不可能所有內容都是第一手資訊。我們收到的大部分訊息是由他人轉達。因此我們終究必須建立一個資訊的過濾網。

有兩種做法。第一種是不斷地評鑑親朋好友的可信度。而臉書、Twitter 等在這一方面相當領先。它們透過藍勾勾、按讚數等數據,不斷排序用戶的影響力,這其實就是一種評鑑。未來這些數字會更精細。

另一個方法是付費。古代的有錢人會派遣探子到各地搜集資料,回報真實的狀態。由於資料的正確性決定貿易與戰爭的勝敗,因此非常有利可圖。未來我們再次回到虛實難辨的狀態,「付錢買真相」將再次成為主流。

小社會不需要真實

在社會的層次,人們將會重新思考到底「真實」是不是必要。

我在對照 Apple Watch 跟傳統錶時曾經說明,「知道時間」本身沒有價值。我們需要知道時間,是為了跟他人協作(coordination)。當大家都依循標準時間行動,社會就能順暢運轉。而流落在荒島上的魯賓遜不需要跟別人協作,就不需要知道時間。

「真實」也一樣。我們需要真實,是因為需要協作。我們預期他人會跟根據真實狀況行動,因此我們也需要知道真相。當協作的範圍越大 — 從村莊、市鎮、國家到地球 — 共同掌握真實就越重要。魯賓遜也不在乎何謂真實。他只要能解釋他的小世界如何運作即可,就算他相信打雷是天神發怒也無妨。

協作是目標,遵循時間與真實只是手段。因此如果只有一小撮人要協作,就不一定要遵照絕對的時間與真實。深偽就成為創造「屬於自己的真實」的工具。其實現在已經有許多人住在虛擬世界內,或是樂於留在很厚的同溫層之中。只要他們自得其樂,反而能增進社會的多樣性?

例如為了效率,我可以要求科技島讀所有員工改用「48 半小時制」,而不是「24 小時制」。或者我要求所有人在公司都採用武俠小說人物的化名,以激發大家的雄心壯志(這是阿里巴巴的做法)。

如果只有一個人,那就更不需要遵循真實了。暗戀者可以創造自己跟暗戀對象的結婚證書、結婚照,甚至是婚禮影片。後代子孫也可以透過虛擬替身,讓逝去的親人仍能在家中互動。說到底,把劉德華的海報掛牆上,跟用深偽創造一個劉德華的數位替身放在家中並沒什麼差別。

許多人直覺地抨擊深偽,卻忘了自己也曾對著劉德華的海報講話,或是懊惱想不起某個重要時刻的表情細節。我們應該把此一技術分成兩部分看待。在個人的小世界或是一個小群體之中,深偽沒有傷害到別人。它是反映想像力、創造多樣性的工具。

真正的問題在需要協作的時候。深偽的成本降低,使得真實的成本提高,人們將花更多精力確認彼此的共識。科技與社會將連帶改變,人們也必須重新建立信任體系。

推薦閱讀