文 | AI藍(lán)媒匯,作者|陶然 編輯|魏曉
小楊哥事件中曝出來那段“盧文慶錄音”,先是內(nèi)容尺度之大引起輿論嘩然,接著又被查明全部是AI偽造。
一來二去,AI技術(shù)再次被推上了風(fēng)口浪尖。
圖/言域科技官方回復(fù)
先不論技術(shù)好與壞,本質(zhì)上,AI合成錄音可以被理解為一種Deepfake,即利用深度學(xué)習(xí)算法,實(shí)現(xiàn)音視頻的模擬和偽造,也就是通過人工智能技術(shù)中的深度學(xué)習(xí)模型,將人的聲音、面部表情及身體動(dòng)作拼接,合成為非常逼真的虛假內(nèi)容 。
技術(shù)層面來說,它是中性的,類似的方式除了語(yǔ)音模擬,還包括AI換臉、人臉合成、視頻生成等,統(tǒng)稱為深度偽造。
但,中性的技術(shù),架不住使用者圖謀不軌。
藍(lán)媒匯咨詢了國(guó)內(nèi)頭部AI數(shù)字人公司風(fēng)平智能創(chuàng)始人兼CEO林洪祥,對(duì)于這類事件,林洪祥坦言,AI帶來的生產(chǎn)效率提升是全方面的,但在“應(yīng)用”擴(kuò)展起來的中途,違規(guī)事件想要完全隔絕,恐怕需要系統(tǒng)性的規(guī)范并有效執(zhí)行。
依照行業(yè)目前的技術(shù)水平,用戶只需要找?guī)追昼姷牧闵⑺夭淖鳛锳I的學(xué)習(xí)樣本,就能迅速克隆出完整的AI人聲。而錄音中的一些說話的頓挫、情緒語(yǔ)調(diào),完全是可以通過技術(shù)手段去增減、調(diào)整的。
并且,落到實(shí)際應(yīng)用環(huán)節(jié),復(fù)制一套AI人聲的成本“現(xiàn)在已經(jīng)不高了”,市面上的應(yīng)用很多都會(huì)給一些免費(fèi)的入口,以涉事模型為例,Reecho睿聲模型提供了免費(fèi)的聲音克隆服務(wù),更為專業(yè)的版本則另需付費(fèi)。
把從網(wǎng)上截取的一段盧老板直播轉(zhuǎn)成音頻導(dǎo)入,短短幾秒鐘后,盧老板的AI聲音就克隆了出來。
再仿照原事件中情緒和文本都非常離譜的一段錄音,作為腳本導(dǎo)入模型,一段盧文慶銳評(píng)馬斯克的錄音,就做完了。
(本音頻為AI合成,僅供測(cè)試,嚴(yán)禁對(duì)外傳播)
“小馬他倆走了,是吧。我跟你們說,我想讓誰(shuí)火就讓誰(shuí)火,懂嗎。我認(rèn)識(shí)的CEO多了去了,我捧誰(shuí)不是捧。別給我提馬斯克,不好使,知道不,不好使,我們喝酒也是不好使,他是個(gè)啥,沒有三只羊,誰(shuí)來給他賣貨,懂不懂這個(gè)道理。”
坦白講,如果那種AI詐騙電話聽多了,或者對(duì)人聲敏感,其實(shí)還能聽出來AI音頻有種“機(jī)器感”——語(yǔ)調(diào)從始至終都過于穩(wěn)定,人情緒激動(dòng)的時(shí)候絕不會(huì)這樣。但這只是最基礎(chǔ)的普通版模型、瞬時(shí)克隆功能。如果有更充足的語(yǔ)料、選擇專業(yè)克隆功能,效果會(huì)更“真實(shí)”。
那么,AI合成的音視頻,有可能像測(cè)謊儀那樣比較直觀通過數(shù)據(jù)分辨真?zhèn)螁幔?/p>
在技術(shù)層面,是可行的。林洪祥介紹稱,除使用者本人授權(quán)外,現(xiàn)在AI數(shù)字人行業(yè)內(nèi)也確實(shí)有相關(guān)標(biāo)準(zhǔn)正在建設(shè)中,要求各種AI生成的內(nèi)容都加上專門的可識(shí)別“特征標(biāo)記”。
這個(gè)標(biāo)簽,不是簡(jiǎn)單的在角落里加個(gè)“由XX AI生成”水印,以AI合成聲音為例,它會(huì)在人說話聲音的頻段之外,添加額外的噪聲頻段,甚至在可見音的范圍內(nèi),添加一定的特征頻段。
這個(gè)特征頻率可由機(jī)器識(shí)別,如果需要做鑒定,交由設(shè)備抽取這些頻段,理論上即可判定真?zhèn)巍?/p>
但目前,愿意將這項(xiàng)功能普及的企業(yè)并不會(huì)太多,限制因素?zé)o他,主要還是多一道手續(xù)產(chǎn)生的成本——盡管單次使用模型的成本并不高,但每個(gè)音視頻模型預(yù)訓(xùn)練階段的投入,以及階段性產(chǎn)出后開發(fā)下一代音視頻模型所產(chǎn)生的成本,對(duì)于現(xiàn)階段的AI企業(yè)仍有較大壓力。
目前,AI音視頻行業(yè)尚在早期,推廣階段如何獲客的同時(shí)覆蓋成本,是從業(yè)者繞不開的話題。
但上述這些,顯然都不是圖謀不軌的不法分子會(huì)考慮的事,煙花還是炸彈關(guān)鍵看火藥怎么用。
半年多前,香港警方披露了一起涉案金額高達(dá)2億港元的詐騙案。案件中,某跨國(guó)公司香港分部的職員接到總部CFO通知,稱總部正在計(jì)劃一個(gè)“秘密交易”,需要將公司資金轉(zhuǎn)到幾個(gè)香港本地的賬戶中待用。
而后,員工受邀參加總部發(fā)起的“多人視頻會(huì)議”,并按照會(huì)議要求先后將2億港元分別轉(zhuǎn)賬15次,分別轉(zhuǎn)到了5個(gè)銀行賬戶內(nèi)。
圖源/央視新聞
實(shí)際上,這場(chǎng)多人視頻會(huì)議,除了該分部職員外,其他“人”都是詐騙分子利用公開音視頻切片合成的AI形象,再用視頻電話會(huì)議的形式換臉換聲音,詐騙團(tuán)隊(duì)直接變成高管團(tuán)隊(duì)發(fā)號(hào)施令。
香港案件中,不法分子是相當(dāng)于是用AI換臉+AI變聲器真人出鏡,而小楊哥這次的AI偽造錄音,則是完全由大模型學(xué)習(xí)三只羊公司盧文慶相關(guān)音頻素材后,合成語(yǔ)調(diào)、情緒都趨近于真人的整段音頻。流程,就是這么簡(jiǎn)單——AI合成音視頻,已經(jīng)是一項(xiàng)成熟的技術(shù),相關(guān)產(chǎn)品,也已發(fā)展成為完整產(chǎn)業(yè)。
但,AI合成音視頻的主流,絕非造假。流浪地球第二部的劇情內(nèi),劉德華飾演的圖恒宇以數(shù)字生命的形式復(fù)活了丫丫,而在劇情外,已故的知名影星吳孟達(dá),也在借由 AI 現(xiàn)身銀幕。
所以,以后如果再出類似小楊哥錄音事件,討論技術(shù)有罪還是無罪之前,還是盡量先把人控制住。
管管人性,救救AI。