2月8日,在北京冬奧會(huì )自由式滑雪女子大跳臺決賽中,中國選手谷愛(ài)凌憑借最后一跳的出色發(fā)揮逆轉奪冠,AI合成主播“小聰”用手語(yǔ)解說(shuō)了這個(gè)激動(dòng)人心的奪冠時(shí)刻。作為全球首個(gè)手語(yǔ)AI合成主播,“小聰”利用深度合成技術(shù),為聽(tīng)障人士獲取信息帶來(lái)極大便利。
作為人工智能領(lǐng)域的新應用,深度合成技術(shù)以深度學(xué)習、虛擬現實(shí)為代表的生成合成類(lèi)算法制作文本、圖像、音頻、視頻,因較強娛樂(lè )性在社交媒體平臺廣受關(guān)注。相關(guān)研究顯示,在國內外主流音視頻網(wǎng)站、社交媒體平臺上,2021年新發(fā)布的深度合成視頻數量較2017年增長(cháng)10倍以上。
但大規模普及也導致濫用案例頻出。不久前,國家網(wǎng)信辦公布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規定(征求意見(jiàn)稿)》,對深度合成內容的用途、標記、使用范圍以及濫用處罰作出具體規定。業(yè)內認為,管理新規的即將出臺,意味著(zhù)深度合成將迎來(lái)規范化發(fā)展關(guān)鍵期。
應用豐富 帶動(dòng)產(chǎn)業(yè)快速發(fā)展
清華大學(xué)人工智能研究院、國家工業(yè)信息安全發(fā)展研究中心等日前聯(lián)合發(fā)布的《深度合成十大趨勢報告(2022)》指出,2017年以來(lái),深度合成內容被大量創(chuàng )作和傳播,數量逐年高速增長(cháng)。
技術(shù)不斷成熟是深度合成內容快速增長(cháng)的重要原因。自2017年開(kāi)始,深度合成領(lǐng)域新發(fā)表論文數量和開(kāi)源項目均以每年30%的速度增長(cháng)?!把芯空撐某掷m增多,開(kāi)源技術(shù)工具、大量代表性方法集中涌現,使得深度合成內容的效果更加逼真、制作更加高效?!北本┤鹑R智慧科技有限公司CEO田天告訴記者,縱觀(guān)計算機行業(yè)發(fā)展,開(kāi)源項目已成為推動(dòng)產(chǎn)業(yè)進(jìn)步的強大力量,深度合成在開(kāi)源社區中備受青睞,將繼續推動(dòng)該技術(shù)在產(chǎn)業(yè)中落地。
通過(guò)升級傳統內容制作方法,深度合成在影視制作、廣告營(yíng)銷(xiāo)、社交娛樂(lè )等領(lǐng)域應用不斷豐富,包括AI合成主播、虛擬偶像、修復歷史老照片等。2021年,虛擬偶像洛天依登上央視春晚,2022年,已經(jīng)“出道”10年的她再次現身元宵晚會(huì )舞臺。公開(kāi)數據顯示,2020年6月至2021年5月,共有32412位虛擬主播在嗶哩嗶哩開(kāi)播,同比增長(cháng)40%。
與此同時(shí),越來(lái)越多的企業(yè)機構開(kāi)始利用深度合成技術(shù)提供面向公眾的產(chǎn)品和服務(wù),涵蓋圖像、視頻、音頻、文本等多個(gè)領(lǐng)域。語(yǔ)音合成已經(jīng)成為人機交互的重要一環(huán),被應用于智能客服、語(yǔ)音導航、有聲讀物、語(yǔ)音助手等場(chǎng)景,多家企業(yè)機構已發(fā)布基于深度神經(jīng)網(wǎng)絡(luò )技術(shù)合成音頻的商用開(kāi)放平臺,而以文本為形式的深度合成在新聞報道、詩(shī)文創(chuàng )作、聊天問(wèn)答等方面顯現出巨大的創(chuàng )作效率和潛力。
此外,“元宇宙”等新商業(yè)思維的提出也為深度合成提供更廣闊的應用場(chǎng)景?!吧疃群铣蓪⒅匦露x虛擬數字化空間,從傳播社會(huì )學(xué)意義上看,一個(gè)新的人類(lèi)生存場(chǎng)景將以深度合成技術(shù)為基石展開(kāi)?!鼻迦A大學(xué)新聞與傳播學(xué)院常務(wù)副院長(cháng)陳昌鳳說(shuō)。
風(fēng)險加劇 檢測技術(shù)持續更新
深度合成激發(fā)新形式內容創(chuàng )造的同時(shí),也帶來(lái)新威脅、新挑戰?!渡疃群铣墒筅厔輬蟾妫?022)》分析認為,深度偽造影響新聞對真相的記錄,對虛假內容高難度甄別也降低了事實(shí)核查的有效性。在社會(huì )重大突發(fā)事件上,深度合成技術(shù)可能被用于操作輿論意見(jiàn),借助社交媒體,使虛假信息短時(shí)間內發(fā)酵。
隨著(zhù)負面風(fēng)險日益加劇,以及合成質(zhì)量不斷提升,基于生物特征的傳統鑒別方式越來(lái)越難以發(fā)揮作用?!澳壳皩ι疃群铣蓛热莸淖詣?dòng)化鑒別主要依靠人工智能技術(shù)完成?!闭憬髮W(xué)網(wǎng)絡(luò )空間安全學(xué)院院長(cháng)任奎介紹,訓練人工智能模型需要大量真實(shí)和偽造數據,人臉和音頻數據都是高度敏感的個(gè)人信息,難以獲取,而偽造數據也包含各種不同方法合成的數據,這都給構建自動(dòng)化檢測能力帶來(lái)不小挑戰。
新型偽造方法的層出不窮,加上檢測算法存在結構性缺陷,反深度偽造檢測技術(shù)面臨“強對抗性”。田天解釋說(shuō),這類(lèi)似于“貓鼠游戲”,深度合成和檢測在不斷學(xué)習攻防過(guò)程中會(huì )自我進(jìn)化,規避上一代對抗技術(shù),因此檢測技術(shù)需要持續更新與迭代優(yōu)化。
目前學(xué)術(shù)界和產(chǎn)業(yè)界均已對反深偽檢測投入了大量研究,谷歌、微軟等機構均推出深度合成視頻認證的方法或產(chǎn)品。在國內,瑞萊智慧推出的深度偽造內容檢測平臺DeepReal,擁有工業(yè)級的檢測性能和應對實(shí)網(wǎng)環(huán)境對抗變化的檢測能力?!吧疃葌卧鞕z測面臨持續的攻防和博弈,未來(lái)還需融合多模態(tài)內容的取證分析、基于數字水印的溯源技術(shù)等多方面能力,實(shí)現精準識別?!鼻迦A大學(xué)人工智能研究院基礎理論研究中心主任朱軍說(shuō)。
構建多維度治理機制
近年來(lái),針對深度合成技術(shù)惡意使用所帶來(lái)的問(wèn)題,世界各國紛紛出臺管理法律法規,探索深度合成的治理路徑。歐盟將深度合成納入《通用數據保護條例(GDPR)》等現有法律框架規制,德國、新加坡、英國、韓國等國家,均有適用于深度合成技術(shù)相關(guān)犯罪案件審理的法律法規。
我國正積極探尋建設有效治理機制。自2019年11月起,先后出臺的《網(wǎng)絡(luò )音視頻信息服務(wù)管理規定》《網(wǎng)絡(luò )信息內容生態(tài)治理規定》《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規定》等文件,均對生成合成類(lèi)內容提出不同程度的監管要求。
中國工程院院士鄔賀銓認為,治理深度合成不能搞“一刀切”,要持續發(fā)展技術(shù),避免阻礙其正向應用與創(chuàng )新。其衍生出的安全問(wèn)題需從源頭解決,引導人工智能學(xué)術(shù)界、產(chǎn)業(yè)界不斷加強技術(shù)研發(fā),并擴展深度合成溯源、深度合成鑒定等方面的研究,防范倫理安全風(fēng)險和合規風(fēng)險。
引導深度合成技術(shù)良性發(fā)展,需探索多維度治理機制。中國社科院哲學(xué)所科技哲學(xué)研究室主任段偉文建議,加強對深度合成的技術(shù)、法律和倫理問(wèn)題展開(kāi)系統性前瞻性跨學(xué)科研究,對其可能出現的高風(fēng)險應用場(chǎng)景采取有針對性的治理與監管。
中科院自動(dòng)化所研究員曾毅則倡導產(chǎn)學(xué)研發(fā)展自律自治,他表示,在法律法規未形成體系化之前,產(chǎn)業(yè)界自身應強化理論先行意識,防范濫用、嚴禁惡用。
在對外經(jīng)濟貿易大學(xué)法學(xué)院副教授許可看來(lái),社會(huì )層面應加大宣傳普及力度,強化公民對深度合成等人工智能技術(shù)的認識,提高全社會(huì )防范意識。
田天對此有相同看法,他認為深度偽造的本質(zhì)問(wèn)題是透明度不足,因此提高公眾對深度合成技術(shù)的認知尤為重要,只有將門(mén)檻降低到所有受眾能夠在共同框架下認識、討論、理解這個(gè)問(wèn)題的時(shí)候,深度合成技術(shù)才能健康良性發(fā)展。
業(yè)內專(zhuān)家建議,各方應當落實(shí)好新的規范要求,在此前提下不斷追求技術(shù)突破,開(kāi)拓深度合成技術(shù)應用場(chǎng)景,形成對人工智能產(chǎn)業(yè)的帶動(dòng)效應。
來(lái)源:《經(jīng)濟日報》