數(shù)據(jù)安全,AI難以回避的隱憂
2024-06-24 16:14:43 來源:法人雜志 作者:李韻石

◎文 《法人》雜志全媒體記者 李韻石

近年來,以ChatGPT為代表的生成式人工智能技術(shù),在極大地提升人們工作效率的同時(shí),也帶來了數(shù)據(jù)使用風(fēng)險(xiǎn)數(shù)據(jù)。

《2024人工智能安全報(bào)告》顯示,AI既放大現(xiàn)有網(wǎng)絡(luò)安全威脅,又引入了新型威脅,引發(fā)網(wǎng)絡(luò)安全事件指數(shù)級(jí)增長。其中,2023年基于AI的深度偽造欺詐暴增3000%,基于AI的釣魚郵件數(shù)量增長了1000%。一項(xiàng)對(duì)IT行業(yè)領(lǐng)導(dǎo)者進(jìn)行的關(guān)于ChatGPT等大模型的調(diào)查顯示,安全性是受訪者最關(guān)心的問題。71%的受訪者認(rèn)為,生成式人工智能會(huì)給企業(yè)數(shù)據(jù)安全帶來新的風(fēng)險(xiǎn)。

數(shù)據(jù)越多問題越復(fù)雜

2月15日,OpenAI發(fā)布了60個(gè)由文字生成的視頻,引發(fā)全網(wǎng)震動(dòng),這讓人意識(shí)到通用人工智能的實(shí)現(xiàn)成為可能。

6月6日,國科創(chuàng)新研究院首席科學(xué)家、人工智能研究中心主任龔才春接受《法人》記者采訪時(shí)表示:“生成式人工智能比上一輪的深度學(xué)習(xí)技術(shù)更復(fù)雜,訓(xùn)練數(shù)據(jù)更海量,模型更龐大。因此,生成式人工智能的監(jiān)管難度更大,信息保護(hù)問題更復(fù)雜?!?/p>

東南大學(xué)法學(xué)院講師、法學(xué)博士畢文軒也持類似觀點(diǎn):在生成式人工智能的訓(xùn)練、應(yīng)用和模型優(yōu)化過程中,所投放的數(shù)據(jù)中,可能包含了公民個(gè)人信息或隱私。如果不對(duì)其加以必要處理,可能產(chǎn)生大模型對(duì)公民個(gè)人信息的誤用或?yàn)E用,侵犯個(gè)人隱私權(quán)益。

畢文軒認(rèn)為,大模型訓(xùn)練數(shù)據(jù)給公民隱私帶來的風(fēng)險(xiǎn),既可能產(chǎn)生于數(shù)據(jù)層面的不當(dāng)使用,也可能產(chǎn)生于大模型自身層面的不當(dāng)處理。在數(shù)據(jù)層面,除了訓(xùn)練數(shù)據(jù)來源包含了大量未經(jīng)脫敏或處理的個(gè)人信息外,還存在模型開發(fā)者故意購買使用包含他人隱私的數(shù)據(jù)并投入訓(xùn)練的情形。這種惡意濫用行為,會(huì)導(dǎo)致生成式人工智能將公民個(gè)人隱私的侵害后果和影響范圍,進(jìn)一步擴(kuò)大。

據(jù)公開報(bào)道,2023年3月25日,OpenAI向用戶和整個(gè)ChatGPT社區(qū)致歉,表示部分ChatGPTPlus的用戶數(shù)據(jù)可能被泄露,其中包括了用戶聊天記錄的片段以及用戶信用卡的最后四位數(shù)字、到期日期、姓名、電子郵件地址和付款地址等信息。

防范信息泄露難度大

“進(jìn)入大模型時(shí)代后,生成式人工智能井噴式發(fā)展。用大模型技術(shù)生成的許多圖片、文本、視頻越來越強(qiáng)大,幾乎符合物理世界的所有規(guī)律,人眼難以識(shí)別真假,大模型技術(shù)也很難識(shí)別真?zhèn)?。”龔才春表示,生成式人工智能需要海量?shù)據(jù)進(jìn)行訓(xùn)練,但剔除海量數(shù)據(jù)的隱私信息是一個(gè)巨大的技術(shù)難題。然而,隨著大模型的迅猛發(fā)展,隱私識(shí)別技術(shù)卻沒有得到太多關(guān)注。

龔才春說,許多文本單獨(dú)來看,沒有隱私信息,不需要額外保護(hù)。但是,如果將若干個(gè)文本收集起來,進(jìn)行分析和處理,就會(huì)產(chǎn)生隱私泄露的風(fēng)險(xiǎn)。谷歌的搜索日志是一個(gè)典型案例,其本身不包含任何隱私信息,但經(jīng)過大數(shù)據(jù)挖掘,許多隱私信息就會(huì)暴露出來。

此外,對(duì)隱私的界定,業(yè)內(nèi)沒有形成統(tǒng)一標(biāo)準(zhǔn)。不同的人,由于不同社會(huì)地位、不同行業(yè)、不同職業(yè)、不同地域等原因,對(duì)隱私的界定差異很大。例如,技術(shù)開發(fā)人員認(rèn)為手機(jī)號(hào)碼、郵箱是極度隱私信息,而銷售人員又希望全世界都保存其手機(jī)號(hào)碼和郵箱等個(gè)人信息。

《法治日?qǐng)?bào)》律師專家?guī)斐蓡T、北京市京都律師事務(wù)所高級(jí)合伙人王菲認(rèn)為,生成式人工智能基于復(fù)雜的算法生成內(nèi)容,但無論算法多么符合主流價(jià)值、設(shè)計(jì)精密,如若供其學(xué)習(xí)的訓(xùn)練數(shù)據(jù)本身質(zhì)量難以評(píng)估驗(yàn)證,生成式人工智能無異于空中樓閣。

對(duì)于未來中國人工智能發(fā)展,龔才春建議,組建國家級(jí)人工智能研究院,統(tǒng)籌人工智能的前沿動(dòng)態(tài)、產(chǎn)業(yè)發(fā)展、政策建議、倫理道德、技術(shù)測評(píng)、人才培養(yǎng)體系等方面的研究與實(shí)施;應(yīng)加強(qiáng)人工智能倫理道德的研究,為未來的通用人工智能和超級(jí)人工智能的倫理問題提前布局;組織全國性人工智能的公開測評(píng)和比賽活動(dòng),開發(fā)公開的評(píng)測數(shù)據(jù)集與評(píng)測標(biāo)準(zhǔn),促進(jìn)人工智能的交流和合作,加強(qiáng)大模型的理論研究和產(chǎn)業(yè)落地研究,孵化相關(guān)大模型企業(yè)及生態(tài),建設(shè)若干個(gè)國家級(jí)通用人工智能產(chǎn)業(yè)園。

同時(shí),龔才春還建議,加強(qiáng)通用人工智能的核心技術(shù)攻關(guān),設(shè)立通用人工智能的重大研發(fā)計(jì)劃,加強(qiáng)大模型的理論研究,包括預(yù)訓(xùn)練技術(shù)、指令微調(diào)技術(shù)、人類對(duì)齊技術(shù)、多模態(tài)等,加強(qiáng)文生文、文生圖、文生視頻、文生模型等的應(yīng)用研究與開發(fā),加強(qiáng)生成式人工智能的內(nèi)容安全監(jiān)測。

全球AI立法進(jìn)程加快

5月21日,歐盟理事會(huì)正式批準(zhǔn)的《人工智能法案》(下稱《法案》),成為世界上首部對(duì)人工智能進(jìn)行全面監(jiān)管的法案?!斗ò浮吠ㄟ^后,歐盟就宣布成立人工智能辦公室,依法對(duì)人工智能發(fā)展進(jìn)行監(jiān)管。

比利時(shí)數(shù)字化、行政簡化、隱私保護(hù)和建筑法規(guī)國務(wù)秘書Mathieu Michel公開表示:“ 《法案》的通過是歐盟的一個(gè)重要里程碑。這部具有里程碑意義的法律是世界上第一部此類法律,它解決了一個(gè)全球性的技術(shù)挑戰(zhàn),同時(shí)也為我們的社會(huì)和經(jīng)濟(jì)創(chuàng)造了機(jī)遇。通過《法案》,歐洲強(qiáng)調(diào)了在處理新技術(shù)時(shí)信任、透明和問責(zé)的重要性,同時(shí)確保這一瞬息萬變的技術(shù)能夠蓬勃發(fā)展并促進(jìn)歐洲的創(chuàng)新。”

6月7日,北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國互聯(lián)網(wǎng)協(xié)會(huì)研究中心副主任吳沈括接受記者采訪時(shí)表示,《法案》遵循“基于風(fēng)險(xiǎn)”的方法,即對(duì)社會(huì)造成危害的風(fēng)險(xiǎn)越高,規(guī)則就越嚴(yán)格。其根據(jù)風(fēng)險(xiǎn)對(duì)不同類型的人工智能進(jìn)行了分類,風(fēng)險(xiǎn)有限的人工智能系統(tǒng)只需履行很輕的透明度義務(wù)。而高風(fēng)險(xiǎn)的人工智能系統(tǒng)將獲得授權(quán),但必須遵守一系列要求和義務(wù)才能進(jìn)入歐盟市場。

對(duì)于人工智能安全使用問題,《法治日?qǐng)?bào)》律師專家?guī)斐蓡T、北京觀韜中茂(上海)律師事務(wù)所合伙人王渝偉向記者表示:“我國對(duì)于大模型管理一直在逐步加強(qiáng),也出臺(tái)了相關(guān)的管理辦法?!蓖跤鍌フf,針對(duì)人工智能的快速發(fā)展,中國早在2017年就頒布了《國務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》,將人工智能作為戰(zhàn)略目標(biāo),提出要建立人工智能安全監(jiān)管和評(píng)估體系,加大對(duì)數(shù)據(jù)濫用、侵犯個(gè)人隱私、違背道德倫理等行為的懲戒力度。

2021年頒布施行的《關(guān)于加強(qiáng)互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見》和2022年施行的《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,均明確了信息服務(wù)的規(guī)范要求,算法推薦服務(wù)提供者不得利用算法推薦服務(wù)侵犯他人合法權(quán)益。

王渝偉說:“2023年,我國發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》,這是專門針對(duì)生成式人工智能所作出的規(guī)定。《生成式人工智能服務(wù)管理暫行辦法》對(duì)提供者及使用者必須遵循社會(huì)公德和倫理道德提出了基本要求,其中包括必須堅(jiān)持社會(huì)主義核心價(jià)值觀,必須保護(hù)商業(yè)秘密、個(gè)人隱私等不受侵犯?!?/p>

編審|渠 洋

責(zé)編|白 馗

校對(duì)|張波 張雪慧

編輯:劉曉瑩