
7月23日,在第24屆中國(guó)互聯(lián)網(wǎng)大會(huì)上,360集團(tuán)創(chuàng)始人周鴻祎圍繞大模型安全、AI治理、智能體變革,提出一系列系統(tǒng)性且?guī)в蓄A(yù)警性質(zhì)的判斷,并明確指出,“未來(lái)的對(duì)抗將是人和算力、人和算法、人和機(jī)器之間的對(duì)抗”。
周鴻祎表示,AI帶來(lái)了很多傳統(tǒng)的安全問(wèn)題,它帶來(lái)了兩個(gè)新的挑戰(zhàn)。其中第一個(gè)核心問(wèn)題,是大模型的隨機(jī)性與幻覺(jué)問(wèn)題。
與傳統(tǒng)軟件“一次編程、重復(fù)執(zhí)行”的確定性不同,AI尤其是Agent類智能體,存在天然的隨機(jī)性?!澳阍O(shè)計(jì)得再好,它執(zhí)行一百遍也不一定一樣?!敝茗櫟t指出,這種“像人一樣容易犯錯(cuò)”的特性,意味著它本身無(wú)法被徹底規(guī)范。他進(jìn)一步提到,攻擊者通過(guò)自然語(yǔ)言與AI互動(dòng)、利用提示詞(Prompt)攻擊、進(jìn)行“PUA式”引導(dǎo),誘使模型泄露信息,正在成為新的安全漏洞。這類攻擊方式“傳統(tǒng)的防火墻、殺毒軟件肯定是不管作用的”。
面對(duì)大模型時(shí)代的新安全問(wèn)題,周鴻祎提出了“以模制?!钡慕鉀Q之道。即利用一個(gè)安全大模型來(lái)監(jiān)測(cè)另一個(gè)通用大模型的行為,理解人們?cè)谙蚰P洼斎胧裁?、模型輸出了什么,是否存在?shù)據(jù)泄露、惡意引導(dǎo)等風(fēng)險(xiǎn)。
“我們這兩年做了一個(gè)產(chǎn)品,叫‘大模型衛(wèi)士’,就是專門解決大模型新出的這種高智商問(wèn)題?!边@款產(chǎn)品,正是“以模制模”的具體體現(xiàn),結(jié)合知識(shí)庫(kù)、Web搜索、數(shù)據(jù)庫(kù)能力,來(lái)彌補(bǔ)幻覺(jué)、偏差等風(fēng)險(xiǎn)。
大模型對(duì)安全的第二個(gè)重大挑戰(zhàn),是攻擊能力的智能體化。周鴻祎指出,“以后希望每個(gè)人都有三五十個(gè)智能體做助理,我們就變成了超級(jí)個(gè)體。你可以這么干,對(duì)方黑客也可以這么干。”
過(guò)去,一個(gè)頂尖黑客需要多年訓(xùn)練、極高天賦。但現(xiàn)在,只要有一個(gè)成功的攻擊樣本,就可以訓(xùn)練成一個(gè)“黑客智能體”。這個(gè)智能體可以自動(dòng)規(guī)劃攻擊路徑、尋找漏洞、調(diào)用工具,一氣呵成?!斑@一下子就把過(guò)去人跟人的對(duì)抗,變成了人和算法、人和機(jī)器的對(duì)抗。”
同時(shí),對(duì)抗方式也必須升級(jí)。他再次強(qiáng)調(diào)“以模制?!保⒅赋?60正在用過(guò)去十多年攻防經(jīng)驗(yàn)訓(xùn)練安全智能體,作為“智能體安全專家”,“用智能體來(lái)對(duì)抗智能體”。這種應(yīng)對(duì)邏輯,擺脫了傳統(tǒng)安全“系統(tǒng)+人工響應(yīng)”的滯后模式,轉(zhuǎn)而走向“算法+算法”的實(shí)戰(zhàn)模擬。換句話說(shuō),安全邊界正從“外圍防御”擴(kuò)展到模型內(nèi)部,從“系統(tǒng)漏洞”擴(kuò)展到“行為理解”。
