2025年11月8日,在世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)上,360數(shù)字安全集團(tuán)正式發(fā)布《大模型安全白皮書》(以下簡稱“白皮書”)。該白皮書首次系統(tǒng)性闡釋大模型運(yùn)行時(shí)的五大關(guān)鍵風(fēng)險(xiǎn),建設(shè)性地提出“外筑‘以模治?!瘎?dòng)態(tài)屏障,內(nèi)固‘平臺(tái)原生’安全底座”的核心理念,并源于實(shí)戰(zhàn),提供了可落地的安全解決方案,為大模型應(yīng)用拉起了全鏈路安全防線,助力推動(dòng)人工智能行業(yè)向“安全、向善、可信、可控”方向穩(wěn)健發(fā)展。
五大風(fēng)險(xiǎn):大模型安全呈多維復(fù)雜態(tài)勢(shì),挑戰(zhàn)成指數(shù)級(jí)
隨著大模型技術(shù)加速滲透政務(wù)、金融、能源、醫(yī)療等重點(diǎn)行業(yè),一個(gè)不容忽視的現(xiàn)實(shí)是——AI越智能,安全風(fēng)險(xiǎn)越致命。
白皮書以2025年國內(nèi)外多起典型大模型安全事件為切入點(diǎn),系統(tǒng)性歸納了威脅大模型安全的五大關(guān)鍵風(fēng)險(xiǎn):
首先是基礎(chǔ)設(shè)施安全風(fēng)險(xiǎn),包括設(shè)備控制、供應(yīng)鏈漏洞、拒絕服務(wù)攻擊以及算力資源濫用等問題;其次是內(nèi)容安全風(fēng)險(xiǎn),涉及不符合核心價(jià)值觀、虛假或違規(guī)內(nèi)容、大模型幻覺,以及提示注入攻擊等;第三類是數(shù)據(jù)與知識(shí)庫安全風(fēng)險(xiǎn),數(shù)據(jù)泄露、越權(quán)訪問、隱私濫用和知識(shí)產(chǎn)權(quán)問題日益突出;第四是智能體安全風(fēng)險(xiǎn),隨著智能體自主性增強(qiáng),插件調(diào)用、算力調(diào)度、數(shù)據(jù)流轉(zhuǎn)等環(huán)節(jié)的安全邊界更加模糊;最后是用戶端安全風(fēng)險(xiǎn),包括權(quán)限控制、API調(diào)用監(jiān)控、惡意腳本執(zhí)行以及MCP執(zhí)行安全等。
這些風(fēng)險(xiǎn)相互交織,形成傳統(tǒng)安全方案難以應(yīng)對(duì)的復(fù)雜威脅矩陣,嚴(yán)重威脅個(gè)人權(quán)益、企業(yè)發(fā)展乃至國家安全。
拉起防線:“外掛式安全 + 平臺(tái)原生安全”雙軌安全體系
面對(duì)上述復(fù)雜挑戰(zhàn),白皮書基于實(shí)戰(zhàn)經(jīng)驗(yàn),給出了“外掛式安全 + 平臺(tái)原生安全”雙軌治理策略 —— 前者像 AI 的 “外部保鏢”,靈活應(yīng)對(duì)實(shí)時(shí)風(fēng)險(xiǎn);后者像 AI 的“內(nèi)置鎧甲”,從根源筑牢安全基礎(chǔ),兩者配合形成全鏈路防護(hù)網(wǎng)。
外掛式安全側(cè)重模型外部防護(hù),通過“以模治?!睂?shí)現(xiàn)對(duì)算力主機(jī)、軟件生態(tài)、輸入輸出內(nèi)容及模型幻覺的主動(dòng)監(jiān)測(cè)與防御。
該方式具備兩大優(yōu)勢(shì):一是適配性強(qiáng)、部署成本低,可作為通用組件快速接入不同企業(yè)環(huán)境,避免重復(fù)開發(fā);二是響應(yīng)迅速,具備獨(dú)立監(jiān)測(cè)與攔截機(jī)制,可在毫秒級(jí)別識(shí)別并阻斷實(shí)時(shí)威脅,如異常算力消耗或惡意內(nèi)容。
平臺(tái)原生安全則聚焦大模型數(shù)據(jù)、知識(shí)庫、智能體及客戶端等環(huán)節(jié),將安全能力嵌入核心組件,強(qiáng)化配套組件安全與全流程合規(guī)管控。
360提供的企業(yè)級(jí)知識(shí)庫、智能體構(gòu)建與運(yùn)營平臺(tái)、智能體客戶端等產(chǎn)品,均基于這一理念開發(fā),將安全深度植入平臺(tái)底層,全面滿足國家與行業(yè)合規(guī)要求,為智能體應(yīng)用提供全鏈路保障。
簡言之,外掛式安全如同“建成后加裝的防盜系統(tǒng)”,平臺(tái)原生安全則如“建造時(shí)內(nèi)置的防火結(jié)構(gòu)”,二者協(xié)同,從外至內(nèi)構(gòu)筑大模型的安全防線。通過這一體系,360實(shí)現(xiàn)了主動(dòng)發(fā)現(xiàn)、動(dòng)態(tài)演進(jìn)的安全檢測(cè)能力,有效應(yīng)對(duì)復(fù)雜多變的大模型安全威脅。
縱深防御:7大能力守好大模型安全門
基于 “外防風(fēng)險(xiǎn)、內(nèi)固架構(gòu)”的大模型安全核心理念,360給出一份覆蓋大模型安全全鏈路解決方案。該方案通過七大核心產(chǎn)品能力,共同組成“外掛式”與“平臺(tái)原生”相結(jié)合的縱深防御體系。
其中,“外掛式”安全能力不侵入大模型原生架構(gòu),通過外部工具實(shí)現(xiàn)靈活、快速的動(dòng)態(tài)防護(hù)。該體系下的四大產(chǎn)品——大模型衛(wèi)士算力主機(jī)安全系統(tǒng)、檢測(cè)系統(tǒng)、防護(hù)系統(tǒng)、幻覺檢測(cè)與緩解系統(tǒng)——共同構(gòu)建了外部屏障,重點(diǎn)應(yīng)對(duì)大模型基礎(chǔ)設(shè)施風(fēng)險(xiǎn),如算力劫持、供應(yīng)鏈投毒,以及大模型內(nèi)容風(fēng)險(xiǎn),如提示詞注入、模型幻覺與違規(guī)內(nèi)容,實(shí)現(xiàn)了從算力層到內(nèi)容層的實(shí)時(shí)監(jiān)測(cè)與主動(dòng)防御。
“平臺(tái)原生安全” 則如同為大模型應(yīng)用注入了“安全基因”,將防護(hù)能力深度內(nèi)嵌于其核心組件之中。這一理念具體體現(xiàn)在三大平臺(tái)產(chǎn)品上:企業(yè)級(jí)知識(shí)庫從根本上守護(hù)數(shù)據(jù)與知識(shí)安全;智能體構(gòu)建和運(yùn)營平臺(tái)確保智能體行為全程可控;智能體客戶端則筑牢用戶端入口的安全防線。三者協(xié)同,從底層架構(gòu)解決了數(shù)據(jù)泄露、智能體行為失控及終端濫用等內(nèi)生性安全挑戰(zhàn),為AI應(yīng)用的穩(wěn)定可靠運(yùn)行奠定了內(nèi)生性基礎(chǔ)。
據(jù)悉,目前,360已將這一能力落地政務(wù)、金融、制造等各行業(yè),真正讓大模型安全從“理論變成“能落地、能管用”的實(shí)戰(zhàn)方案。
未來,還將聯(lián)合產(chǎn)學(xué)研各界,共同推動(dòng)安全標(biāo)準(zhǔn)建設(shè)與技術(shù)共享,攜手共建安全、可信的AI生態(tài)。讓AI世界更安全、更美好。