研发测试使用乌镇峰会重磅发布！360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁

乌镇峰会重磅发布！360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁

AIBase2025-11-10

80

AI安全警报：大模型风险与防御新策略

人工智能大模型正加速渗透金融、政务、能源等关键领域。然而，一个严峻的安全悖论浮出水面：模型越智能，潜在危险越大。在2025年世界互联网大会乌镇峰会上，360数字安全集团发布了国内首份《大模型安全白皮书》。这份报告系统性地揭示了大模型全生命周期中的五大核心风险，并创新性地提出了“外挂式安全+平台原生安全”双轨治理框架。这一框架旨在为高危AI时代构建纵深防御体系。

五大核心风险：层层递进的威胁矩阵

白皮书明确指出，大模型安全威胁已形成跨层级、强耦合的复杂矩阵。具体包括以下五个关键维度：

基础设施层：算力集群和训练平台若遭攻击，可能导致模型被投毒或窃取
内容层：生成虚假信息、违规内容或“AI幻觉”（即模型产生不合理输出）可能引发社会风险
数据与知识库层：训练数据泄露、知识库被污染将直接动摇模型可信根基
智能体层（Agent）：自主决策的AI代理若被操控，可能执行恶意任务
用户端层：提示注入、越权访问等攻击可绕过防护直接操控模型行为

双轨安全策略：内外兼修的防御之道

面对这种多维威胁，360提出了双轨并行的安全策略：

外挂式安全：在模型外部部署监测、过滤与审计系统。例如内容合规网关和异常行为检测，如同给AI系统装上“安全护栏”。

平台原生安全：将安全能力内嵌至大模型研发、训练、部署、推理各环节。这相当于实现“安全即代码”，让防护成为系统内在基因。

全链路解决方案：七大核心能力保驾护航

基于这一理念，360已构建覆盖七大核心能力的全链路解决方案：

数据脱敏
模型加固
内容过滤
Agent行为审计
API防护
红蓝对抗
安全合规

该方案已在金融、制造、政务等多个行业成功落地实践。

共建安全生态：超越企业防护的协同防御

360强调，单靠企业自身防护远远不够。未来将联合产学研各方，共同推动三大关键举措：

大模型安全标准制定
威胁情报共享
开源安全工具共建

目标是打造开放、协同、可信的AI安全生态。

未来展望：从技术秀场到生产基础设施

专家分析认为，在大模型从“技术秀场”迈向“生产基础设施”的关键节点，360的白皮书不仅是一份风险预警，更是一张AI安全新基建的路线图。当智能成为核心生产力，安全必须成为不可逾越的底线。这场由360发起的防御战，关乎的不仅是技术本身，更是AI能否赢得社会真正信任与托付的未来。

未经允许不得转载：研发测试使用乌镇峰会重磅发布！360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁

研发测试使用乌镇峰会重磅发布！360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁

上一篇AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书下一篇StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验

广告1