9466达人管家

9466达人管家

研发测试使用乌镇峰会重磅发布!360首发《大模型安全白皮书》,首提“全链路AI安全防线”应对智能时代新威胁

乌镇峰会重磅发布!360首发《大模型安全白皮书》,首提“全链路AI安全防线”应对智能时代新威胁

AIBase2025-11-10
80

AI安全警报:大模型风险与防御新策略

人工智能大模型正加速渗透金融、政务、能源等关键领域。然而,一个严峻的安全悖论浮出水面:模型越智能,潜在危险越大。在2025年世界互联网大会乌镇峰会上,360数字安全集团发布了国内首份《大模型安全白皮书》。这份报告系统性地揭示了大模型全生命周期中的五大核心风险,并创新性地提出了“外挂式安全+平台原生安全”双轨治理框架。这一框架旨在为高危AI时代构建纵深防御体系。

五大核心风险:层层递进的威胁矩阵

白皮书明确指出,大模型安全威胁已形成跨层级、强耦合的复杂矩阵。具体包括以下五个关键维度:

  • 基础设施层:算力集群和训练平台若遭攻击,可能导致模型被投毒或窃取
  • 内容层:生成虚假信息、违规内容或“AI幻觉”(即模型产生不合理输出)可能引发社会风险
  • 数据与知识库层:训练数据泄露、知识库被污染将直接动摇模型可信根基
  • 智能体层(Agent):自主决策的AI代理若被操控,可能执行恶意任务
  • 用户端层:提示注入、越权访问等攻击可绕过防护直接操控模型行为

双轨安全策略:内外兼修的防御之道

面对这种多维威胁,360提出了双轨并行的安全策略:

外挂式安全:在模型外部部署监测、过滤与审计系统。例如内容合规网关和异常行为检测,如同给AI系统装上“安全护栏”。

平台原生安全:将安全能力内嵌至大模型研发、训练、部署、推理各环节。这相当于实现“安全即代码”,让防护成为系统内在基因。

全链路解决方案:七大核心能力保驾护航

基于这一理念,360已构建覆盖七大核心能力的全链路解决方案:

  • 数据脱敏
  • 模型加固
  • 内容过滤
  • Agent行为审计
  • API防护
  • 红蓝对抗
  • 安全合规

该方案已在金融、制造、政务等多个行业成功落地实践。

共建安全生态:超越企业防护的协同防御

360强调,单靠企业自身防护远远不够。未来将联合产学研各方,共同推动三大关键举措:

  • 大模型安全标准制定
  • 威胁情报共享
  • 开源安全工具共建

目标是打造开放、协同、可信的AI安全生态。

未来展望:从技术秀场到生产基础设施

专家分析认为,在大模型从“技术秀场”迈向“生产基础设施”的关键节点,360的白皮书不仅是一份风险预警,更是一张AI安全新基建的路线图。当智能成为核心生产力,安全必须成为不可逾越的底线。这场由360发起的防御战,关乎的不仅是技术本身,更是AI能否赢得社会真正信任与托付的未来。

未经允许不得转载:研发测试使用乌镇峰会重磅发布!360首发《大模型安全白皮书》,首提“全链路AI安全防线”应对智能时代新威胁
广告1