Skip to content

第六部分 · 安全与生产化部署

把 Agent 装进用户能用的产品比让它在开发者本机跑难 10 倍。这部分合并了"安全防护"和"生产部署"两个主题——它们本来就分不开。

本部分关键词

  • 多层防御(Defense-in-Depth) — 每一层都假定上一层会失守;安全不在单点 · §6.1G.5
  • SSRF 黑名单 — 默认封禁 127.0.0.1169.254.169.254、链路本地、RFC1918;只能扩,不能关 · §6.3G.5
  • Working-directory 黄金规则 — 一个租户 = 一个 CWD;绝不共享 —— 文件工具都在这里寻址 · §6.4
  • 会话池 — 以 (tenant_id, session_id) 为键,TTL + LRU 淘汰;生产侧生命周期模式 · §6.7
  • Sticky sessionStatefulSet + PVC + sessionAffinity;同会话落到同 Pod 的方式 · §6.8

本部分覆盖

按角色的阅读路径

角色推荐章节
DevOps / SRE6.6 → 6.7 → 6.8
安全审计6.1 → 6.4 → 6.5
平台工程6.1 → 6.2 → 6.3 → 6.4
产品经理(理解风险)6.1 → 6.5 关键风险段

按任务阅读

你现在要做什么最短路径
先建立生产安全基线6.1 多层防御模型6.4 多租户隔离6.5 密钥与 Prompt 注入
收紧工具 / Shell / 网络边界6.2 Shell 沙箱6.3 网络与 SSRF5.4 权限引擎
准备上线和运维6.6 可观测性6.7 资源治理6.8 部署
做上线前复核6.1 自测清单6.4 自测清单6.7 压测前 checklist

上线前最低检查

  • 隔离:每个租户有独立 working_directory,并且文件工具不能越界访问。
  • 权限:高风险工具进入 requires_confirmation 或权限规则,批处理模式有拒绝策略。
  • 网络:SSRF 黑名单保持开启,MCP / HTTP 工具只允许访问预期域名。
  • 密钥:密钥只通过运行时注入,日志、prompt 和记忆里没有明文凭据。
  • 观测:工具调用、权限拒绝、人工确认、错误和 token 成本都能追踪。
  • 资源:会话池有 TTL / LRU,压测覆盖峰值并发、长会话和异常退出。
  • 回滚:部署有灰度维度,Agent 版本、工具版本和提示版本能关联到日志。

心智模型

安全是层叠而非单点;生产是治理而非运气。 每一层都假定上一层会失守——这样你就永远有兜底。

6.1 多层防御模型 →