AI Agent Orchestration
NEXUS — 专家网络,统一策略
Agency 多智能体编排的完整运营手册
NEXUS 把 Agency 里各自为战的 AI 专家变成一个同步运转的智能网络。这不是一个提示词合集——这是一套部署纲领,让 Agency 成为任何项目、产品或组织的战力倍增器。
目录
- 策略基础
- NEXUS 运营模型
- 第 0 阶段 — 情报与发现
- 第 1 阶段 — 策略与架构
- 第 2 阶段 — 基础与脚手架
- 第 3 阶段 — 构建与迭代
- 第 4 阶段 — 质量与加固
- 第 5 阶段 — 上线与增长
- 第 6 阶段 — 运营与演进
- 智能体协调矩阵
- 交接协议
- 质量门禁
- 风险管理
- 成功指标
- 快速启动指南
1. 策略基础
1.1 NEXUS 解决什么问题
单个智能体很强。但没有协调的话,它们会产出:
- 相互矛盾的架构决策
- 跨部门的重复劳动
- 交接边界的质量断层
- 没有共享上下文和组织记忆
NEXUS 消灭这些失败模式,明确定义:
- 谁在每个阶段激活
- 做什么,产出给谁
- 什么时候交接,交给谁
- 怎么在推进前验证质量
- 为什么每个智能体存在于流水线中(不带闲人)
1.2 核心原则
| 原则 |
说明 |
| 流水线完整性 |
没过质量门禁的阶段不能推进 |
| 上下文连续性 |
每次交接都带完整上下文——没有智能体冷启动 |
| 并行执行 |
独立的工作流同时跑,压缩工期 |
| 证据高于口说 |
所有质量评估要拿出证据,不是口头声明 |
| 快速失败,快速修复 |
每个任务最多重试 3 次就升级 |
| 单一信息源 |
一份需求文档、一份任务清单、一份架构文档 |
1.3 按部门的智能体名单
| 部门 |
智能体 |
NEXUS 中的主要角色 |
| 工程 |
前端开发者、后端架构师、移动应用开发者、AI 工程师、DevOps 自动化师、快速原型师、高级开发者 |
构建、部署和维护所有技术系统 |
| 设计 |
UI 设计师、UX 研究员、UX 架构师、品牌守护者、视觉叙事师、趣味注入师、图像提示词工程师 |
定义视觉识别、用户体验和品牌一致性 |
| 营销 |
增长黑客、内容创作者、Twitter 互动官、TikTok 策略师、Instagram 策展人、Reddit 社区建设者、应用商店优化师、社交媒体策略师 |
驱动获客、互动和市场影响力 |
| 产品 |
Sprint 排序师、趋势研究员、反馈分析师 |
定义做什么、什么时候做、为什么做 |
| 项目管理 |
工作室制片人、项目牧羊人、工作室运营、实验追踪员、高级项目经理 |
编排时间线、资源和跨职能协调 |
| 测试 |
证据收集者、现实检验者、测试结果分析师、性能基准师、API 测试员、工具评估师、工作流优化师 |
通过基于证据的评估验证质量 |
| 运维支持 |
客服响应者、数据分析师、财务追踪员、基础设施运维师、法务合规员、高管摘要生成器 |
维持运营、合规和商业智能 |
| 空间计算 |
XR 交互架构师、macOS 空间/Metal 工程师、XR 沉浸式开发者、XR 座舱交互专家、visionOS 空间工程师、终端集成专家 |
构建沉浸式和空间计算体验 |
| 专项 |
智能体编排者、数据分析师、LSP/索引工程师、销售数据抽取智能体、数据汇总智能体、报告分发智能体 |
跨领域协调、深度分析和代码智能 |
2. NEXUS 运营模型
2.1 七阶段流水线
┌─────────────────────────────────────────────────────────────────────────┐
│ NEXUS 流水线 │
│ │
│ 第 0 阶段 第 1 阶段 第 2 阶段 第 3 阶段 │
│ 发现 ───▶ 策略 ───▶ 基础搭建 ───▶ 构建 │
│ 情报收集 架构设计 基础组件 开发-测试循环 │
│ │
│ 第 4 阶段 第 5 阶段 第 6 阶段 │
│ 加固 ───▶ 上线 ───▶ 运营 │
│ 质量门禁 市场推广 持续运营 │
│ │
│ ◆ 每个阶段之间都有质量门禁 │
│ ◆ 阶段内部有并行轨道 │
│ ◆ 每个边界都有反馈循环 │
└─────────────────────────────────────────────────────────────────────────┘
2.2 指挥结构
┌──────────────────────┐
│ 智能体编排者 │ ◄── 流水线控制器
│ (专项部门) │
└──────────┬───────────┘
│
┌────────────────┼────────────────┐
│ │ │
┌────────▼──────┐ ┌──────▼───────┐ ┌──────▼──────────┐
│ 工作室制片人 │ │ 项目牧羊人 │ │ 高级项目经理 │
│ (组合管理) │ │ (执行协调) │ │ (任务拆分) │
└───────────────┘ └──────────────┘ └─────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────┐
│ 各部门负责人(按阶段分配) │
│ 工程 │ 设计 │ 营销 │ 产品 │ QA │
└─────────────────────────────────────────────────┘
2.3 激活模式
NEXUS 支持三种部署配置:
| 模式 |
活跃智能体数 |
适用场景 |
时间线 |
| NEXUS-Full |
全部 |
企业级产品上线,完整生命周期 |
12-24 周 |
| NEXUS-Sprint |
15-25 |
功能开发,MVP 构建 |
2-6 周 |
| NEXUS-Micro |
5-10 |
Bug 修复,内容活动,单一交付物 |
1-5 天 |
3. 第 0 阶段 — 情报与发现
目标:投入资源之前先搞清楚情况。问题没验证之前不动手。
3.1 活跃智能体
| 智能体 |
阶段角色 |
主要产出 |
| 趋势研究员 |
市场情报负责人 |
含 TAM/SAM/SOM 的市场分析报告 |
| 反馈分析师 |
用户需求分析 |
含痛点的综合反馈报告 |
| UX 研究员 |
用户行为分析 |
含用户画像和旅程图的调研报告 |
| 数据分析师 |
数据基础评估 |
含可用信号的数据审计报告 |
| 法务合规员 |
监管扫描 |
合规要求矩阵 |
| 工具评估师 |
技术版图 |
技术栈评估 |
3.2 并行工作流
工作流 A:市场情报 工作流 B:用户情报
├── 趋势研究员 ├── 反馈分析师
│ ├── 竞争格局 │ ├── 多渠道反馈收集
│ ├── 市场规模(TAM/SAM/SOM) │ ├── 情感分析
│ └── 趋势生命周期图谱 │ └── 痛点排序
│ │
├── 数据分析师 ├── UX 研究员
│ ├── 现有数据审计 │ ├── 用户访谈/问卷
│ ├── 信号识别 │ ├── 用户画像构建
│ └── 基线指标 │ └── 旅程图绘制
│ │
└── 法务合规员 └── 工具评估师
├── 监管要求 ├── 技术评估
├── 数据处理约束 ├── 自建 vs 采购分析
└── 司法管辖区映射 └── 集成可行性
3.3 第 0 阶段质量门禁
守门人:高管摘要生成器
| 标准 |
阈值 |
需要的证据 |
| 市场机会已验证 |
TAM 超过最低可行阈值 |
趋势研究员报告 + 来源 |
| 用户需求已确认 |
>= 3 个已验证痛点 |
反馈分析师 + UX 研究员数据 |
| 监管路径清晰 |
无阻塞性合规问题 |
法务合规员矩阵 |
| 数据基础已评估 |
关键指标已识别 |
数据分析师审计 |
| 技术可行性已确认 |
技术栈已验证 |
工具评估师评估 |
产出:高管摘要(不超过 500 字,SCQA 格式) → 决策:继续 / 终止 / 调整方向
4. 第 1 阶段 — 策略与架构
目标:定义做什么、怎么搭、成功标准是什么——一行代码都不写之前搞定。
4.1 活跃智能体
| 智能体 |
阶段角色 |
主要产出 |
| 工作室制片人 |
策略组合对齐 |
策略组合计划 |
| 高级项目经理 |
需求转任务 |
完整任务清单 |
| Sprint 排序师 |
功能排序 |
RICE 评分的待办列表 |
| UX 架构师 |
技术架构 + UX 基础 |
架构文档 + CSS 设计系统 |
| 品牌守护者 |
品牌识别系统 |
品牌基础文档 |
| 后端架构师 |
系统架构 |
系统架构文档 |
| AI 工程师 |
AI/ML 架构(如适用) |
ML 系统设计 |
| 财务追踪员 |
预算和资源规划 |
含 ROI 预测的财务计划 |
4.2 执行顺序
第一步:策略定调(并行)
├── 工作室制片人 → 策略组合计划(愿景、目标、ROI 指标)
├── 品牌守护者 → 品牌基础(使命、价值观、视觉识别系统)
└── 财务追踪员 → 预算框架(资源配置、成本预测)
第二步:技术架构(并行,第一步完成后)
├── UX 架构师 → CSS 设计系统 + 布局框架 + UX 结构
├── 后端架构师 → 系统架构(服务、数据库、API)
├── AI 工程师 → ML 架构(模型、管道、推理策略)
└── 高级项目经理 → 任务清单(需求 → 任务,精确引用需求)
第三步:排优先级(串行,第二步完成后)
└── Sprint 排序师 → RICE 评分的待办列表 + Sprint 分配
├── 输入:任务清单 + 架构文档 + 预算框架
├── 产出:排好序的 Sprint 计划 + 依赖图
└── 验证:工作室制片人确认策略对齐
4.3 第 1 阶段质量门禁
守门人:工作室制片人 + 现实检验者(双签)
| 标准 |
阈值 |
需要的证据 |
| 架构覆盖所有需求 |
100% 覆盖 |
高级项目经理任务清单交叉核对 |
| 品牌系统完整 |
Logo、颜色、字体、语调已定义 |
品牌守护者交付物 |
| 技术可行性已验证 |
所有组件有实现路径 |
后端架构师 + UX 架构师文档 |
| 预算已批准 |
在组织约束范围内 |
财务追踪员计划 |
| Sprint 计划切合实际 |
基于速度的估算 |
Sprint 排序师待办列表 |
产出:批准的架构包 → 激活第 2 阶段
5. 第 2 阶段 — 基础与脚手架
目标:搭好后续所有工作的技术和运营基础。先把骨架立起来再加肉。
5.1 活跃智能体
| 智能体 |
阶段角色 |
主要产出 |
| DevOps 自动化师 |
CI/CD 流水线 + 基础设施 |
部署流水线 + IaC 模板 |
| 前端开发者 |
项目脚手架 + 组件库 |
应用骨架 + 设计系统实现 |
| 后端架构师 |
数据库 + API 基础 |
Schema + API 骨架 + 认证系统 |
| UX 架构师 |
CSS 系统实现 |
设计 Token + 布局框架 |
| 基础设施运维师 |
云基础设施搭建 |
监控 + 日志 + 告警 |
| 工作室运营 |
流程搭建 |
协作工具 + 工作流 |
5.2 并行工作流
工作流 A:基础设施 工作流 B:应用基础
├── DevOps 自动化师 ├── 前端开发者
│ ├── CI/CD 流水线(GitHub Actions) │ ├── 项目脚手架
│ ├── 容器编排 │ ├── 组件库搭建
│ └── 环境配置 │ └── 设计系统集成
│ │
├── 基础设施运维师 ├── 后端架构师
│ ├── 云资源配置 │ ├── 数据库 Schema 部署
│ ├── 监控(Prometheus/Grafana) │ ├── API 骨架 + 认证
│ └── 安全加固 │ └── 服务通信层
│ │
└── 工作室运营 └── UX 架构师
├── Git 工作流 + 分支策略 ├── CSS 设计 token
├── 沟通渠道 ├── 响应式布局系统
└── 文档模板 └── 主题系统(亮色/暗色/跟随系统)
5.3 第 2 阶段质量门禁
守门人:DevOps 自动化师 + 证据收集者
| 标准 |
阈值 |
需要的证据 |
| CI/CD 流水线可用 |
构建 + 测试 + 部署都能跑 |
流水线执行日志 |
| 数据库 Schema 已部署 |
所有表/索引已创建 |
迁移成功 + Schema 导出 |
| API 骨架有响应 |
健康检查端点在线 |
curl 响应截图 |
| 前端可渲染 |
骨架应用在浏览器中加载 |
证据收集者截图 |
| 监控在线 |
仪表盘显示指标 |
Grafana/监控截图 |
| 设计系统已实现 |
Token + 组件可用 |
组件库演示 |
产出:可运行的骨架应用 + 完整 DevOps 流水线 → 激活第 3 阶段
6. 第 3 阶段 — 构建与迭代
目标:通过持续的开发-测试循环实现功能。每个任务验证后才进入下一个。这是工作量最大的阶段。
6.1 开发-测试循环
这是 NEXUS 的心脏。智能体编排者管理一个逐任务的质量循环:
┌─────────────────────────────────────────────────────────┐
│ 开发-测试循环 │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────────────┐ │
│ │ 开发 │───▶│ 证据 │───▶│ 决策逻辑 │ │
│ │ 智能体 │ │ 收集者 │ │ │ │
│ │ │ │ (QA) │ │ 通过 → 下一个任务 │ │
│ │ 实现 │ │ │ │ 不通过 → 重试(<=3) │ │
│ │ 任务 N │ │ 测试 │ │ 阻塞 → 升级 │ │
│ │ │◀───│ 任务 N │◀───│ │ │
│ └──────────┘ └──────────┘ └──────────────────┘ │
│ ▲ │ │
│ │ QA 反馈 │ │
│ └────────────────────────────────────┘ │
│ │
│ 编排者追踪:重试次数、QA 反馈、 │
│ 任务状态、累计质量指标 │
└─────────────────────────────────────────────────────────┘
6.2 按任务类型的智能体分配
| 任务类型 |
主要开发者 |
QA 智能体 |
专家支持 |
| 前端 UI |
前端开发者 |
证据收集者 |
UI 设计师、趣味注入师 |
| 后端 API |
后端架构师 |
API 测试员 |
性能基准师 |
| 数据库 |
后端架构师 |
API 测试员 |
数据分析师 |
| 移动端 |
移动应用开发者 |
证据收集者 |
UX 研究员 |
| AI/ML 功能 |
AI 工程师 |
测试结果分析师 |
数据分析师 |
| 基础设施 |
DevOps 自动化师 |
性能基准师 |
基础设施运维师 |
| 高级打磨 |
高级开发者 |
证据收集者 |
视觉叙事师 |
| 快速原型 |
快速原型师 |
证据收集者 |
实验追踪员 |
| 空间/XR |
XR 沉浸式开发者 |
证据收集者 |
XR 交互架构师 |
| visionOS |
visionOS 空间工程师 |
证据收集者 |
macOS 空间/Metal 工程师 |
| 座舱 UI |
XR 座舱交互专家 |
证据收集者 |
XR 交互架构师 |
| CLI/终端 |
终端集成专家 |
API 测试员 |
LSP/索引工程师 |
| 代码智能 |
LSP/索引工程师 |
测试结果分析师 |
高级开发者 |
6.3 并行构建轨道
复杂项目有多条轨道同时跑:
轨道 A:核心产品 轨道 B:增长与营销
├── 前端开发者 ├── 增长黑客
│ └── UI 实现 │ └── 病毒式传播 + 推荐系统
├── 后端架构师 ├── 内容创作者
│ └── API + 业务逻辑 │ └── 上线内容 + 编辑日历
├── AI 工程师 ├── 社交媒体策略师
│ └── ML 功能 + 管道 │ └── 跨平台活动
│ ├── 应用商店优化师(如果是移动端)
│ │ └── ASO 策略 + 元数据
│ │
轨道 C:质量与运营 轨道 D:品牌与体验
├── 证据收集者 ├── UI 设计师
│ └── 持续 QA 截图 │ └── 组件打磨
├── API 测试员 ├── 品牌守护者
│ └── 端点验证 │ └── 品牌一致性审计
├── 性能基准师 ├── 视觉叙事师
│ └── 压力测试 + 优化 │ └── 视觉叙事素材
├── 工作流优化师 └── 趣味注入师
│ └── 流程改进 └── 愉悦感 + 微交互
└── 实验追踪员
└── A/B 测试管理
6.4 第 3 阶段质量门禁
守门人:智能体编排者
| 标准 |
阈值 |
需要的证据 |
| 所有任务通过 QA |
100% 完成 |
每个任务的证据收集者截图 |
| API 端点已验证 |
所有端点已测试 |
API 测试员报告 |
| 性能基线达标 |
P95 < 200ms, LCP < 2.5s |
性能基准师报告 |
| 品牌一致性已验证 |
95%+ 合规 |
品牌守护者审计 |
| 无严重 bug |
零 P0/P1 开放 |
测试结果分析师摘要 |
产出:功能完整的应用 → 激活第 4 阶段
7. 第 4 阶段 — 质量与加固
目标:最后的质量考验。现实检验者默认”需要改进”——你得用压倒性的证据来证明可以上生产。
7.1 活跃智能体
| 智能体 |
阶段角色 |
主要产出 |
| 现实检验者 |
最终集成测试(默认”需要改进”) |
基于现实的集成报告 |
| 证据收集者 |
全面视觉证据 |
截图证据包 |
| 性能基准师 |
压力测试 + 优化 |
性能认证 |
| API 测试员 |
全量 API 回归 |
API 测试报告 |
| 测试结果分析师 |
汇总质量指标 |
质量指标仪表盘 |
| 法务合规员 |
最终合规审计 |
合规认证 |
| 基础设施运维师 |
生产就绪检查 |
基础设施就绪报告 |
| 工作流优化师 |
流程效率复盘 |
优化建议 |
7.2 加固流程
第一步:证据收集(并行)
├── 证据收集者 → 全量截图套件(桌面、平板、手机)
├── API 测试员 → 完整端点回归
├── 性能基准师 → 10 倍预期流量压力测试
└── 法务合规员 → 最终监管审计
第二步:分析(并行,第一步完成后)
├── 测试结果分析师 → 把所有测试数据汇总成质量仪表盘
├── 工作流优化师 → 找出剩余的流程低效
└── 基础设施运维师 → 生产环境验证
第三步:最终判定(串行,第二步完成后)
└── 现实检验者 → 集成报告
├── 交叉验证之前所有 QA 发现
├── 用截图证据测试完整用户旅程
├── 逐条验证需求合规
├── 默认判定:需要改进
└── 只有在所有标准都有压倒性证据时才给"就绪"
7.3 第 4 阶段质量门禁(最终关卡)
守门人:现实检验者(唯一权威)
| 标准 |
阈值 |
需要的证据 |
| 用户旅程完整 |
所有关键路径跑通 |
端到端截图 |
| 跨设备一致性 |
桌面 + 平板 + 手机 |
响应式截图 |
| 性能认证通过 |
P95 < 200ms, 可用性 > 99.9% |
压力测试结果 |
| 安全验证通过 |
零严重漏洞 |
安全扫描报告 |
| 合规认证通过 |
所有监管要求都满足 |
法务合规员报告 |
| 需求合规 |
100% 需求已实现 |
逐条验证 |
判定选项:
- 就绪 — 可以上线(首轮通过很少见)
- 需要改进 — 回到第 3 阶段修具体问题(正常情况)
- 未就绪 — 架构有大问题,回到第 1/2 阶段
预期:首次实现通常需要 2-3 轮修改。B/B+ 的评分很正常也很健康。
8. 第 5 阶段 — 上线与增长
目标:协调所有渠道同时执行上市动作。上线时打出最大声量。
8.1 活跃智能体
| 智能体 |
阶段角色 |
主要产出 |
| 增长黑客 |
上线策略负责人 |
含病毒式传播的增长手册 |
| 内容创作者 |
上线内容 |
博客、视频、社交内容 |
| 社交媒体策略师 |
跨平台活动 |
活动日历 + 内容 |
| Twitter 互动官 |
Twitter/X 上线活动 |
推文串策略 + 互动计划 |
| TikTok 策略师 |
TikTok 爆款内容 |
短视频策略 |
| Instagram 策展人 |
视觉上线活动 |
视觉内容 + Stories |
| Reddit 社区建设者 |
社区真实发布 |
社区互动计划 |
| 应用商店优化师 |
商店优化(如果是移动端) |
ASO 包 |
| 高管摘要生成器 |
利益相关方通知 |
上线高管摘要 |
| 项目牧羊人 |
上线协调 |
上线检查清单 + 时间线 |
| DevOps 自动化师 |
部署执行 |
零停机部署 |
| 基础设施运维师 |
上线监控 |
实时仪表盘 |
8.2 上线流程
T-7 天:上线准备
├── 内容创作者 → 上线内容排队定时
├── 社交媒体策略师 → 活动素材定稿
├── 增长黑客 → 病毒式传播机制测试就绪
├── 应用商店优化师 → 商店页面优化
├── DevOps 自动化师 → 蓝绿部署准备
└── 基础设施运维师 → 配置 10 倍自动伸缩
T-0:上线当天
├── DevOps 自动化师 → 执行部署
├── 基础设施运维师 → 监控所有系统
├── Twitter 互动官 → 上线推文串 + 实时互动
├── Reddit 社区建设者 → 社区真实发帖
├── Instagram 策展人 → 视觉上线内容
├── TikTok 策略师 → 上线视频发布
├── 客服响应者 → 客服上线
└── 数据分析师 → 实时指标仪表盘
T+1 到 T+7:上线后
├── 增长黑客 → 分析获客数据,优化漏斗
├── 反馈分析师 → 收集分析早期用户反馈
├── 数据分析师 → 每日指标报告
├── 内容创作者 → 根据用户反应做新内容
├── 实验追踪员 → 启动 A/B 测试
└── 高管摘要生成器 → 每日利益相关方简报
8.3 第 5 阶段质量门禁
守门人:工作室制片人 + 数据分析师
| 标准 |
阈值 |
需要的证据 |
| 部署成功 |
零停机,所有健康检查通过 |
DevOps 部署日志 |
| 系统稳定 |
48 小时内无 P0/P1 事故 |
基础设施监控 |
| 用户获取活跃 |
渠道在带来流量 |
数据分析师仪表盘 |
| 反馈循环可用 |
在收集用户反馈 |
反馈分析师报告 |
| 利益相关方已通知 |
高管摘要已交付 |
高管摘要生成器产出 |
产出:稳定上线的产品 + 活跃的增长渠道 → 激活第 6 阶段
9. 第 6 阶段 — 运营与演进
目标:持续运营 + 持续改进。产品上线了——现在让它活得好。
9.1 活跃智能体(持续)
| 智能体 |
节奏 |
职责 |
| 基础设施运维师 |
持续 |
系统可靠性、可用性、性能 |
| 客服响应者 |
持续 |
客户支持和问题解决 |
| 数据分析师 |
每周 |
KPI 追踪、仪表盘、洞察 |
| 反馈分析师 |
双周 |
用户反馈分析和综合 |
| 财务追踪员 |
每月 |
财务表现、预算追踪 |
| 法务合规员 |
每月 |
监管动态跟踪和合规 |
| 趋势研究员 |
每月 |
市场情报和竞争分析 |
| 高管摘要生成器 |
每月 |
高管汇报 |
| Sprint 排序师 |
每个 Sprint |
待办梳理和 Sprint 规划 |
| 实验追踪员 |
每个实验 |
A/B 测试管理和分析 |
| 增长黑客 |
持续 |
获客优化和增长实验 |
| 工作流优化师 |
每季度 |
流程改进和效率提升 |
9.2 持续改进循环
┌──────────────────────────────────────────────────────────┐
│ 持续改进循环 │
│ │
│ 测量 分析 规划 执行 │
│ ┌─────────┐ ┌──────────┐ ┌──────────┐ ┌─────┐ │
│ │数据 │────▶│反馈 │──▶│Sprint │──▶│构建 │ │
│ │分析师 │ │综合员 │ │排序师 │ │循环 │ │
│ └─────────┘ └──────────┘ └──────────┘ └─────┘ │
│ ▲ │ │
│ │ 实验 │ │
│ │ 追踪员 │ │
│ └───────────────────────────────────────────┘ │
│ │
│ 每月:高管摘要生成器 → 高管报告 │
│ 每月:财务追踪员 → 财务表现 │
│ 每月:法务合规员 → 监管更新 │
│ 每月:趋势研究员 → 市场情报 │
│ 每季度:工作流优化师 → 流程改进 │
└──────────────────────────────────────────────────────────┘
10. 智能体协调矩阵
10.1 完整跨部门依赖图
这个矩阵显示哪个智能体的产出会被哪个智能体消费。读法:行方产出 → 列方消费。
产出方 → │ 工程 │ 设计 │ 营销 │ 产品 │ PM │ 测试 │ 运维 │ 空间 │ 专项
────────────────────┼─────┼─────┼─────┼─────┼─────┼─────┼─────┼─────┼────
工程 │ ● │ │ │ │ │ ● │ ● │ ● │
设计 │ ● │ ● │ ● │ │ │ ● │ │ ● │
营销 │ │ │ ● │ ● │ │ │ ● │ │
产品 │ ● │ ● │ ● │ ● │ ● │ │ │ │ ●
项目管理 │ ● │ ● │ ● │ ● │ ● │ ● │ ● │ ● │ ●
测试 │ ● │ ● │ │ ● │ ● │ ● │ │ ● │
运维支持 │ ● │ │ ● │ ● │ ● │ │ ● │ │ ●
空间计算 │ ● │ ● │ │ │ │ ● │ │ ● │
专项 │ ● │ │ │ ● │ ● │ ● │ ● │ │ ●
● = 有依赖关系(产出方创建的工件会被该部门消费)
10.2 关键交接对
这些是 NEXUS 中流量最大的交接关系:
| 发送方 |
接收方 |
工件 |
频率 |
| 高级项目经理 |
所有开发者 |
任务清单 |
每 Sprint |
| UX 架构师 |
前端开发者 |
CSS 设计系统 + 布局规范 |
每项目 |
| 后端架构师 |
前端开发者 |
API 文档 |
每功能 |
| 前端开发者 |
证据收集者 |
已实现的功能 |
每任务 |
| 证据收集者 |
智能体编排者 |
QA 判定(通过/不通过) |
每任务 |
| 智能体编排者 |
开发者(任何) |
QA 反馈 + 重试说明 |
每次不通过 |
| 品牌守护者 |
所有设计 + 营销 |
品牌规范 |
每项目 |
| 数据分析师 |
Sprint 排序师 |
表现数据 |
每 Sprint |
| 反馈分析师 |
Sprint 排序师 |
用户洞察 |
每 Sprint |
| 趋势研究员 |
工作室制片人 |
市场情报 |
每月 |
| 现实检验者 |
智能体编排者 |
集成判定 |
每阶段 |
| 高管摘要生成器 |
工作室制片人 |
高管简报 |
每里程碑 |
11. 交接协议
11.1 标准交接模板
每次智能体间交接都必须包含:
## NEXUS 交接文档
### 元数据
- **发送方**:[智能体名称]([部门])
- **接收方**:[智能体名称]([部门])
- **阶段**:[当前 NEXUS 阶段]
- **任务引用**:[Sprint 排序师待办列表中的任务 ID]
- **优先级**:[紧急 / 高 / 中 / 低]
- **时间戳**:[ISO 8601]
### 上下文
- **项目**:[项目名称和简要说明]
- **当前状态**:[到目前为止做了什么]
- **相关文件**:[要审查的文件/工件列表]
- **依赖**:[这项工作依赖什么]
### 交付要求
- **需要什么**:[具体的、可衡量的交付物]
- **验收标准**:[怎么衡量成功]
- **约束**:[技术、时间线或资源约束]
- **参考材料**:[需求、设计、之前工作的链接]
### 质量预期
- **必须通过**:[具体质量标准]
- **需要的证据**:[完成证明长什么样]
- **下一个接收方**:[谁接收产出,需要什么]
11.2 QA 反馈循环协议
任务 QA 不通过时,反馈必须可执行:
## QA 不通过反馈
### 任务:[任务 ID 和描述]
### 第几次:[1/2/3] 共 3 次
### 判定:不通过
### 发现的具体问题
1. **[问题分类]**:[准确描述 + 截图引用]
- 预期:[应该是什么样]
- 实际:[实际是什么样]
- 证据:[截图文件名或测试输出]
2. **[问题分类]**:[准确描述]
- 预期:[...]
- 实际:[...]
- 证据:[...]
### 修复说明
- [具体的、可执行的修复说明 1]
- [具体的、可执行的修复说明 2]
### 需要改的文件
- [文件路径 1]:[需要改什么]
- [文件路径 2]:[需要改什么]
### 重试预期
- 修好上面的问题后重新提交 QA
- 不要加新功能——只修问题
- 当前是第 [N+1] 次,共 3 次
11.3 升级协议
任务超过 3 次重试时:
## 升级报告
### 任务:[任务 ID]
### 重试已用完:3/3
### 升级级别:[给智能体编排者 / 给工作室制片人]
### 失败历史
- 第 1 次:[问题和修复尝试摘要]
- 第 2 次:[问题和修复尝试摘要]
- 第 3 次:[问题和修复尝试摘要]
### 根因分析
- [为什么任务一直过不了]
- [什么系统性问题阻碍了解决]
### 建议处理方式
- [ ] 重新分配给别的开发智能体
- [ ] 拆分成更小的子任务
- [ ] 换架构/思路
- [ ] 接受当前状态,记录已知限制
- [ ] 推迟到后面的 Sprint
### 影响评估
- **阻塞**:[什么其他任务被堵住了]
- **时间线影响**:[对整体排期的影响]
- **质量影响**:[有什么质量上的妥协]
12. 质量门禁
12.1 门禁总览
| 阶段 |
门禁名称 |
守门人 |
通过标准 |
| 0 → 1 |
发现门禁 |
高管摘要生成器 |
市场已验证,用户需求已确认,监管路径清晰 |
| 1 → 2 |
架构门禁 |
工作室制片人 + 现实检验者 |
架构完整,品牌已定义,预算已批准,Sprint 计划切实 |
| 2 → 3 |
基础门禁 |
DevOps 自动化师 + 证据收集者 |
CI/CD 可用,骨架应用在跑,监控在线 |
| 3 → 4 |
功能门禁 |
智能体编排者 |
所有任务通过 QA,无严重 bug,性能基线达标 |
| 4 → 5 |
生产门禁 |
现实检验者(唯一权威) |
用户旅程完整,跨设备一致,安全已验证,需求合规 |
| 5 → 6 |
上线门禁 |
工作室制片人 + 数据分析师 |
部署成功,系统稳定,增长渠道活跃 |
12.2 门禁失败处理
如果门禁不通过:
├── 守门人出具具体的失败报告
├── 智能体编排者把失败项路由给负责的智能体
├── 失败项进入开发-测试循环(第 3 阶段机制)
├── 最多 3 次门禁重试,超过就升级给工作室制片人
└── 工作室制片人决定:修、砍范围、还是带风险接受
13. 风险管理
13.1 风险分类和负责人
| 风险分类 |
主要负责人 |
缓解智能体 |
升级路径 |
| 技术债 |
后端架构师 |
工作流优化师 |
高级开发者 |
| 安全漏洞 |
法务合规员 |
基础设施运维师 |
DevOps 自动化师 |
| 性能退化 |
性能基准师 |
基础设施运维师 |
后端架构师 |
| 品牌不一致 |
品牌守护者 |
UI 设计师 |
工作室制片人 |
| 范围蔓延 |
高级项目经理 |
Sprint 排序师 |
项目牧羊人 |
| 预算超支 |
财务追踪员 |
工作室运营 |
工作室制片人 |
| 监管不合规 |
法务合规员 |
客服响应者 |
工作室制片人 |
| 市场变化 |
趋势研究员 |
增长黑客 |
工作室制片人 |
| 团队瓶颈 |
项目牧羊人 |
工作室运营 |
工作室制片人 |
| 质量退化 |
现实检验者 |
证据收集者 |
智能体编排者 |
13.2 风险响应矩阵
| 严重度 |
响应时间 |
决策权 |
行动 |
| 紧急(P0) |
立即 |
工作室制片人 |
全员集中,停下其他工作 |
| 高(P1) |
< 4 小时 |
项目牧羊人 |
专人负责 |
| 中(P2) |
< 24 小时 |
智能体编排者 |
下个 Sprint 最高优先级 |
| 低(P3) |
< 1 周 |
Sprint 排序师 |
加到待办列表 |
14. 成功指标
14.1 流水线指标
| 指标 |
目标 |
测量智能体 |
| 阶段首次通过率 |
95% |
智能体编排者 |
| 任务首次 QA 通过率 |
70%+ |
证据收集者 |
| 每任务平均重试次数 |
< 1.5 |
智能体编排者 |
| 流水线周期时间 |
Sprint 估算 ±15% 以内 |
项目牧羊人 |
| 质量门禁首次通过率 |
80%+ |
现实检验者 |
14.2 产品指标
| 指标 |
目标 |
测量智能体 |
| API 响应时间(P95) |
< 200ms |
性能基准师 |
| 页面加载时间(LCP) |
< 2.5s |
性能基准师 |
| 系统可用性 |
> 99.9% |
基础设施运维师 |
| Lighthouse 分数 |
> 90(性能 + 无障碍) |
前端开发者 |
| 安全漏洞 |
零严重 |
法务合规员 |
| 需求合规 |
100% |
现实检验者 |
14.3 业务指标
| 指标 |
目标 |
测量智能体 |
| 用户获取(月环比) |
20%+ 增长 |
增长黑客 |
| 激活率 |
首周 60%+ |
数据分析师 |
| 留存(7 日 / 30 日) |
40% / 20% |
数据分析师 |
| LTV:CAC 比率 |
> 3:1 |
财务追踪员 |
| NPS 分数 |
> 50 |
反馈分析师 |
| 组合 ROI |
> 25% |
工作室制片人 |
14.4 运营指标
| 指标 |
目标 |
测量智能体 |
| 部署频率 |
每天多次 |
DevOps 自动化师 |
| 平均恢复时间 |
< 30 分钟 |
基础设施运维师 |
| 合规率 |
98%+ |
法务合规员 |
| 利益相关方满意度 |
4.5/5 |
高管摘要生成器 |
| 流程效率提升 |
每季度 20%+ |
工作流优化师 |
15. 快速启动指南
15.1 NEXUS-Full 激活(企业级)
"激活智能体编排者,NEXUS-Full 模式,项目:[项目名称]。
项目需求说明:[需求文档路径]。
执行完整 7 阶段流水线,带所有质量门禁。"
15.2 NEXUS-Sprint 激活(功能/MVP)
"激活智能体编排者,NEXUS-Sprint 模式,项目:[功能/MVP 名称]。
需求:[简要描述或需求文档路径]。
跳过第 0 阶段(市场已验证)。
从第 1 阶段开始做架构和 Sprint 规划。"
15.3 NEXUS-Micro 激活(定向任务)
"激活 [具体智能体] 执行 [任务描述]。
上下文:[相关背景]。
交付物:[预期的具体产出]。
质量检查:完成后由证据收集者验证。"
15.4 智能体激活提示词模板
给编排者(流水线启动)
你是智能体编排者,在为 [项目] 运行 NEXUS 流水线。
项目需求说明:[路径]
模式:[Full/Sprint/Micro]
当前阶段:第 [N] 阶段
执行 NEXUS 协议:
1. 阅读项目需求说明
2. 按 NEXUS 策略激活第 [N] 阶段智能体
3. 用 NEXUS 交接模板管理所有交接
4. 阶段推进前执行质量门禁
5. 用状态报告追踪所有任务
6. 所有实现任务跑开发-测试循环
7. 每个任务 3 次不通过就升级
报告格式:NEXUS 流水线状态报告(见策略文档中的模板)
给开发智能体(任务实现)
你是 [智能体名称],在 NEXUS 流水线中工作。
阶段:[当前阶段]
任务:[Sprint 排序师待办列表中的任务 ID 和描述]
架构参考:[架构文档路径]
设计系统:[CSS/设计 token 路径]
品牌规范:[品牌文档路径]
按以下要求实现任务:
1. 严格按架构文档来
2. 用设计系统的 token 和模式
3. 按品牌规范保持视觉一致性
4. 无障碍标准(WCAG 2.1 AA)
完成后证据收集者会来审查你的工作。
验收标准:[任务清单中的具体标准]
给 QA 智能体(任务验证)
你是 [QA 智能体],在 NEXUS 流水线中做验证。
阶段:[当前阶段]
任务:[任务 ID 和描述]
开发者:[哪个智能体实现的]
当前是第 [N] 次,共 3 次
按以下标准验证:
1. 任务验收标准:[具体标准]
2. 架构文档:[路径]
3. 品牌规范:[路径]
4. 性能要求:[具体阈值]
给出判定:通过 或 不通过
如果不通过:给出具体问题、证据和修复说明
使用 NEXUS QA 反馈循环协议格式
附录 A:部门速查
工程部门 — “做对”
| 智能体 |
超能力 |
激活触发 |
| 前端开发者 |
React/Vue/Angular, Core Web Vitals, 无障碍 |
任何 UI 实现任务 |
| 后端架构师 |
可扩展系统、数据库设计、API 架构 |
服务端架构或 API 工作 |
| 移动应用开发者 |
iOS/Android, React Native, Flutter |
移动应用开发 |
| AI 工程师 |
ML 模型、LLM、RAG 系统、数据管道 |
任何 AI/ML 功能 |
| DevOps 自动化师 |
CI/CD、IaC、Kubernetes、监控 |
基础设施或部署工作 |
| 快速原型师 |
Next.js、Supabase、3 天 MVP |
快速验证或概念验证 |
| 高级开发者 |
Laravel/Livewire、高级实现 |
复杂或高级功能 |
设计部门 — “做美”
| 智能体 |
超能力 |
激活触发 |
| UI 设计师 |
视觉设计系统、组件库 |
界面设计或组件创建 |
| UX 研究员 |
用户测试、行为分析、画像 |
用户调研或可用性测试 |
| UX 架构师 |
CSS 系统、布局框架、技术 UX |
技术基础或架构 |
| 品牌守护者 |
品牌识别、一致性、定位 |
品牌策略或一致性审计 |
| 视觉叙事师 |
视觉叙事、多媒体内容 |
视觉内容或叙事需求 |
| 趣味注入师 |
微交互、愉悦感、个性 |
给 UX 加趣味和个性 |
| 图像提示词工程师 |
AI 图像生成提示词、摄影 |
AI 工具的摄影提示词 |
营销部门 — “做快”
| 智能体 |
超能力 |
激活触发 |
| 增长黑客 |
病毒式传播、漏斗优化、实验 |
用户获取或增长策略 |
| 内容创作者 |
多平台内容、编辑日历 |
内容策略或创作 |
| Twitter 互动官 |
实时互动、思想领袖 |
Twitter/X 活动 |
| TikTok 策略师 |
短视频爆款、算法优化 |
TikTok 增长策略 |
| Instagram 策展人 |
视觉叙事、美学打造 |
Instagram 活动 |
| Reddit 社区建设者 |
真实互动、价值驱动内容 |
Reddit 社区策略 |
| 应用商店优化师 |
ASO、转化优化 |
移动应用商店 |
| 社交媒体策略师 |
跨平台策略、活动 |
多平台社交活动 |
产品部门 — “做对的事”
| 智能体 |
超能力 |
激活触发 |
| Sprint 排序师 |
RICE 评分、敏捷规划、速度 |
Sprint 规划或待办梳理 |
| 趋势研究员 |
市场情报、竞争分析 |
市场调研或机会评估 |
| 反馈分析师 |
用户反馈分析、情感分析 |
用户反馈处理 |
项目管理部门 — “管好”
| 智能体 |
超能力 |
激活触发 |
| 工作室制片人 |
组合策略、高管编排 |
策略规划或组合管理 |
| 项目牧羊人 |
跨职能协调、利益相关方对齐 |
复杂项目协调 |
| 工作室运营 |
日常效率、流程优化 |
运营支持 |
| 实验追踪员 |
A/B 测试、假设验证 |
实验管理 |
| 高级项目经理 |
需求转任务、务实的范围界定 |
任务规划或范围管理 |
测试部门 — “证明能用”
| 智能体 |
超能力 |
激活触发 |
| 证据收集者 |
截图 QA、视觉证据 |
任何视觉验证需求 |
| 现实检验者 |
基于证据的认证、怀疑主义评估 |
最终集成测试 |
| 测试结果分析师 |
测试评估、质量指标 |
测试结果分析 |
| 性能基准师 |
压力测试、性能优化 |
性能测试 |
| API 测试员 |
API 验证、集成测试 |
API 端点测试 |
| 工具评估师 |
技术评估、工具选型 |
技术评估 |
| 工作流优化师 |
流程分析、效率提升 |
流程优化 |
运维支持部门 — “撑住”
| 智能体 |
超能力 |
激活触发 |
| 客服响应者 |
客户服务、问题解决 |
客户支持需求 |
| 数据分析师 |
数据分析、仪表盘、KPI 追踪 |
商业智能或报告 |
| 财务追踪员 |
财务规划、预算管理 |
财务分析或预算 |
| 基础设施运维师 |
系统可靠性、性能优化 |
基础设施管理 |
| 法务合规员 |
合规、法规、法律审查 |
法律或合规需求 |
| 高管摘要生成器 |
高管沟通、SCQA 框架 |
高管汇报 |
空间计算部门 — “身临其境”
| 智能体 |
超能力 |
激活触发 |
| XR 交互架构师 |
空间交互设计 |
AR/VR/XR 界面设计 |
| macOS 空间/Metal 工程师 |
Swift, Metal, 高性能 3D |
macOS 空间计算 |
| XR 沉浸式开发者 |
WebXR, 浏览器端 AR/VR |
浏览器端沉浸式体验 |
| XR 座舱交互专家 |
座舱式控件 |
沉浸式控制界面 |
| visionOS 空间工程师 |
Apple Vision Pro 开发 |
Vision Pro 应用 |
| 终端集成专家 |
CLI 工具、终端工作流 |
开发者工具集成 |
专项部门 — “连接一切”
| 智能体 |
超能力 |
激活触发 |
| 智能体编排者 |
多智能体流水线管理 |
任何多智能体工作流 |
| 数据分析师 |
商业智能、深度分析 |
深度数据分析 |
| LSP/索引工程师 |
Language Server Protocol、代码智能 |
代码智能系统 |
| 销售数据抽取智能体 |
Excel 监控、销售指标抽取 |
销售数据导入 |
| 数据汇总智能体 |
销售数据聚合、仪表盘报告 |
区域和销售代表报告 |
| 报告分发智能体 |
自动化报告分发 |
定时报告分发 |
附录 B:NEXUS 流水线状态报告模板
# NEXUS 流水线状态报告
## 流水线元数据
- **项目**:[名称]
- **模式**:[Full / Sprint / Micro]
- **当前阶段**:[0-6]
- **开始时间**:[时间戳]
- **预计完成**:[时间戳]
## 阶段进度
| 阶段 | 状态 | 完成度 | 门禁结果 |
|------|------|--------|---------|
| 0 - 发现 | 已完成 | 100% | 通过 |
| 1 - 策略 | 已完成 | 100% | 通过 |
| 2 - 基础 | 进行中 | 75% | 待定 |
| 3 - 构建 | 等待中 | 0% | — |
| 4 - 加固 | 等待中 | 0% | — |
| 5 - 上线 | 等待中 | 0% | — |
| 6 - 运营 | 等待中 | 0% | — |
## 当前阶段详情
**阶段**:第 [N] 阶段 - [名称]
**活跃智能体**:[列表]
**任务**:[已完成/总数]
**当前任务**:[ID] - [描述]
**QA 状态**:[通过/不通过/进行中]
**重试次数**:[N/3]
## 质量指标
- 首次通过的任务:[X/Y]([Z]%)
- 每任务平均重试次数:[N]
- 发现的严重问题:[数量]
- 已解决的严重问题:[数量]
## 风险登记
| 风险 | 严重度 | 状态 | 负责人 |
|------|--------|------|--------|
| [描述] | [P0-P3] | [活跃/已缓解/已关闭] | [智能体] |
## 下一步
1. [下一个动作]
2. [之后的步骤]
3. [即将到来的里程碑]
---
**报告生成时间**:[时间戳]
**编排者**:智能体编排者
**流水线健康度**:[正常 / 有风险 / 被阻塞]
附录 C:NEXUS 术语表
| 术语 |
定义 |
| NEXUS |
Network of EXperts, Unified in Strategy — 专家网络,统一策略 |
| 质量门禁 |
阶段之间的强制检查点,需要基于证据的批准 |
| 开发-测试循环 |
持续的开发-测试周期,每个任务必须通过 QA 才能继续 |
| 交接 |
智能体之间结构化的工作和上下文转移 |
| 守门人 |
有权批准或拒绝阶段推进的智能体 |
| 升级 |
任务重试用完后路由给更高权限处理 |
| NEXUS-Full |
全部智能体参与的完整流水线 |
| NEXUS-Sprint |
15-25 个智能体做功能/MVP 的聚焦流水线 |
| NEXUS-Micro |
5-10 个智能体做具体任务的定向激活 |
| 流水线完整性 |
没过质量门禁的阶段不能推进的原则 |
| 上下文连续性 |
每次交接都带完整上下文的原则 |
| 证据高于口说 |
质量评估需要证据而非口头声明的原则 |
评论