# 调研报告:AI 决策者参与 + 经验沉淀闭环 > 调研时间:2026-05-15 > 调研范围:Hermes v0.13、Claude Code Agent Teams、GSD Wave Execution、OpenAI Agent SDK Guardrails、MetaGPT、nuwa-skill、claude-mem 等 --- ## 课题 1:AI 决策者有效参与 ### 1.1 已有经验(知识库/wiki) 知识库中无直接相关的实践经验。知识库主要包含 OpenClaw Agent 模板(awesome-openclaw-agents),其中涉及 coordinator 模式的有: - `family-coordinator/SOUL.md`:家庭协调员模式,但偏向任务调度而非质量门控 - `incident-responder/README.md`:事件响应模式,有升级机制但非实时决策参与 **结论**:需要从业界实践中提炼适合 moziplus Blackboard 架构的决策者参与机制。 ### 1.2 业界优秀实践对比表 | 项目 | 架构模式 | 决策者角色 | 防偏离机制 | 防蔓延机制 | 故障处理 | 介入时机 | |------|----------|-----------|-----------|-----------|---------|---------| | **Hermes v0.13** | Kanban Board(持久多 Agent 看板) | 无显式 coordinator,靠系统级保护 | 幻觉门控(Hallucination Gate):验证完成声明才关闭任务 | Per-task retry budget 限制单任务重试次数 | 僵尸检测 + 自动回收 + 不完整退出自动阻塞 | 心跳超时 → 回收;幻觉检测 → 阻塞关闭 | | **Claude Code Agent Teams** | Lead + Teammates(coordinator 模式) | Lead Agent 负责:分解任务、分配、监控输出、解决冲突 | Lead 监控每个 subagent 输出,解决依赖冲突 | Task decomposition 即为范围限定,subagent 只拿相关 context | Subagent 失败由 Lead 感知并处理 | 每个 subagent 完成时介入审查 | | **GSD (get-shit-done)** | Planner → Executor → Verifier 三角色 | Planner 做分解和验证计划;Verifier 做独立验收 | must_haves(前置条件)+ goal-backward verification(目标回溯验证) | 每个 task 有原子 commit,可独立 revert | Verifier 独立 context 验收,不通过则生成 fix plan | Executor 完成后 Verifier 独立审查 | | **OpenAI Agent SDK** | Guardrails 模式 | 无显式 coordinator,靠 input/output guardrails | Input guardrail:并行执行输入检查,快速失败 | Output guardrail:验证 agent 输出合规性 | Tripwire 机制:检测到违规立即中断 | 每次 agent 输入/输出时并行检查 | | **MetaGPT** | SOP 编码 + Role-based | Engineer Agent 作为隐式 supervisor,每个 role 按 SOP 产出 | 共享消息池(Message Pool),Agent 监控环境观察 | SOP 编码为 prompt 序列,严格定义每步产出 | 每个 Agent 发布消息到共享池,下游 Agent 可拒绝不符合规范的输入 | 每个角色产出时,下游消费者隐式审查 | ### 1.3 关键机制深度分析 #### 1.3.1 Hermes v0.13 — 系统级韧性(不依赖 coordinator) Hermes v0.13 的核心创新是"不信任 Agent 的完成声明",通过多层系统级保护确保任务完整性: - **心跳检测(Heartbeat)**:Agent 领取任务后必须定期发送心跳,超时未发送则标记为"可能停滞" - **僵尸检测(Zombie Detection)**:检测已分配但长时间无进展的任务,自动标记 - **回收机制(Reclaim)**:僵尸任务被回收回看板,可被其他 Agent 重新领取 - **幻觉门控(Hallucination Gate)**:Agent 声称"完成"时,系统验证实际产出(如补丁是否真正落地),验证通过才关闭任务 - **Per-task Retry Budget**:每个任务有独立重试预算,防止单任务无限循环 - **不完整退出自动阻塞(Auto-block)**:Agent 异常退出时自动阻塞该任务,不会静默失败 **适用场景**:适合 moziplus Daemon 层面的保护机制——Daemon 不做决策,但做系统级保护。 #### 1.3.2 Claude Code Agent Teams — Lead 主动协调 Claude Code 的 Agent Teams 模式采用显式 Lead(coordinator): - **Lead Agent** 职责: 1. 接收用户需求并分解为子任务 2. Spawn teammates,每个 teammate 拿到特定 context 3. 监控各 teammate 输出 4. 解决 teammate 间的依赖冲突 5. 合成最终结果 - **关键约束**:Lead 通过 `Agent(agent_type)` 语法限制可 spawn 的 subagent 类型 - **Context 隔离**:每个 subagent 只拿到相关 context,防止信息泄露和范围蔓延 - **配置示例**: ```yaml --- name: coordinator description: Coordinates work across specialized agents tools: Agent(worker, researcher), Read, Bash --- ``` **适用场景**:适合 moziplus 中庞统作为 coordinator 的角色定义。 #### 1.3.3 GSD Wave Execution — 三角色流水线 GSD 的核心是 Planner → Executor → Verifier 的严格流水线: - **Planner**: - 输出 PLAN.md(含 must_haves 前置条件) - 依赖分析 + wave 分组(同 wave 并行执行) - goal-backward verification(从目标回推验证计划完整性) - **Executor**: - 每个 task 获得独立 200k token context - 原子 commit(每个 task 独立提交) - 不读其他 executor 的 context - **Verifier**: - 独立 context 审查 - 读取 SUMMARY + must_haves 验证 - 不通过则输出 fix plan,可直接重执行 **适用场景**:适合 moziplus 的"分阶段编排"模式,特别是需要质量门控的场景。 #### 1.3.4 OpenAI Agent SDK Guardrails — 并行验证层 OpenAI 的 Guardrails 不依赖特定角色,而是通过 input/output 两层验证: - **Input Guardrail**:在 agent 执行前并行检查输入(如注入检测、范围校验) - **Output Guardrail**:在 agent 输出后验证合规性 - **Tripwire**:检测到严重违规时立即中断执行 - **关键原则**:验证逻辑放在产生副作用的地方,而非仅靠 agent 级别的 input/output guardrail - **并行执行**:guardrail 与 agent 执行并行,不阻塞正常流程 **适用场景**:适合 moziplus 黑板上的"观察者"模式——在黑板写入时并行验证。 ### 1.4 推荐方案(结合 AI Native 目标) 基于以上分析,推荐采用 **"系统保护层 + Coordinator 主动介入" 双轨制**: #### 方案架构 ``` ┌─────────────────────────────────────────────────┐ │ Blackboard (黑板) │ │ observations | decisions | tasks | experiences │ └──────────┬──────────────────────────┬───────────┘ │ │ ┌────────▼────────┐ ┌────────▼────────┐ │ Daemon 保护层 │ │ Coordinator 层 │ │ (系统级,不决策) │ │ (庞统,主动决策) │ │ │ │ │ │ • 心跳检测 │ │ • 任务分解验证 │ │ • 僵尸回收 │ │ • 输出质量审查 │ │ • 幻觉门控 │ │ • 冲突调解 │ │ • Retry budget │ │ • 范围仲裁 │ └─────────────────┘ └─────────────────┘ ``` #### 具体机制设计 **第一层:Daemon 系统保护(类似 Hermes)** | 机制 | 触发条件 | 行为 | |------|---------|------| | 心跳检测 | Agent 领取节点后 N 分钟无更新 | 标记为"停滞" | | 僵尸回收 | 停滞超过阈值 | 回收任务到待分配池 | | 幻觉门控 | Agent 提交完成声明 | 验证 output.md 是否存在且非空,验证结论 JSON 格式正确 | | Retry Budget | 单节点重试超过 N 次 | 标记为失败,通知 coordinator | **第二层:Coordinator 主动介入(类似 Claude Code Lead + GSD Verifier)** | 介入时机 | 介入方式 | 说明 | |---------|---------|------| | 任务创建时 | 分解验证 + must_haves 定义 | 确保每个节点任务有明确的成功标准 | | 节点产出时 | 输出审查 + 范围校验 | 检查是否偏离原始需求 | | 依赖冲突时 | 仲裁 + 调解 | 解决 Agent 间的矛盾输出 | | 节点失败时 | 根因分析 + 重规划 | 决定是重试、降级还是放弃 | | 任务完成时 | 整体验收 + 经验提取 | 运行 Verifier 角色,提取经验写入黑板 | **第三层:Guardrails(类似 OpenAI Agent SDK)** 在黑板写入时并行验证: - **范围守卫**:Agent 写入 decisions 时,检查是否超出任务 scope - **格式守卫**:验证写入数据的格式和完整性 - **冲突守卫**:检测与已有 decisions 的矛盾 #### 防偏离策略 1. **must_haves 继承**:每个节点任务从父任务继承 must_haves,coordinator 在创建时定义 2. **目标回溯验证**:任务完成后,从最终目标回溯验证每个节点的贡献 3. **范围声明**:每个 Agent 在开始工作前必须声明"我计划做什么",coordinator 确认后才开始 #### 防蔓延策略 1. **原子任务**:每个节点任务有明确的输入/输出契约 2. **Context 隔离**:Agent 只能读取被授权的黑板区域 3. **单次写入**:Agent 只能写入自己负责的 decisions 条目 4. **超时机制**:每个节点有预估工时,超时自动升级到 coordinator #### 故障处理策略 | 故障类型 | 检测方式 | 处理方式 | |---------|---------|---------| | Agent 崩溃 | 心跳超时 | 自动回收 + 重新分配 | | Agent 幻觉 | 幻觉门控 | 阻塞关闭 + 要求补充验证 | | 产出质量差 | Coordinator 审查 | 打回重做 + 给出改进方向 | | 需求偏离 | 范围守卫 | 暂停 + coordinator 仲裁 | | 依赖阻塞 | 超时检测 | coordinator 重新编排依赖 | --- ## 课题 6:经验沉淀闭环 ### 2.1 已有经验(知识库/wiki) 知识库中无直接相关的经验沉淀实践。但 OpenClaw 体系中已有: - **MEMORY.md**:每个 agent 的记忆文件(四类记忆法:user/feedback/project/reference) - **知识库**:`~/.openclaw/knowledge_base/` 目录,但目前只存基础数据 ### 2.2 业界优秀实践对比表 | 项目 | 闭环模型 | 信息源 | 蒸馏过程 | 经验载体 | 反哺机制 | |------|---------|-------|---------|---------|---------| | **Claude Code Memory** | 四类记忆法 | Agent 工作过程中的自动观察 | Agent 自行判断何为值得记录的 → 写入 MEMORY.md | Markdown(MEMORY.md,按 user/feedback/project/reference 分类) | 每次 session 启动时自动加载到 context | | **Hermes Learning Loop** | 闭环学习(五层) | 任务执行过程、对话历史 | 复杂任务完成 → 自动创建 SKILL.md;使用中自改进;FTS5 跨 session 搜索 + LLM 摘要 | SKILL.md(步骤化菜谱)+ Honcho dialectic model(12 层用户建模) | 新任务自动检索相关 SKILL;periodic nudges 主动推送遗忘的知识 | | **nuwa-skill** | 五阶段蒸馏管线 | 公开数据源(文章、演讲、推文) | Phase 1 实体发现 → Phase 2 数据采集 → Phase 3 心智模型提取(3-7个 + 5-10条决策启发式 + 表达DNA + 反模式 + 诚实边界) → Phase 4 验证(3 个已知问题 + 1 个未知问题) → Phase 5 双 Agent 精炼 | SKILL.md(心智操作系统) | 生成的 Skill 可被 Agent 直接加载使用;Darwin.skill 持续进化(八维评估 + 棘轮机制) | | **claude-mem** | 三层工作流 | Agent session 全程捕获 | 捕获 → AI 压缩 → 相关性注入 | 结构化 memory 文件 + FTS 索引 | 4 个 MCP 工具按需检索注入 context | | **GSD** | Spec-driven | Plan → Execute → Verify 流水线 | Planner 的经验沉淀为更好的 plan template | PLAN.md 模板 + must_haves 模式 | 每个 phase 的 plan 模板可复用 | ### 2.3 关键机制深度分析 #### 2.3.1 Claude Code Memory — 四类记忆法 Claude Code 的记忆体系分为四个类别: 1. **User Memory**:用户角色和偏好("用户喜欢用 TypeScript") 2. **Feedback Memory**:用户纠正 Agent 错误的记录("不要用 var,用 let/const") 3. **Project Memory**:项目关键决策和架构选择("我们用 monorepo") 4. **Reference Memory**:文件位置和结构("配置在 src/config/") **关键设计决策**: - Agent **自行判断**什么值得记录(不是什么都记) - 写入门槛高:只记录不能从代码推导的信息 - Auto memory 机制:Agent 在工作时自动积累,无需用户手动维护 - Subagent 也可以维护自己的 auto memory **局限**: - 无显式蒸馏过程(只记录不蒸馏) - 无跨项目经验迁移 - 无质量验证机制(可能记录错误的"经验") #### 2.3.2 Hermes Learning Loop — 五层闭环 Hermes 是目前最完整的 Agent 学习闭环实现,包含五个层次: 1. **Agent-curated Memory + Periodic Nudges** - Agent 自主管理记忆 - 定期"轻推"自己回忆可能遗忘的知识 - 避免长 session 中上下文退化 2. **Autonomous Skill Creation** - 完成复杂任务后,自动将解决步骤写入 SKILL.md - 本质是"做过的事变成可复用的菜谱" 3. **Skill Self-improvement During Use** - 使用 Skill 时,根据实际效果自动改进 - 类似"边用边学" 4. **FTS5 Cross-session Recall + LLM Summarization** - 全文搜索(FTS5)索引所有历史 session - LLM 自动摘要,提取跨 session 可复用的知识 - 新任务可搜索历史相似场景 5. **Honcho Dialectic User Modeling** - 可选的用户建模层 - 通过 12 个身份层建模用户偏好 - "辩证法"建模:同时建模用户和 Agent 的关系 **关键洞察**:Hermes 的闭环核心是"记忆 → Skill → 搜索 → 改进"的持续循环。 #### 2.3.3 nuwa-skill — 五阶段蒸馏管线 nuwa-skill 的蒸馏管线从原始数据到可复用 Skill 经过五个阶段: **Phase 1:Entity Discovery(实体发现)** - 输入:一个名字 - 处理:通过搜索发现该人物的存在维度、领域、公开数据源 - 产出:候选数据源列表 **Phase 2:Data Collection(数据采集)** - 输入:数据源列表 - 处理:采集文章、演讲、推文、访谈等原始材料 - 产出:原始语料库 **Phase 3:Cognitive DNA Extraction(认知 DNA 提取)** - 输入:原始语料 - 处理:提取心智模型(3-7个)、决策启发式(5-10条)、表达 DNA、价值观与反模式、诚实边界 - 方法论:三重验证(跨域存在性 + 预测力 + 排他性) - 产出:SKILL.md 草稿 **Phase 4:Quality Verification(质量验证)** - 输入:SKILL.md 草稿 - 处理:用 3 个该人物公开回答过的问题测试(方向一致性);用 1 个未讨论过的问题测试(适度不确定性) - 产出:验证通过的 SKILL.md **Phase 5:Dual-Agent Refinement(双 Agent 精炼)** - 输入:验证通过的 SKILL.md - 处理:一个 Agent 扮演该人物使用 Skill,另一个 Agent 评估表现 - 结合 Darwin.skill 的八维评估 + 棘轮机制(只保留改进,自动回退退化) - 产出:最终 SKILL.md **关键创新**: - "蒸馏的是思维方式,不是行为模仿" - 三重验证确保提取的心智模型是真实的 - 诚实边界:明确声明 Skill 的局限 ### 2.4 推荐方案(结合 AI Native 目标) 基于以上分析,推荐采用 **"DISCOVER → DISTILL → VERIFY → APPLY → IMPROVE" 五阶段闭环**: #### 闭环架构 ``` ┌──────────────────────────────────────────────┐ │ │ ▼ │ DISCOVER ──→ DISTILL ──→ VERIFY ──→ APPLY ──→ IMPROVE │ │ │ │ │ │ 黑板 │ 蒸馏器 │ 验证器 │ 执行器 │ 进化器 │ observations │ │ │ │ │ decisions │ │ │ │ │ task_outputs │ │ │ │ └──────────────┘ │ │ │ ▼ ▼ ▼ Skill Store 下次任务 Skill 自改进 ``` #### 阶段一:DISCOVER(信息发现) **信息源**(按价值排序): | 信息源 | 采集方式 | 价值 | |-------|---------|------| | 黑板 decisions | 自动记录 Agent 决策过程和理由 | 高 | | 节点 output.md | 任务完成后的产出文件 | 高 | | Coordinator 审查记录 | 庞统审查时的问题和修正 | 高 | | 错误与修正 | 幻觉门控拦截、Coordinator 打回重做 | 极高 | | Agent 间协作 | 黑板 observations 中的交互记录 | 中 | | 重试历史 | Retry budget 消耗记录 | 中 | **写入黑板 experiences 表**: ```json { "experience_id": "exp-001", "source": "node_output", "task_id": "task-123", "node_id": "coding", "timestamp": "2026-05-15T10:00:00Z", "raw_data": { ... }, "tags": ["error-handling", "vnpy-strategy", "backtest"], "status": "discovered" } ``` #### 阶段二:DISTILL(蒸馏) 蒸馏过程分为两级: **一级蒸馏(实时,每个任务完成后)**: - **执行者**:完成任务后的 Agent 自动触发 - **过程**: 1. 从 output.md 提取关键决策和理由 2. 从错误修正中提取"教训" 3. 压缩为结构化经验条目(200-500 字) - **产出**:经验条目写入黑板 experiences 表,status = "distilled" **二级蒸馏(周期性,由 Coordinator 触发)**: - **执行者**:Coordinator(庞统)或专用蒸馏 Agent - **过程**(参考 nuwa-skill 三重验证): 1. 聚合同类经验(按 tag 聚合) 2. 提取心智模型(这类问题的通用解决模式) 3. 提取决策启发式(遇到 X 情况,优先考虑 Y) 4. 提取反模式(遇到 X 情况,千万不要 Z) 5. 标注诚实边界(这些经验的适用范围) - **产出**:Skill 草稿或 Rule 更新 **蒸馏格式**(参考 nuwa-skill SKILL.md 结构): ```markdown # Skill: [名称] ## 心智模型 - [模型1]: [描述] - [模型2]: [描述] ## 决策启发式 - [情况X] → 优先考虑 [Y] - [情况A] → 避免使用 [B] ## 反模式 - ❌ [错误做法]: [为什么错] ## 诚实边界 - 本 Skill 适用于 [场景] - 不适用于 [场景] ``` #### 阶段三:VERIFY(验证) **验证方式**(参考 nuwa-skill Phase 4 + Hermes 幻觉门控): 1. **已知场景回测**:用 3 个历史类似任务测试 Skill 是否给出正确建议 2. **未知场景测试**:用 1 个新场景测试 Skill 是否表现出适度不确定性 3. **Coordinator 审核**:庞统审查 Skill 的逻辑合理性 4. **自动格式验证**:JSON Schema 校验 Skill 结构完整性 **验证通过** → status = "verified",写入 Skill Store **验证失败** → 回到 DISTILL 重新蒸馏或丢弃 #### 阶段四:APPLY(应用) **反哺机制**: | 应用方式 | 触发时机 | 机制 | |---------|---------|------| | Context 注入 | Agent 接受节点任务时 | 在任务 prompt 中注入相关 Skill 的摘要 | | FTS5 搜索 | Agent 遇到困难时 | Agent 可主动搜索历史经验 | | Planner 参考 | Coordinator 分解任务时 | 参考历史类似任务的经验 | | Guardrail 规则 | 黑板写入时 | 经验转化为 guardrail 规则 | **关键设计**: - 不是所有经验都注入 context(token 成本) - 按相关性排序,只注入 top-K 相关经验 - 经验注入是建议性的,不强制 Agent 遵循 #### 阶段五:IMPROVE(进化) **进化机制**(参考 Hermes skill self-improvement + nuwa-skill Darwin 棘轮机制): 1. **使用反馈收集**:Skill 被引用时,记录 Agent 是否采纳了建议 2. **效果追踪**:采纳 Skill 建议的任务 vs 未采纳的任务,成功率对比 3. **定期回顾**:Coordinator 定期审查 Skill Store,淘汰低效 Skill 4. **棘轮机制**:Skill 只能进化为更好的版本,改进才保留,退化自动回退 **Skill 生命周期**: ``` discovered → distilled → verified → active → deprecated ↑ │ └── improved ┘ ``` #### 黑板 experiences 表设计 ```json { "table": "experiences", "schema": { "experience_id": "string (uuid)", "source": "enum(node_output, coordinator_review, error_correction, collaboration)", "task_id": "string (foreign key to tasks)", "node_id": "string", "timestamp": "datetime", "tags": "string[]", "raw_summary": "text (一级蒸馏结果)", "skill_id": "string|null (关联的 Skill)", "status": "enum(discovered, distilled, verified, active, deprecated)", "usage_count": "integer (被引用次数)", "effectiveness_score": "float|null (效果评分 0-1)", "verified_at": "datetime|null", "verified_by": "string|null" } } ``` ### 2.5 实施优先级 | 优先级 | 机制 | 复杂度 | 价值 | |-------|------|-------|------| | P0 | 一级蒸馏(任务完成自动提取) | 低 | 高 | | P0 | experiences 表写入 | 低 | 高 | | P1 | 幻觉门控 + 心跳检测(系统保护) | 中 | 高 | | P1 | Coordinator must_haves 定义 | 低 | 高 | | P2 | 二级蒸馏(周期性 Skill 生成) | 高 | 高 | | P2 | FTS5 搜索 + Context 注入 | 中 | 中 | | P3 | Skill 进化 + 棘轮机制 | 高 | 中 | | P3 | Guardrails 自动生成 | 高 | 中 | --- ## 附录:项目参考链接 | 项目 | 链接 | 核心价值 | |------|------|---------| | Hermes v0.13 | https://github.com/NousResearch/hermes-agent | 系统级韧性机制(心跳/僵尸/幻觉门控)+ 闭环学习 | | Claude Code Agent Teams | https://code.claude.com/docs/en/agent-teams | Lead coordinator 模式 + subagent 编排 | | Claude Code Memory | https://code.claude.com/docs/en/memory | 四类记忆法 | | Claude Code Subagents | https://code.claude.com/docs/en/sub-agents | 自定义 subagent + coordinator 定义 | | GSD (get-shit-done) | https://github.com/gsd-build/get-shit-done | Wave Execution + Planner/Executor/Verifier | | OpenAI Agent SDK Guardrails | https://openai.github.io/openai-agents-python/guardrails/ | Input/Output guardrails + tripwire | | MetaGPT | https://github.com/FoundationAgents/MetaGPT | SOP 编码 + 角色协作 | | nuwa-skill | https://github.com/alchaincyf/nuwa-skill | 五阶段蒸馏管线 + Cognitive DNA | | claude-mem | https://github.com/thedotmack/claude-mem | 持久记忆 + 三层检索 |