auto-sync: 2026-05-27 09:08:55

This commit is contained in:
cfdaily
2026-05-27 09:08:55 +08:00
parent fbb0f33962
commit 0f00c05e2a
+69
View File
@@ -143,6 +143,75 @@ POST /api/projects/{pid}/tasks/{id}/comments {"comment_type": "handoff"}
**对齐 PRD v3.0**:这就是 "B3 共享意识" 的具体实现路径——Agent 自己写交接 + 黑板作为共享空间。
**⚠️ 重要发现:原始设计 architecture-v2.6 已有完整的 Handoff 设计**
`architecture-v2.6.md` 中课题2 + 课题4 已设计了完整的 Handoff 体系,当前 v2.8 方向和原始设计完全对齐,没有冲突。已实现的部分:
| 组件 | 原始设计状态 | 实现状态 |
|------|------------|----------|
| `comments``comment_type` 枚举含 `handoff` | ✅ 已设计 | ✅ 已实现(db.py) |
| `GET /comments?comment_type=handoff` API | ✅ 已设计 | ✅ 已实现(blackboard_routes.py |
| `blackboard.py comment --type handoff` CLI | ✅ 已设计 | ✅ 已实现 |
| `handoff.schema.json`completed + artifacts 必填) | ✅ 已设计 | ❌ 未实现 |
| `executor.md` 步骤5:写 Handoff Comment | ✅ 已设计 | ❌ 未实现(executor.md 不存在) |
| `executor.md` 前序信息:读 Handoff Comment | ✅ 已设计 | ❌ 未实现 |
| 三层约束体系(Schema 校验 + Skill 引导 + L1 截取) | ✅ 已设计 | ❌ 未实现 |
**v2.8 vs 原始设计的差异**
| 维度 | 原始设计(v2.6 课题4 | v2.8 新方案 |
|------|----------------------|------------|
| Prompt 注入方式 | `executor.md` 模板(固定步骤) | 身份+能力+约束(自主决策) |
| Handoff 写入方式 | `blackboard.py CLI --handoff` + Schema 校验 | API 调用 + Prompt 约束 |
| Handoff 格式 | 结构化 JSONcompleted + artifacts + remaining + next_steps | 自由文本(决策/权衡/坑/建议),≤500 字 |
| 上下文传递 | Opal-Bridge Fidelity 三档(无损/摘要/混合) | LLM Wiki grep summary(第 1 级) |
**关键差异**:原始设计用 Schema 强约束 handoff 格式(必填 completed + artifacts),v2.8 方向倾向于更灵活的自由文本。这两个可以合并——**保留 Schema 作为可选结构化字段,同时允许自由文本 body**。
### 司马懿评审问题的优秀实践参考
#### 问题 1:Agent 自主决策但不知道该干什么
**原始设计已覆盖**architecture-v2.6 课题4 的四层上下文架构:
- L0 铁律(不变的安全红线)
- L1 角色身份(SOUL.md
- L2 引擎注入(任务上下文 + API 列表 + 约束)
- L3 被动参考(Skill description + 知识注入)
**v2.8 的做法**:把 L2 从固定步骤改为能力+约束声明。Agent 自己决定步骤,但 L0+L2 的约束保证它不会跑偏。
**验证方法**(司马懿建议):v2.9 上线后跑 5 个测试 task,观察 Agent 行为。
#### 问题 2:Agent 偏离轨道(防偏离)
**原始设计已覆盖**architecture-v2.6 §防偏离三防线:
1. **每轮重新注入目标** → L2 引擎注入任务上下文
2. **不信任 Agent 自述** → Output Guard + Scope GuardL1 验证脚本 + L2 AI 审查)
3. **Runaway Guard** → tasks 表 `max_ticks` 字段(默认 100),超限自动暂停
**OpenAI Agents SDK 参考**wiki-vault 已蒸馏):Guardrail 分三层:
- 输入 Guardrail:便宜快速模型预检
- 输出 Guardrail:最终产出检查
- 工具 Guardrail:每次函数调用前后检查
**v2.8 对齐**Daemon 侧的 guardrail 不随 Agent 自主度增加而削弱。Runaway Guard 在 v2.7 中未实现,v2.9 可以补上。
#### 问题 3:确保 Agent 写了 handoff
**两个层面**
1. **Prompt 约束**(软):告诉 Agent 必须写
2. **Review 检查**(硬):review 流程中检查是否有 handoff comment
3. **Schema 校验**(原始设计):`handoff.schema.json` 校验必填字段
**建议**:三层都用——Prompt 告诉它写,Schema 校验格式,Review 检查存在。
#### 问题 4OpenAI Swarm / AutoGen / ReAct(司马懿建议补充调研)
**当前结论**:这三个是次要参考,不影响核心方向。
- **OpenAI Swarm**:已通过 openai-agents-sdk 调研覆盖(wiki-vault 有蒸馏)。Handoff vs Agents-as-Tools 的选择对我们有参考
- **AutoGen**:多 Agent 对话协作,和我们的黑板模式不同方向(对话式 vs 黑板式)
- **ReAct**:思考-行动循环,和 v2.8 的 "Agent 自主读黑板→想→干→写回" 本质相同
### v2.9 的一部分:知识注入(复用 LLM Wiki)
**不需要新建知识库。** LLM Wiki 已有 273 页 wiki-vault + 118 个 practices 页面,就是现成的 L3 知识层。