auto-sync: 2026-05-27 00:04:42

2026-05-27 00:04:42 +08:00
parent 70e7dd5473
commit 0c6608aa09
2 changed files with 716 additions and 395 deletions
@@ -0,0 +1,174 @@
+# 蒸馏 Skill 重新组织方案（v2）
+
+> 日期：2026-05-27
+> 状态：待主公确认后执行 Step 3-4 重跑
+
+---
+
+## 核心洞察
+
+之前的组织**按"能力领域"分**（执行纪律/评审质量/系统设计……），导致：
+1. 扫描模式与 Skill 对不上（Agent 不知道"我被纠正了"该加载哪个 Skill）
+2. 经验层次不清晰（高频铁律和低频记忆混在一起）
+3. 无法复用 moziplus v2.0 的**四层金字塔 + 三级载体**架构
+
+## 新组织方式：6 种扫描模式 × 4 层金字塔
+
+| 扫描模式 | 数据量 | → L0 铁律 | → L2 引擎注入 | → L3 Skill | → 黑板 Memory |
+|---------|--------|---------|-------------|-----------|-------------|
+| ① 纠正（591） | 高频明确 | ✅ 高频纠错（GATE流程） | ✅ 典型错误模式 | ❌ | |
+| ② 试错（226） | 中频可复用 | ❌ | ✅ 绕坑指南 | ✅ 试错模式 | |
+| ③ 成功（200） | 未知（未处理） | ❌ | ❌ | ✅ 最佳实践 | |
+| ④ 协作（873） | 低频非通用 | ❌ | ❌ | ❌ | ✅ 协作经验（待蒸馏） |
+| ⑤ 决策分歧（1241） | 高频模糊 | ❌ | ✅ 决策门控 | ❌ | |
+| ⑥ 经验声明（21） | 低频已提炼 | ❌ | ❌ | ✅ 自我总结 | |
+
+### L0 铁律（guardrails.yaml / prompt_templates/）
+
+**筛选标准**：
+- 高频（出现 ≥ 20 次）
+- 结论明确（"必须/禁止"）
+- 违反后果严重（P0 级别 bug / 用户极度沮丧）
+
+**候选**：
+- GATE 流程门控（33 次）
+- 不绕圈子（17+3=20 次，用户极度沮丧）
+
+### L2 引擎注入（prompt_templates/ + 相关 Memory）
+
+**筛选标准**：
+- 中频（5-19 次）
+- 有明确触发场景
+- 可模板化为"当 X 时，先 Y"
+
+**候选**：
+- 先确认当前设计再改（6 次）
+- 角色匹配检查（20+ 次，协作模式中）
+- inform 邮件轻量处理
+
+### L3 Skill（skills/ 目录）
+
+**筛选标准**：
+- 可复用流程（有步骤）
+- 有边界条件（适用/不适用）
+- 需要按需加载
+
+**候选**：
+- 试错模式（counter 生命周期、续杯 retry、进程管理）
+- 成功模式（待提炼）
+- 经验声明（自我纠正、诚实边界）
+
+### 黑板 experiences（experiences 表）
+
+**筛选标准**：
+- 低频（< 5 次）
+- 非通用（特定协作场景）
+- 待观察（先存起来，看是否积累到可蒸馏阈值）
+
+**候选**：
+- 大部分协作模式细节
+- 决策分歧中的个别案例
+
+---
+
+## 具体产出预判
+
+### L0 铁律：2 条
+
+| # | 铁律 | 来源模式 | 内容 |
+|---|------|---------|------|
+| 1 | GATE 流程门控 | ① 纠正（33 次） | 需求不清不动手 / 根因不明不修复 / 方案未定不实现 / 评估影响范围才动手 |
+| 2 | 不绕圈子 | ① 纠正（17+3=20 次） | 接受用户前提假设，直接给方案；不要重复讨论已确认过的问题 |
+
+### L2 引擎注入：3 条
+
+| # | 模板 | 来源模式 | 内容 |
+|---|------|---------|------|
+| 1 | 设计确认模板 | ① 纠正（6 次） + ⑤ 决策分歧 | "实现前先查阅已有设计文档，对已确定决策保持尊重；不确定时问用户确认" |
+| 2 | 角色匹配检查 | ④ 协作（20+ 次） | "认领任务前检查角色匹配：评审/审查类角色不应认领编码任务" |
+| 3 | inform 轻量处理 | ④ 协作（2 次） | "inform 类型邮件让 Agent 感知但不做完整执行" |
+
+### L3 Skill：4 个
+
+| Skill | 来源模式 | 说明 |
+|-------|---------|------|
+| trial-and-error-patterns | ② 试错（226） | counter/锁生命周期、续杯 retry、进程退出≠资源释放、广播路径一致、JSON 解析验证 |
+| proven-practices | ③ 成功（200） | 待提炼：编码/流程最佳实践 |
+| self-reflection-wisdom | ⑥ 经验声明（21） | 自我纠正、诚实边界、调研落地映射 |
+|评审质量 | ① 纠正 + ⑥ 经验 | 评审闭环、枚举一致性、三层对照、自我纠正（从 batch2 代码评审知识中提炼） |
+
+### 黑板 Memory：1 个表
+
+- **experiences 表**：容纳所有低频、非通用经验，待积累到阈值后触发二级蒸馏
+
+---
+
+## 与 moziplus v2.0 架构的对应
+
+| moziplus 架构 | 对应扫描模式 | 对应产出 |
+|-------------|-------------|---------|
+| **L0 铁律（guardrails.yaml）** | ① 纠正（高频明确） | GATE 流程门控、不绕圈子 |
+| **L2 引擎注入（prompt_templates/）** | ①⑤ 纠正+决策分歧（中频模糊） | 设计确认模板、角色匹配检查 |
+| **L3 Skill（skills/ 目录）** | ②③⑥ 试错+成功+经验声明 | trial-and-error-patterns、proven-practices、self-reflection-wisdom、评审质量 |
+| **黑板 experiences** | ④ 协作（低频非通用） | experiences 表 |
+
+---
+
+## 与课题6 闭环的关系
+
+| 课题6 阶段 | 对应扫描模式 | 对应产出 |
+|-----------|-------------|---------|
+| **DISCOVER** | 全部 6 种 | 本次扫描已做 |
+| **一级蒸馏（Memory）** | 全部 6 种 | experiences 表（低频/非通用） |
+| **二级蒸馏（Skill）** | ②③⑥ | L3 Skill（试错/成功/经验声明） |
+| **固化（Rule）** | ① | L0 铁律 + L2 引擎注入 |
+
+---
+
+## 执行计划
+
+### Step 3（重新）——按新的组织方式归纳
+
+**批次调整**：
+- 批次 1：庞统 + 司马懿的 ①⑤ 纠正+决策分歧 → 提炼 L0 铁律 + L2 引擎注入
+- 批次 2：庞统 + 司马懿的 ② 试错 → 提炼 L3 Skill trial-and-error-patterns
+- 批次 3：庞统 + 司马懿的 ③ 成功（新增） → 提炼 L3 Skill proven-practices
+- 批次 4：庞统 + 司马懿的 ⑥ 经验声明 → 提炼 L3 Skill self-reflection-wisdom
+- 批次 5：庞统 + 司马懿的 ④ 协作 → 直接写入 experiences 表（不提炼）
+
+**并发限制**：主公说并发 ≤ 2，分批跑：
+- 先跑批次 1（L0+L2，优先级最高）
+- 同时跑批次 2（L3，试错模式重要）
+- 完成后跑批次 3-5
+
+### Step 4（重新）——按四层金字塔输出
+
+**输出目录**：
+```
+moziplus_v2/
+├── guardrails/
+│   ├── gate-flow.yaml          ← L0 铁律
+│   └── no-circle-jerking.yaml  ← L0 铁律
+├── prompt_templates/
+│   ├── design-confirmation.md ← L2 引擎注入
+│   ├── role-match-check.md     ← L2 引擎注入
+│   └── inform-lightweight.md   ← L2 引擎注入
+├── skills/
+│   ├── trial-and-error-patterns.md ← L3 Skill
+│   ├── proven-practices.md          ← L3 Skill
+│   ├── self-reflection-wisdom.md    ← L3 Skill
+│   └── review-quality.md            ← L3 Skill（从 batch2 代码评审知识复用）
+└── docs/research/distill-skills-v2/
+    └── README.md（新的汇总）
+```
+
+---
+
+## 主公确认
+
+这个新的组织方式：
+1. **复用了 moziplus v2.0 的四层金字塔**——经验层次清晰
+2. **6 种扫描模式有明确归宿**——Agent 知道经验从哪来、放哪层
+3. **L0/L2/L3/experiences 四路分流**——高频固化、中频模板化、低频文档化、待观察存表
+
+对吗？确认后我重跑 Step 3-4。