Files
sanguo_moziplus_v2/docs/research/distill-skills-v2/README.md
T
2026-05-27 00:12:16 +08:00

94 lines
4.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 对话历史蒸馏成果汇总(v2 — 四层金字塔)
> 日期:2026-05-27
> 数据源:庞统 1.2G(961 文件)+ 司马懿 751M410 文件)+ Sanguo Mail 80 封 + MEMORY.md
> 总片段:3,152 个(纠正 591 + 试错 226 + 成功 200 + 协作 873 + 决策分歧 1,241 + 经验声明 21)
---
## 四层金字塔产出
### L0 铁律(guardrails/)— 强制执行
| 文件 | 触发场景 | 核心规则 |
|------|---------|---------|
| **gate-flow.yaml** | 非平凡任务启动 | 需求不清不动手 / 根因不明不修复 / 方案未定不实现 / 评估影响才动手 |
| **no-circle-jerking.yaml** | 用户已明确方向后 | 不质疑前提 / 接受假设直接给方案 / "别绕了"= 立刻停 |
**来源**:① 纠正模式(33 次 + 20 次 = 最高频纠正)
### L2 引擎注入(prompt_templates/)— 按场景引导
| 文件 | 触发场景 | 核心内容 |
|------|---------|---------|
| **design-confirmation.md** | 发现实现与预期不符,准备修改时 | 先理解当前设计 → 确认意图 → 不确定就问 |
| **role-match-check.md** | 收到黑板广播任务,准备认领时 | 检查角色匹配 / 评审者不认领编码任务 |
| **inform-lightweight.md** | 收到 inform 类型邮件/通知时 | 纯通知不触发完整执行 / 不回复不耗 token |
**来源**:① 纠正 + ⑤ 决策分歧 + ④ 协作
### L3 Skillskills/)— 按需加载
| 文件 | 模式数 | 来源 | 核心内容 |
|------|--------|------|---------|
| **trial-and-error-patterns.md** | 6 | ② 试错(226 | Counter 生命周期 / 续杯 retry / 进程退出≠释放 / 广播路径一致 / JSON 解析验证 / 中断自检 |
| **proven-practices.md** | 9 | ③ 成功(200) | 先读后写 / 写完即验 / 结构化评审 / 交叉核实 / 状态机敬畏 / 调研深挖 / 简洁产出 / 续杯幂等 / 计划驱动 |
| **review-quality.md** | 4 | ①⑥ 评审经验 | 评审闭环含最终代码 / 枚举一致性 / 三层对照 / 自我纠正 |
| **self-reflection-wisdom.md** | 3 | ⑥ 经验声明(21) | 自我纠正 / 诚实边界 / 调研落地映射 |
### 黑板 Memoryexperiences)— 待积累
| 文件 | 条数 | 说明 |
|------|------|------|
| **distill-experiences-collaboration.json** | 119 | 协作模式经验,待积累到阈值后触发二级蒸馏 |
---
## 6 种扫描模式 → 四层金字塔映射
| 扫描模式 | 片段数 | L0 | L2 | L3 | Memory |
|---------|--------|----|----|-----|--------|
| ① 纠正 | 591 | 2 条 | 1 个 | 1 个 Skillreview-quality | — |
| ② 试错 | 226 | — | — | 1 个 Skilltrial-and-error | — |
| ③ 成功 | 200 | — | — | 1 个 Skillproven-practices | — |
| ④ 协作 | 873 | — | 2 个 | — | 119 条 |
| ⑤ 决策分歧 | 1,241 | — | 1 个 | — | — |
| ⑥ 经验声明 | 21 | — | — | 1 个 Skillself-reflection | — |
---
## 进化路径(对应课题6 闭环)
```
当前产出:
L0 铁律(2 条)← ① 纠正(高频明确)
L2 模板(3 个)← ①⑤ 纠正+决策分歧(中频场景)
L3 Skill(4 个)← ②③⑥ 试错+成功+经验声明
Memory(119 条)← ④ 协作(待积累)
未来进化:
Memoryexperiences 表)
↓ 累积 ≥ 5 条同类
L3 Skill(二级蒸馏)
↓ 引用 ≥ 2 次且采纳 > 50%
L2 引擎注入(固化到 prompt_templates
↓ 用户确认
L0 铁律(写入 guardrails.yaml
```
---
## 过程文档
| 文件 | 说明 |
|------|------|
| `docs/research/trajectory-distillation-research.md` | 调研方案(v1 |
| `docs/research/distill-reorg-v2.md` | 重组方案(v2,四层金字塔) |
| `docs/research/distill-scan-pangtong-result.json` | 庞统扫描结果 |
| `docs/research/distill-scan-simayi-result.json` | 司马懿扫描结果 |
| `docs/research/distill-scan-mail-result.json` | 邮件扫描结果 |
| `docs/research/distill-scan-memory-result.json` | MEMORY.md 提取 |
| `docs/research/distill-cards-batch1-corrections.md` | v1 批次1 卡片(参考) |
| `docs/research/distill-cards-batch2-simayi-mixed.md` | v1 批次2 卡片(参考) |
| `docs/research/distill-experiences-collaboration.json` | 协作 Memory |