Files
sanguo_moziplus_v2/docs/research/distill-v2-batch1-summary.md
2026-05-27 00:07:49 +08:00

3.8 KiB
Raw Permalink Blame History

蒸馏 v2 批次1 汇总 — L0 铁律 + L2 引擎注入

生成时间:2026-05-27 数据源:批次1(庞统纠正 14 张卡片)+ 批次2(司马懿纠正+经验 15 张卡片)


L0 铁律(guardrails/

文件 名称 纠正频率 严重度 核心规则
gate-flow.yaml GATE 流程门控 33+ (批次1) high 需求不清不动手,根因不明不修复,方案未定不实现,评估影响范围才动手
no-circle-jerking.yaml 不绕圈子 20 (17+3) high 用户明确方向后不质疑前提,直接给方案,"别绕了"=已讨论过

筛选依据

  • GATE 门控:33 次(批次1卡片14),覆盖面最广,违反后果最严重(方向错误→大量返工)
  • 不绕圈子:17 次(批次1卡片2)+ 3 次(批次2卡片13)= 20 次,用户极度沮丧,信任损害最大

落选项(频率不足或可降级为 L2

  • 先确认再改(6 次)→ 已融入 L2 design-confirmation 模板
  • 被动跟随/lost(4 次)→ 频率不足 L0,建议后续批次观察
  • 未经确认改代码(4 次)→ 已被 GATE 门控覆盖
  • Memory 噪音(27 次)→ 系统层面问题,非行为铁律

L2 引擎注入(prompt_templates/

文件 名称 触发场景 纠正频率 核心模板
design-confirmation.md 设计确认检查 发现实现与预期不符,准备修改时 6+ 次 先理解当前设计→查文档→确认意图→评估影响→等确认后改
role-match-check.md 角色匹配检查 收到黑板广播任务,准备认领时 20+ 次 只认领符合专长的任务,评审者不认领编码任务
inform-lightweight.md inform 轻量处理 收到 inform 类型邮件/通知时 2 次 (但影响严重) 阅读→标 done,不触发完整执行

筛选依据

  • 设计确认:6 次(批次1卡片8)+ 关联批次1卡片7,有明确触发场景和检查清单
  • 角色匹配:4 次明确纠正(批次2卡片11),但实际发生 20+ 次,系统性问题
  • inform 轻量:2 次纠正但后果严重(死循环消耗资源),有明确处理模板

落选项(频率不足 5 次或无明确触发场景)

  • 评审闭环(批次2卡片1,5次)→ 属于 GATE 门控的延伸,不单独模板化
  • 状态机一致性(批次2卡片2,3次)→ 属于代码规范,不适合 prompt 模板
  • 一键三连闭环(批次2卡片5,2次)→ 已融入 design-confirmation
  • E2E 真实环境(批次2卡片10,3次)→ 属于测试规范,不适合 prompt 模板

数据覆盖统计

类别 批次1频次 批次2频次 合计 处理方式
GATE 流程违规 33 ~5 ~38 L0 gate-flow
Memory 噪音 27 27 ⏭️ 系统问题,非行为纠正
绕圈子/不聚焦 17 3 20 L0 no-circle-jerking
角色匹配错配 20+ 20+ L2 role-match-check
先确认再改 6 6 L2 design-confirmation
续杯/retry 机制 5+ 5+ ⏭️ 技术规范,非行为铁律
被动跟随/lost 4 4 ⏭️ 频率不足,观察
未经确认改代码 4 4 已被 GATE 覆盖
inform 轻量处理 2 2 L2 inform-lightweight

文件清单

guardrails/
├── gate-flow.yaml              # L0: GATE 流程门控(33+ 次)
└── no-circle-jerking.yaml      # L0: 不绕圈子(20 次)

prompt_templates/
├── design-confirmation.md      # L2: 设计确认检查(6+ 次)
├── role-match-check.md         # L2: 角色匹配检查(20+ 次)
└── inform-lightweight.md       # L2: inform 轻量处理(2 次,影响严重)