Files
2026-05-27 00:11:21 +08:00

6.6 KiB
Raw Permalink Blame History

name, description
name description
proven-practices 从成功任务中提炼的最佳实践:编码模式、评审策略、调研方法、工具使用方式。 在开始复杂任务时触发,作为"怎么做好"的参考。

Proven Practices(验证有效的最佳实践)

来源:从三国团队 200 次成功任务中蒸馏(庞统 158 条 + 司马懿 42 条)

适用场景

  • 开始复杂任务(L2/L3)时,快速回顾成功做法
  • 新将军入职参考
  • 自查当前工作是否符合最佳实践

模式清单

模式 1:先读后写 — 编码前通读相关代码(severity: high

场景:编码任务(新功能、重构、bug 修复) 最佳做法:动手写代码前,先用 read 通读所有相关文件(包括上下游模块),确认理解完整后再动手。庞统在写设计文档前读完全部代码后说"Now I have a complete understanding of the codebase";司马懿评审 bug 修复时先读安装目录和开发目录两份代码确认一致。 成功因素:避免"改了这里忘了那里",一次改对不需要返工。 关键细节:不要只读目标文件,也读 import 它的模块和被它 import 的模块。

模式 2:写完即验 — 产出必须运行验证(severity: high

场景:产出代码或脚本的编码任务 最佳做法:写完代码后立即用 exec 运行验证,确认输出正确后再提交。庞统写 find_max.py 后立即运行确认 max=9.81 正确;写 Hello World 后确认输出 Hello, World!成功因素:运行验证是最低成本的质量保证,比提交后被驳回再改快 10 倍。 关键细节:验证时检查边界情况(空输入、极端值),不只是 happy path。

模式 3:结构化评审 — 逐项检查表(severity: high

场景:代码评审、产出审核 最佳做法:按固定评审维度逐项检查,用表格输出结论。司马懿的评审标准:功能正确性 → 边界处理 → 异常处理 → 代码风格 → 数据文件 → 运行验证。每项 / 明确标注。 成功因素:结构化检查防止遗漏,表格格式让结论一目了然。 关键细节:区分"必须修改"Critical)和"建议"Non-blocking),后者不阻断流程。驳回时明确说明修改方向。

模式 4:交叉核实 — 不信任产出声明(severity: high

场景:审核他人的产出报告、验证他人声明的完成状态 最佳做法:不直接采信报告中的声明,逐项调 API 交叉核实。司马懿审核庞统的 verify 报告时,"逐项调 API 交叉核实——项目状态、父子关系、状态流转、Stages结构、产出文件、审查记录——全部与实际数据一致,无虚假声明"。 成功因素:审核的核心价值就是"不信声明信证据",避免虚假完成蒙混过关。 关键细节:核实范围包括状态一致性、数据准确性、产出完整性,不只是"有没有"还要"对不对"。

模式 5:状态机敬畏 — 先查状态再操作(severity: high

场景:黑板任务流转、状态机相关操作 最佳做法:操作前先查当前状态,根据状态决定下一步操作,不假设状态。庞统遇到 review 状态无法转 working,立即调整为直接在 review 下完成操作;发现任务已是 done 则不再重复操作。 成功因素:状态机是硬约束,违反它只会浪费 API 调用。先查状态再操作,一次做对。 关键细节:遇到非法转换不要硬试,理解状态机规则后选择合法路径。

模式 6:调研深挖 — 搜索 + 原文 + 结构化输出(severity: medium

场景:技术调研、竞品分析、方案研究 最佳做法web_search 获取概览 → web_fetch 深挖关键文章 → 结构化报告输出。庞统做 AI Agent 架构调研时搜索了多框架对比,尝试 fetch 原文(即使被阻止也用搜索结果补充),最终输出带章节的调研报告。 成功因素:搜索提供广度,fetch 提供深度,结构化输出让调研结果可被团队消费。 关键细节:即使部分 fetch 失败,也不要卡住——用已有信息组织报告,注明数据来源。

模式 7:简洁产出 — 最小化交付物(severity: medium

场景:所有任务的产出编写 最佳做法:产出只包含任务要求的内容,不做额外扩展。庞统的 hello_world.py 只有一行 print("Hello, World!"),不加大框架;find_max.py 只做手动遍历找最大值,不实现排序。 成功因素:简洁 = 少 bug = 快通过评审。不必要的抽象和功能只会增加评审负担和出错概率。 关键细节:产出报告用表格列出文件和说明,让审核者快速定位。

模式 8:续杯幂等 — 被中断后先查再续(severity: medium

场景:任务被中断后恢复(续杯提醒) 最佳做法:收到续杯提醒后,先查任务当前状态和已有产出,判断是否已完成或需要继续。司马懿收到续杯后检查发现"任务已是 review 状态,产出已写入,上轮评审已完成,无需重复操作"。 成功因素:幂等性保证——即使多次续杯也不会重复执行或破坏已有结果。 关键细节:续杯不是重新开始,是"检查 → 继续/跳过"。已完成的工作不要重做。

模式 9:计划驱动 — 复杂任务用 update_plan 跟踪(severity: medium

场景:超过 15 步的复杂任务(调研、多文件编码、集成测试) 最佳做法:用 update_plan 拆分步骤,每完成一步更新状态。庞统在 27 步的技术调研中用 plan 跟踪进度,21 步的聚合测试中也用 plan 管理。 成功因素:长任务中 plan 防止遗漏步骤,也方便中断后恢复时知道做到哪里了。 关键细节:plan 步骤要粒度适中——太粗等于没 plan,太细浪费 token。每步应该是一个有明确产出的动作。

检查清单(快速参考)

编码前:

  • 相关代码都读过了吗?(模式 1
  • 需要修改的范围确认了吗?

编码后:

  • 运行验证了吗?边界情况测了吗?(模式 2)
  • 产出是最小必要集合吗?(模式 7

评审时:

  • 按结构化检查表逐项审查了吗?(模式 3)
  • 核实了实际数据,不只是看声明?(模式 4)

任务流转:

  • 操作前查了当前状态吗?(模式 5
  • 续杯时先查再续,不重复已完成工作?(模式 8)

复杂任务:

  • 用 plan 跟踪进度了吗?(模式 9)
  • 调研时搜索 + 原文 + 结构化报告?(模式 6)