sanguo_moziplus_v2/docs/design/topic4-skill-checklist-draft.md

# 课题4 Skill 设计清单（草稿）

**背景**：三个课题（1/2/3）产出了27项设计决策，其中大量内容需要 Agent 在 Skill 层面"知道怎么做"。当前 TODO 只列了4项（T1-5/6/7 + T2-8），远不够。

## 一、按角色分类的 Skill 需求

### 1. 所有 Agent 通用 Skill

| # | Skill 内容 | 来源 | 说明 |
|---|-----------|------|------|
| S-01 | blackboard.py CLI 使用手册 | 课题1 §5.2 | 所有黑板操作的 CLI 命令、参数、Schema 校验说明 |
| S-02 | 读黑板 L1 消息 → 判断是否需要 L2/L3 | 课题2 §4.4 | Agent 收到 L1 后自主决定信息是否足够，不够就主动调 L2/L3 |
| S-03 | 写 Handoff Comment | 课题2 §5.1 | 结束前必须写结构化交接（强烈建议，不强制） |
| S-04 | 读 Handoff Comment | 课题2 §5.1 | 收到上一个 Agent 的 Handoff 后如何利用 |
| S-05 | 写 observation 的时机和格式 | 课题1 §4.7 | 工作中发现风险时主动写 observation + severity |
| S-06 | 写 decision 的时机和格式 | 课题1 §9.4 | 每个关键决策必须记录，哪怕是自己的决策 |
| S-07 | 写 output 的 Schema 约束 | 课题2 §3.7 | --output 必须有 summary + content_path，CLI 校验 |
| S-08 | 收到 Guardrail 打回时的处理 | 课题3 §9.3 | L1 机械失败→修改重提交；L2 语义问题→评估是否合理 |
| S-09 | @mention 的使用规范 | 课题1 §5.2 | 需要协作时 @mention + 附带上下文 |

### 2. 执行者 Agent（张飞/关羽/赵云/姜维）

| # | Skill 内容 | 来源 | 说明 |
|---|-----------|------|------|
| S-10 | claim 任务后写 scope_declaration | 课题1 §4.7 | "我计划做什么、产出什么"，格式和内容要求 |
| S-11 | scope_declaration 的格式 | 课题1 T1-5 | truths 字段格式、声明方式 |
| S-12 | 收到 review needs_revision 时的处理 | 课题3 §9.5 | 读 issues → 逐条 ACCEPT/REJECT/PARTIAL，写 comment 回应 |
| S-13 | 收到 Guardrail reject 的处理 | 课题3 §9.8 | 理解 assert 失败原因，修改重提交 |
| S-14 | must_haves 三件套理解 | 课题1 §9 | truths/artifacts/constraints 的含义和自检方法 |

### 3. 审查者 Agent（司马懿 + 挑战者池）

| # | Skill 内容 | 来源 | 说明 |
|---|-----------|------|------|
| S-15 | 收到 Review Protocol 后的审查流程 | 课题3 §9.4 | 五阶段 Investigation Protocol 的执行方法 |
| S-16 | 多视角审查方法 | 课题3 §9.4 | 代码视角（安全/新人/运维）、方案视角（执行者/利益相关者/怀疑论者） |
| S-17 | 写 review 的 Schema 约束 | 课题3 §9.6 | verdict 必须是枚举，issues 必须有 evidence |
| S-18 | 信心度自评方法 | 课题3 §9.6 | confidence 打分标准，< 0.7 意味着什么 |
| S-19 | 收到反驳（REJECT）后的处理 | 课题3 §9.5 | 评估执行者的反驳是否合理，决定坚持还是让步 |
| S-20 | plan_review 协议 | 课题3 §9.4 | 假设提取+评级、pre-mortem、依赖审计、歧义扫描 |
| S-21 | output_review 协议 | 课题3 §9.4 | 需求追踪、scope 对齐、正确性验证、缺口分析 |
| S-22 | analysis_review 协议 | 课题3 §9.4 | 逻辑跳跃、无支撑结论、数据来源可靠性 |

### 4. 协调者 Agent（庞统）

| # | Skill 内容 | 来源 | 说明 |
|---|-----------|------|------|
| S-23 | 创建任务时的 truths/artifacts/constraints 定义 | 课题1 §9 | 用户视角的可观测行为、必须存在的文件、继承的约束 |
| S-24 | 风险等级自动判断 | 课题3 §9.2 | task_type→risk_level 的映射规则 |
| S-25 | 挑战者选择策略 | 课题3 §9.10 | 按任务类型选挑战者（编码→司马懿、风控→关羽、数据→赵云、部署→姜维） |
| S-26 | 对抗辩论裁决方法 | 课题3 §9.10 | 综合正方反方观点做最终判断 |
| S-27 | escalated 任务的用户沟通 | 课题3 §9.7 | 超轮次升级时如何向用户呈现争议和选项 |
| S-28 | confidence 低时的升级判断 | 课题3 T3-5 | confidence < 0.7 时升级策略 |
| S-29 | 任务拆解方法 | 课题1 §5.1 | 复杂任务如何拆成子任务，依赖如何声明 |
| S-30 | L1 消息构建逻辑 | 课题2 §4.4 | 给 Agent spawn 时的 bootstrap 消息拼装 |

## 二、按阶段分类

### Phase 1 必须有（Agent 能基本工作）

- S-01 blackboard.py CLI 使用手册
- S-03 写 Handoff Comment
- S-10 claim 后写 scope_declaration
- S-14 must_haves 理解
- S-23 创建任务（庞统）
- S-24 风险等级判断（庞统）
- S-30 L1 消息构建（庞统/Daemon）

### Phase 2 必须有（审查体系生效）

- S-02 L2/L3 按需读取
- S-04 读 Handoff Comment
- S-05/06 observation/decision 写入
- S-07 output Schema 约束
- S-12 收到 review 的处理（反驳权）
- S-15~22 审查者全套 Skill
- S-25 挑战者选择（庞统）
- S-26 对抗辩论裁决（庞统）

### Phase 3 可选（高级功能）

- S-16 多视角审查深化
- S-20~22 三种审查协议细化
- S-27 escalated 用户沟通
- S-28 confidence 升级策略
- S-29 任务拆解方法深化

## 三、和现有 TODO 的对齐

课题4 的 Skill 设计需要覆盖以上 30 项。现有的 T1-5/6/7 和 T2-8 只是其中4项。

建议：课题4 的正式设计把这 30 项整理成 Skill 体系文档，明确：
1. 哪些是 Skill 文件（Agent 读的 Markdown）
2. 哪些是 Protocol 文件（Daemon 注入的 YAML）
3. 哪些是 CLI 帮助信息（blackboard.py --help）
4. 三者的关系和优先级