sanguo/sanguo_moziplus_v2

Files

T

cfdaily 0f81c00f35 auto-sync: 2026-05-20 00:14:43

2026-05-20 00:14:43 +08:00

5.4 KiB

Raw Permalink Blame History

课题4 Skill 设计清单（草稿）

背景：三个课题（1/2/3）产出了27项设计决策，其中大量内容需要 Agent 在 Skill 层面"知道怎么做"。当前 TODO 只列了4项（T1-5/6/7 + T2-8），远不够。

一、按角色分类的 Skill 需求

1. 所有 Agent 通用 Skill

#	Skill 内容	来源	说明
S-01	blackboard.py CLI 使用手册	课题1 §5.2	所有黑板操作的 CLI 命令、参数、Schema 校验说明
S-02	读黑板 L1 消息 → 判断是否需要 L2/L3	课题2 §4.4	Agent 收到 L1 后自主决定信息是否足够，不够就主动调 L2/L3
S-03	写 Handoff Comment	课题2 §5.1	结束前必须写结构化交接（强烈建议，不强制）
S-04	读 Handoff Comment	课题2 §5.1	收到上一个 Agent 的 Handoff 后如何利用
S-05	写 observation 的时机和格式	课题1 §4.7	工作中发现风险时主动写 observation + severity
S-06	写 decision 的时机和格式	课题1 §9.4	每个关键决策必须记录，哪怕是自己的决策
S-07	写 output 的 Schema 约束	课题2 §3.7	--output 必须有 summary + content_path，CLI 校验
S-08	收到 Guardrail 打回时的处理	课题3 §9.3	L1 机械失败→修改重提交；L2 语义问题→评估是否合理
S-09	@mention 的使用规范	课题1 §5.2	需要协作时 @mention + 附带上下文

2. 执行者 Agent（张飞/关羽/赵云/姜维）

#	Skill 内容	来源	说明
S-10	claim 任务后写 scope_declaration	课题1 §4.7	"我计划做什么、产出什么"，格式和内容要求
S-11	scope_declaration 的格式	课题1 T1-5	truths 字段格式、声明方式
S-12	收到 review needs_revision 时的处理	课题3 §9.5	读 issues → 逐条 ACCEPT/REJECT/PARTIAL，写 comment 回应
S-13	收到 Guardrail reject 的处理	课题3 §9.8	理解 assert 失败原因，修改重提交
S-14	must_haves 三件套理解	课题1 §9	truths/artifacts/constraints 的含义和自检方法

3. 审查者 Agent（司马懿 + 挑战者池）

#	Skill 内容	来源	说明
S-15	收到 Review Protocol 后的审查流程	课题3 §9.4	五阶段 Investigation Protocol 的执行方法
S-16	多视角审查方法	课题3 §9.4	代码视角（安全/新人/运维）、方案视角（执行者/利益相关者/怀疑论者）
S-17	写 review 的 Schema 约束	课题3 §9.6	verdict 必须是枚举，issues 必须有 evidence
S-18	信心度自评方法	课题3 §9.6	confidence 打分标准，< 0.7 意味着什么
S-19	收到反驳（REJECT）后的处理	课题3 §9.5	评估执行者的反驳是否合理，决定坚持还是让步
S-20	plan_review 协议	课题3 §9.4	假设提取+评级、pre-mortem、依赖审计、歧义扫描
S-21	output_review 协议	课题3 §9.4	需求追踪、scope 对齐、正确性验证、缺口分析
S-22	analysis_review 协议	课题3 §9.4	逻辑跳跃、无支撑结论、数据来源可靠性

4. 协调者 Agent（庞统）

#	Skill 内容	来源	说明
S-23	创建任务时的 truths/artifacts/constraints 定义	课题1 §9	用户视角的可观测行为、必须存在的文件、继承的约束
S-24	风险等级自动判断	课题3 §9.2	task_type→risk_level 的映射规则
S-25	挑战者选择策略	课题3 §9.10	按任务类型选挑战者（编码→司马懿、风控→关羽、数据→赵云、部署→姜维）
S-26	对抗辩论裁决方法	课题3 §9.10	综合正方反方观点做最终判断
S-27	escalated 任务的用户沟通	课题3 §9.7	超轮次升级时如何向用户呈现争议和选项
S-28	confidence 低时的升级判断	课题3 T3-5	confidence < 0.7 时升级策略
S-29	任务拆解方法	课题1 §5.1	复杂任务如何拆成子任务，依赖如何声明
S-30	L1 消息构建逻辑	课题2 §4.4	给 Agent spawn 时的 bootstrap 消息拼装

二、按阶段分类

Phase 1 必须有（Agent 能基本工作）

S-01 blackboard.py CLI 使用手册
S-03 写 Handoff Comment
S-10 claim 后写 scope_declaration
S-14 must_haves 理解
S-23 创建任务（庞统）
S-24 风险等级判断（庞统）
S-30 L1 消息构建（庞统/Daemon）

Phase 2 必须有（审查体系生效）

S-02 L2/L3 按需读取
S-04 读 Handoff Comment
S-05/06 observation/decision 写入
S-07 output Schema 约束
S-12 收到 review 的处理（反驳权）
S-15~22 审查者全套 Skill
S-25 挑战者选择（庞统）
S-26 对抗辩论裁决（庞统）

Phase 3 可选（高级功能）

S-16 多视角审查深化
S-20~22 三种审查协议细化
S-27 escalated 用户沟通
S-28 confidence 升级策略
S-29 任务拆解方法深化

三、和现有 TODO 的对齐

课题4 的 Skill 设计需要覆盖以上 30 项。现有的 T1-5/6/7 和 T2-8 只是其中4项。

建议：课题4 的正式设计把这 30 项整理成 Skill 体系文档，明确：

哪些是 Skill 文件（Agent 读的 Markdown）
哪些是 Protocol 文件（Daemon 注入的 YAML）
哪些是 CLI 帮助信息（blackboard.py --help）
三者的关系和优先级