sanguo_moziplus_v2/docs/design/technical-design-v2.6.md

# v2.6 技术方案设计

**版本**: v2.6.2-tech
**基于**: architecture-v2.6.md (v2.6.11)
**作者**: 庞统（副军师）🐦
**日期**: 2026-05-16

---

## 1. 总体技术架构

### 1.1 全局架构图

```
┌─────────────────────────────────────────────────────────────────────────────┐
│                              用户层                                        │
│  ┌──────────────────┐    ┌──────────────────┐                              │
│  │  Agent 对话入口   │    │  Dashboard (8083) │                              │
│  │  (OpenClaw Chat) │    │  React + Vite     │                              │
│  └────────┬─────────┘    └────────┬─────────┘                              │
│           │                       │                                        │
│     自然语言对话               REST API + SSE                               │
│           │                       │                                        │
└───────────┼───────────────────────┼────────────────────────────────────────┘
            ▼                       ▼
┌───────────────────────────────┐  ┌──────────────────────────────────────┐
│  Agent 执行环境（独立进程）     │  │  v2 主进程（PM2: sanguo-moziplus-v2） │
│                               │  │  asyncio event loop                   │
│  ┌─────────────────────────┐  │  │                                       │
│  │ L0 铁律 (OpenClaw Hook) │  │  │  ┌─────────────────────────────────┐  │
│  │ L1 角色 (SOUL/IDENTITY) │  │  │  │     API 层 (FastAPI + uvicorn)   │  │
│  │ L2 引擎注入 (bootstrap) │  │  │  │  ┌──────┐ ┌──────┐ ┌────────┐  │  │
│  │ L3 被动参考 (Skill)     │  │  │  │  │黑板API│ │项目API│ │SSE推送 │  │  │
│  └─────────────────────────┘  │  │  │  └──┬───┘ └──┬───┘ └───┬────┘  │  │
│                               │  │  └─────┼────────┼─────────┼───────┘  │
│  Agent → 黑板 的交互方式：     │  │        │        │         │          │
│  ① CLI (blackboard.py) ───────┼──┼──→ 直接操作黑板 DB               │
│  ② Inbox JSONL ──────────────┼──┼──→ 秒级事件推送给 Daemon          │
│                               │  │                                   │
│                               │  │  ┌─────────────────────────────────┐  │
│                               │  │  │   Daemon 引擎层（同一 event loop）│  │
│                               │  │  │                                   │  │
│                               │  │  │  ticker (30s scan)               │  │
│                               │  │  │  ┌──────────┐ ┌──────────────┐ │  │
│                               │  │  │  │审查流水线 │ │ 依赖推进     │ │  │
│                               │  │  │  │(4级分级) │ │ 反驳权/蒸馏  │ │  │
│                               │  │  │  └──────────┘ └──────────────┘ │  │
│                               │  │  │  ┌──────────┐ ┌──────────────┐ │  │
│                               │  │  │  │Agent调度器│ │Bootstrap拼装 │ │  │
│  ← asyncio.create_subprocess  │  │  │  └────┬─────┘ └──────────────┘ │  │
│     _exec (spawn 不等返回)     │←─┼──┼───────┘                        │  │
│                               │  │  │  ┌──────────────────────────────┐│  │
│                               │  │  │  │ ActiveAgentCounter (并发控制) ││  │
│                               │  │  │  └──────────────────────────────┘│  │
│                               │  │  └─────────────────────────────────┘  │
│                               │  │                                       │
│                               │  │  ┌─────────────────────────────────┐  │
│                               │  │  │  黑板数据层 (per-project SQLite)  │  │
│                               │  │  │  ┌─────┐ ┌──────┐ ┌──────┐    │  │
│                               │  │  │  │tasks│ │outputs│ │reviews│    │  │
│                               │  │  │  └─────┘ └──────┘ └──────┘    │  │
│                               │  │  │  ┌──────────┐ ┌───────────┐   │  │
│                               │  │  │  │comments  │ │experiences│   │  │
│                               │  │  │  │decisions │ │events     │   │  │
│                               │  │  │  │observations│            │   │  │
│                               │  │  │  └──────────┘ └───────────┘   │  │
│                               │  │  └─────────────────────────────────┘  │
└───────────────────────────────┘  └──────────────────────────────────────┘

┌───────────────────────────────────────────────────────────────────────────┐
│                        配置 & 知识层（文件系统）                             │
│  ┌────────────┐ ┌────────────┐ ┌────────────┐ ┌────────────┐              │
│  │_registry   │ │guardrails │ │review_     │ │prompt_     │              │
│  │.yaml       │ │.yaml      │ │protocols/  │ │templates/  │              │
│  └────────────┘ └────────────┘ └────────────┘ └────────────┘              │
│  ┌────────────┐ ┌────────────┐ ┌────────────┐                            │
│  │schemas/    │ │skills/     │ │project.yaml│ (per-project 覆盖)          │
│  │(JSON)      │ │(builtin+   │ │            │                            │
│  │            │ │ custom)    │ │            │                            │
│  └────────────┘ └────────────┘ └────────────┘                            │
└───────────────────────────────────────────────────────────────────────────┘
```

### 1.2 多用户并发架构

```
┌─────────────────────────────────────────────────────────────────────┐
│                        多用户并发入口                                │
│                                                                     │
│  用户A ──→ OpenClaw Chat ──→ 庞统 Agent ──→ 项目X 任务A1, A2        │
│  用户B ──→ OpenClaw Chat ──→ 庞统 Agent ──→ 项目Y 任务B1            │
│  用户C ──→ Dashboard ─────→ REST API ────→ 项目X 任务C1            │
│                                                                     │
│  所有用户的请求汇聚到同一个 Daemon ticker（30s 扫描全部项目）         │
│  并发由 ActiveAgentCounter 控制（max_global=5, max_per_agent=1）    │
└─────────────────────────────────────────────────────────────────────┘
```

**多用户设计要点**：

| 维度 | 机制 | 说明 |
|------|------|------|
| 项目隔离 | per-project blackboard.db | 不同项目的任务、产出、评论完全隔离 |
| 并发控制 | ActiveAgentCounter | 全局 max_global=5 同时最多 5 个 Agent，per-agent max=1 串行执行 |
| 资源竞争 | Agent 池排队 | 张飞正在执行任务A，任务B 排队等张飞释放 |
| tick 调度 | 30s 扫全部项目 | 每轮 tick 按 project_id 轮询，每项目独立 tick |
| 事件驱动 | 共享 Inbox JSONL | 任何项目的 Agent 完成都秒级触发 Daemon |
| 前端隔离 | URL path `/api/projects/{pid}/` | Dashboard 切换项目，SSE 按 pid 过滤 |

**当前规模定位**：单机部署（Mac mini M4, 16GB），3-5 个活跃项目，同时 ≤5 个 Agent 并发。超出此规模需要架构演进（见 §15.3）。

### 1.3 核心数据流

```
                          ┌──────────┐
                          │  用户需求  │
                          └────┬─────┘
                               │
                          庞统规划+拆解
                               │
                          ┌────▼─────┐
                          │ 任务写入  │
                          │ 黑板     │
                          └────┬─────┘
                               │
                    ┌──────────┼──────────┐
                    ▼          ▼          ▼
               pending    in_review    blocked
                    │          │          │
                    │          │     ┌────┘
                    │          │     ▼
               调度Agent   审查流水线  依赖满足
               (受Counter  (分级处理)    │
                控制)│          │      → pending
                    │          │
                    ▼          │
          ┌──────────────┐     │
          │  Agent 执行   │     │
          │ (独立进程)    │     │
          └───┬──────┬───┘     │
              │      │         │
         写产出   写评论       │
              │      │         │
              ▼      │         │
         Guardrail   │         │
         检查 ───────┤         │
              │      │         │
         ┌────┘      │         │
         ▼           │         │
    通过 → 触发审查   │         │
    失败 → 回 working │         │
         │           │         │
         │     ┌─────┘         │
         │     ▼               │
         │  通过 → done ───────┤──→ 一级蒸馏 → 经验注入
         │     │               │
         │  不通过 → 反驳权     │
         │     │ ↕ 协商        │
         │     │ max_rounds   │
         │     │ ↓ 超轮次      │
         │  庞统裁决          │
         │     │               │
         │     ├→ done/revision│
         │     └───────────────┘
         │
         └──→ 完成后检查：下游 blocked 任务是否可解锁
```

**关键循环路径**（非直线流程）：
1. **Guardrail 失败循环**：产出写完 → Guardrail 检查 → 失败 → 回 working → Agent 重新执行
2. **审查-反驳循环**：审查不通过 → 反驳权协商（≤ max_rounds 轮）→ 超轮次庞统裁决
3. **依赖解锁循环**：任务完成 → 检查下游 blocked 任务 → 依赖满足 → 下游变 pending → 调度
4. **经验闭环**：任务完成 → 一级蒸馏 → 经验注入 → 下次 build_bootstrap 复用

### 1.4 交互路径详解

| 路径 | 方式 | 说明 |
|------|------|------|
| 用户 → Agent | OpenClaw Chat | 自然语言对话，Agent 自带身份和工具 |
| 用户 → Dashboard | 浏览器访问 8083 | REST API 查黑板、SSE 收推送 |
| Agent → 黑板 | CLI `blackboard.py` | read/claim/output/comment/decide/observe/create/review |
| Agent → Daemon | 写 Inbox JSONL | 秒级事件推送，触发 Daemon 提前 tick |
| Agent → Agent | 黑板评论 | comments 表（handoff/rebuttal/debate），替代 Mail |
| Daemon → Agent | `asyncio.create_subprocess_exec` | spawn 不等返回，下次 tick 检查产出 |
| Daemon → Dashboard | SSE `/api/events` | 任务状态变更、审查结果、通知推送 |
| Dashboard → Daemon | REST API | 查状态、手动 tick、项目管理 |

### 1.5 组件职责矩阵

| 层 | 组件 | 职责 | 技术 |
|----|------|------|------|
| **用户层** | Agent 对话 | 自然语言交互入口 | OpenClaw Chat |
| | Dashboard | 可视化监控/配置/Checkpoint | React + Vite (8083) |
| **API 层** | FastAPI | REST API + SSE + 静态文件 | uvicorn |
| **引擎层** | Daemon ticker | 30s 状态扫描 + 事件驱动 | asyncio background task |
| | 调度器 | 三级调度 (Daemon/Full/Sub) | DISPATCH_RULES 配置表 |
| | 审查流水线 | 分级审查 + 反驳权 + 辩论 | review_flow.py |
| | Bootstrap 拼装 | 四层上下文 L0-L3 | prompt_templates + YAML |
| | Inbox watcher | JSONL 秒级事件推送 | asyncio 1s 轮询 |
| | 健康自检 | 逻辑死循环检测 | 连续 N tick 无变更告警 |
| **Agent 层** | Full Agent | 有身份角色的任务执行 | openclaw agent CLI |
| | Subagent | 无身份一次性检查 | sessions_spawn API |
| **数据层** | 黑板 DB | 任务/评论/产出/审查/经验 | SQLite per-project |
| | Inbox | 跨进程事件队列 | JSONL + truncate |
| | _registry.yaml | 项目注册表 | YAML (人可读) |
| **配置层** | guardrails.yaml | L1/L2 检查规则 | YAML |
| | review_protocols/ | 审查协议 | YAML |
| | skills/ | 三层载体 (Memory/Skill/Rule) | SKILL.md + meta.yaml |
| | project.yaml | per-project 配置覆盖 | YAML |

---

## 2. 技术栈与选型权衡

### 2.1 技术栈总览

| 组件 | 选型 | 版本 |
|------|------|------|
| Daemon 进程管理 | PM2 | 6.0.14 |
| Daemon 框架 | Python + asyncio | 3.9+ |
| 黑板存储 | SQLite (per-project) | 3.51+ |
| HTTP API | FastAPI + uvicorn | 独立安装 |
| Agent 调度 | openclaw CLI / sessions_spawn | 2026.5.7 |
| 前端 | React + Vite + TypeScript | 复用 v1.0 |
| 实时推送 | SSE | FastAPI 内置 |
| 配置 | YAML (PyYAML) | — |

### 2.2 选型权衡分析

**每个关键技术选型都遵循"不加重型新依赖"原则，基于已有环境。**

| 决策 | 选择 | 备选 | 选择理由 | 备选缺陷 |
|------|------|------|---------|---------|
| HTTP 框架 | **FastAPI** | Starlette / Litestar / Flask | 2025-2026 AI Agent 编排系统事实标准（Agno AgentOS、OpenAI Agents SDK 均用 FastAPI）；内置 OpenAPI + SSE + async；团队已有 v1 经验 | Starlette 需自己拼 Auth/SSE/DI；Litestar 太新生态小；Flask 不原生 async |
| 黑板存储 | **SQLite** | PostgreSQL / JSON 文件 | per-project 物理隔离（单项目故障不影响其他）；零运维（无 DB server）；WAL 模式足够应对单机并发；团队已有 WAL+busy_timeout 经验 | PostgreSQL 需额外 DB server 运维，对单机场景过重；JSON 文件无事务、无并发保护 |
| 实时推送 | **SSE** | WebSocket / 轮询 | 单向推送足够（Daemon→Dashboard）；FastAPI 原生支持；自动重连；降级轮询简单 | WebSocket 双向能力多余，增加复杂度；纯轮询延迟高 |
| 并发模型 | **纯 asyncio 单线程** | threading / multiprocessing | 与 FastAPI event loop 共存；Agent spawn 用 create_subprocess_exec 非阻塞；无锁竞争问题 | threading 引入 GIL + 锁复杂度；multiprocessing 进程间通信代价大 |
| 配置格式 | **YAML** | TOML / JSON / Python | guardrails/review_protocols 需要人可读可编辑；YAML 支持 multiline string（prompt 模板）；紧急运维可直接编辑 | TOML multiline 不便；JSON 无注释；Python 有安全风险 |
| 进程管理 | **PM2** | systemd / supervisord | 已有 10 个 PM2 进程运行；log management + auto restart + 开机自启；ecosystem.config.cjs 统一管理 | systemd 需 root 权限；supisord 不如 PM2 对 Node.js 友好 |
| Agent spawn | **asyncio.create_subprocess_exec** | subprocess.Popen / sessions_spawn | Full Agent 需要独立进程+独立 session；async 版本不阻塞 event loop；下次 tick 检查产出而非等待返回 | Popen 同步阻塞 event loop；sessions_spawn 仅适用无身份 Subagent |

---

## 3. 项目结构

```
sanguo_moziplus_v2/                    # 项目根目录
├── src/
│   ├── main.py                         # FastAPI 入口 + Daemon ticker 启动
│   │
│   ├── blackboard/                     # 黑板核心模块
│   │   ├── __init__.py
│   │   ├── db.py                       # SQLite 连接管理（per-project）
│   │   ├── models.py                   # 数据模型
│   │   ├── operations.py               # 写操作（task/comment/output/decision/observation/review）
│   │   └── queries.py                  # 读操作（L1/L2/L3 分层）
│   │
│   ├── daemon/                         # Daemon 核心模块
│   │   ├── __init__.py
│   │   ├── ticker.py                   # Tick 循环主逻辑（30s）
│   │   ├── dispatcher.py               # Agent 调度判据（Full/Subagent/Daemon 三级）
│   │   ├── spawner.py                  # Agent spawn + session 管理
│   │   ├── inbox.py                    # Inbox JSONL watcher + truncate
│   │   ├── guardrail.py               # L1 assert 执行 + L2 subagent 触发
│   │   ├── review_flow.py             # 审查流水线（单审/反驳权/辩论）
│   │   ├── experience.py              # 一级蒸馏触发 + 经验注入
│   │   ├── bootstrap.py               # build_bootstrap() L1/L2/L3 消息拼装
│   │   ├── health.py                  # 健康检查 + 逻辑死循环检测
│   │   ├── counter.py                 # ActiveAgentCounter 异步计数器
│   │   └── notifier.py                # @mention 解析 + Inbox 事件注入
│   │
│   ├── api/                            # HTTP API
│   │   ├── blackboard_routes.py        # 黑板 CRUD API
│   │   ├── daemon_routes.py            # Daemon 控制 API
│   │   ├── sse_routes.py               # SSE 推送端点
│   │   └── project_routes.py           # 多项目管理 API
│   │
│   ├── cli/                            # CLI 工具
│   │   ├── blackboard.py               # Agent 黑板操作 CLI
│   │   └── admin.py                    # 管理员控制 CLI
│   │
│   └── frontend/                       # 前端（React + Vite）
│       ├── src/
│       │   ├── pages/                  # 5 页面
│       │   │   ├── TaskBoard.tsx       # 任务看板（核心）
│       │   │   ├── GlobalMonitor.tsx   # 全局监控
│       │   │   ├── ArtifactVault.tsx   # 产出档案
│       │   │   ├── SystemConfig.tsx    # 系统配置
│       │   │   └── AIBriefing.tsx      # AI Briefing
│       │   ├── components/
│       │   │   ├── CheckpointPanel.tsx # Checkpoint 交互
│       │   │   ├── NotificationCenter.tsx # 推送通知中心
│       │   │   └── ProjectSwitcher.tsx # 项目切换器
│       │   ├── store.ts                # Zustand 状态管理
│       │   └── api.ts                  # API 层
│       └── dist/                       # 构建产物（8083 直接服务）
│
├── config/
│   ├── default.yaml                    # 全局默认配置
│   ├── guardrails.yaml                 # Guardrail 规则（per task_type）
│   ├── template_components.yaml        # 模板组件库（7组件 + custom）
│   └── review_protocols/               # 审查协议
│       ├── plan_review.yaml
│       ├── output_review.yaml
│       ├── analysis_review.yaml
│       └── final_review.yaml
│
├── prompt_templates/                   # L2 引擎注入模板
│   ├── executor.md                     # 执行者操作规范
│   ├── reviewer.md                     # 审查者操作规范
│   ├── planner.md                      # 庞统规划操作规范
│   ├── adjudicator.md                  # 庞统裁决操作规范
│   ├── rebuttal.md                     # 反驳权操作规范
│   └── plan_checker.md                 # Plan Checker 验证规范
│
├── schemas/                            # L1 Schema 校验
│   ├── handoff.schema.json
│   ├── output.schema.json
│   ├── decide.schema.json
│   └── observe.schema.json
│
├── projects/                           # 多项目目录（课题11）
│   └── {project_id}/
│       ├── blackboard.db              # per-project SQLite
│       ├── config/                    # per-project 配置覆盖
│       │   └── project.yaml
│       ├── artifacts/                 # per-project 产出物
│       ├── experiences/               # per-project 经验库
│       └── skills/                    # per-project Skill 覆盖/扩展
│
├── inbox/                             # Inbox JSONL
│   └── daemon.jsonl                   # 跨进程事件推送
│
├── skills/                            # 全局 Skill 库
│   ├── builtins/                      # 系统内置 Skill
│   │   ├── blackboard_operations/
│   │   ├── code_review/
│   │   └── data_validation/
│   └── custom/                        # 蒸馏产出/用户创建
│       └── {skill_id}/
│           ├── SKILL.md               # 四要素
│           ├── template.md            # 可选详细模板
│           └── meta.yaml              # 版本/来源/tag
│
├── tests/
│   ├── unit/
│   └── e2e/
│
├── pyproject.toml
├── ecosystem.config.cjs               # PM2 配置
└── docs/                              # 设计文档
```

---

## 4. 数据库设计

### 4.1 数据库架构（per-project）

每个项目独立 SQLite 数据库，物理隔离。路径：`projects/{project_id}/blackboard.db`。

全局注册表：`projects/_registry.yaml`（YAML 文件，人可读可 Git 版本管理，紧急运维可直接编辑）。tick 热路径用内存 dict 缓存，_registry.yaml 只在 CLI 操作时读写（非热路径）。

### 4.2 表结构

完整 Schema 见 `architecture-v2.6.md §3.2`，此处列出核心表：

| 表 | 用途 | 来源课题 |
|----|------|---------|
| `tasks` | 任务主表（状态机） | 课题1 |
| `comments` | 评论/Handoff/辩论论点（含 comment_type） | 课题2/3 |
| `outputs` | 产出物（含 attempt_number） | 课题2 |
| `decisions` | 决策记录 | 课题1 |
| `observations` | 观察/吹哨（severity 分级） | 课题1 |
| `events` | 事件流（审计追踪） | 课题2 |
| `reviews` | 评审结果（含 confidence/rebuttal_status/debate_round） | 课题3 |
| `experiences` | 经验沉淀（含 tags） | 课题6 |
| `experience_tags` | 经验标签关联表 | 课题6 |
| `checkpoints` | Checkpoint 人工确认（v2.8/M3） | M3 |

### 4.3 关键约束

- WAL 模式 + `busy_timeout=5000` + `PRAGMA foreign_keys=ON`
- 所有写操作走 `BEGIN IMMEDIATE` 串行化
- comments 表 `comment_type` CHECK 约束区分 8 种类型

---

## 5. Daemon 核心架构

### 5.1 Tick 循环（30s）

```python
async def tick(project_id: str):
    conn = get_connection(project_id)
    try:
        # 1. 逻辑健康自检（连续 N tick 无变更 → 告警）
        health_check(conn)

        # 2. 处理 Inbox JSONL（即时事件）
        process_inbox(conn)

        # 3. 扫描黑板状态
        tasks = scan_tasks(conn)

        # 4. 审查流水线处理
        review_flow(conn, tasks)

        # 5. 依赖推进（已完成任务解锁下游）
        advance_dependencies(conn, tasks)

        # 6. 反驳权进度检测（催促通知）
        check_rebuttal_progress(conn)

        # 7. Agent 调度
        dispatch_pending(conn, tasks)

        # 8. 一级蒸馏触发
        check_distillation(conn)

    finally:
        conn.close()
```

**Tick + Inbox 双层事件架构**：
- Tick 30s 兜底扫描（Pull）
- Inbox JSONL 秒级推送加速（Push）
- Inbox 文件用 truncate（清空不删除），避免并发写入时文件不存在

### 5.2 Agent 调度判据（三级决策树）

详见 `topic3-challenge-review-proposal.md §5.4`。

```python
def dispatch(task, action_type, project_config):
    registered_agents = project_config.get("agents", [])

    # Level 1: 纯机械检查 → Daemon 直接执行
    if action_type in ("L1_guardrail", "format_check", "file_exists_check"):
        return execute_locally(task)

    # Level 2: 有名字的角色 → Full Agent (asyncio.create_subprocess_exec)
    if task.assignee in registered_agents:
        if action_type == "adjudication":
            return spawn_full_agent(task.assignee, new_session=True)
        return spawn_full_agent(task.assignee)

    # Level 3: 无名字的一次性任务 → Subagent (sessions_spawn)
    if DISPATCH_RULES.get(action_type) == "subagent":
        return spawn_subagent(task_description=action_type)

    # Level 4: 未知 action_type → 庞统裁决
    return spawn_full_agent("pangtong-fujunshi", new_session=True)
```

**spawn 方式**：
- Full Agent：`asyncio.create_subprocess_exec`（异步非阻塞），不 await 完成，下次 tick 检查产出
- Subagent：`sessions_spawn`（Gateway API），等返回

### 5.3 线程模型：纯 asyncio 单线程

整个 Daemon 运行在单个 asyncio event loop 中（与 FastAPI 共享）。

**关键设计决策**：Full Agent spawn 不用 `subprocess.Popen`（同步，会短暂阻塞 event loop），改用 `asyncio.create_subprocess_exec`（异步非阻塞）。这样 API 请求处理、SSE 推送、Daemon tick 三者互不阻塞。

```python
async def spawn_full_agent(agent_id: str, message: str, new_session: bool = False) -> str:
    """异步非阻塞 spawn，全程 asyncio"""
    session_id = str(uuid.uuid4())
    cmd = ["openclaw", "agent", "--agent", agent_id,
           "--session-id", session_id, "--message", message, "--json"]

    proc = await asyncio.create_subprocess_exec(
        *cmd, stdout=asyncio.subprocess.PIPE, stderr=asyncio.subprocess.PIPE
    )
    # 不 await proc.wait()，让子进程独立运行
    # 下次 tick 通过产出物检查完成状态
    _register_session(agent_id, session_id, proc.pid)
    return session_id
```

**Subagent spawn** 通过 OpenClaw Gateway 内部 API（`sessions_spawn`），天然异步。

### 5.4 ActiveAgentCounter（课题11）

纯 asyncio 实现（`asyncio.Semaphore`），与线程模型一致：
    """异步计数器，控制并发"""
    def __init__(self, max_global=5, max_per_agent=1):
        self._global = asyncio.Semaphore(max_global)
        self._per_agent = {}  # agent_id → Semaphore(max_per_agent)

    async def acquire(self, agent_id: str) -> bool:
        if self._global.locked():
            return False
        agent_sem = self._per_agent.get(agent_id)
        if agent_sem and agent_sem.locked():
            return False
        await self._global.acquire()
        if agent_id not in self._per_agent:
            self._per_agent[agent_id] = asyncio.Semaphore(self._max_per_agent)
        await self._per_agent[agent_id].acquire()
        return True

    def release(self, agent_id: str):
        self._per_agent[agent_id].release()
        self._global.release()
```

### 5.5 build_bootstrap() 四层上下文拼装

详见 `topic4-decomposition-skill-proposal.md D4-7`。

```
L0 铁律层（~500 tokens）  → Hook 注入，不占 bootstrap
L1 角色层（~2000 tokens） → SOUL.md / IDENTITY.md（Agent 自带）
L2 引擎注入层（~1500 tokens）→ prompt_templates 按 role 拼装
    ① 操作规范（executor.md / reviewer.md / planner.md）
    ② 项目背景（project_context.yaml）
    ③ 任务上下文（黑板数据）
    ④ 前序信息（depends_on 产出摘要）
    ⑤ Guardrail 规则（guardrails.yaml，仅执行者）
    ⑥ 审查协议（review_protocols/，仅审查者）
    ⑦ 经验注入（experiences 表按 tag 匹配）
L3 被动参考层（按需加载）→ Skill description 四要素
```

L2 按角色精确注入：执行者注入⑤⑥，审查者注入⑥，庞统注入⑥。

---

## 6. 审查流水线

### 6.1 分级审查

| 风险等级 | 流水线 | 方案审查 | 产出审查 | 模式 | max_rounds |
|---------|--------|---------|---------|------|-----------|
| **high** | 三阶段 | ✅ 对抗辩论 | ✅ 对抗辩论 + Guardrail | debate | 5 |
| **standard** | 二阶段 | ✅ 单审 | ✅ 单审 + Guardrail | single_reviewer | 3 |
| **low** | 一阶段 | ❌ | ⚡ Guardrail 自动 | auto | 0 |
| **research** | 一阶段 | ❌ | ✅ 庞统确认 | single_reviewer | 2 |

### 6.2 Guardrail 执行

```yaml
# config/guardrails.yaml 示例
task_types:
  coding:
    output_review:
      required: true
      layers:
        L1:  # Daemon 直接执行
          - assert: "len(glob('tests/test_*.py')) > 0"
            message: "缺少测试文件"
          - assert: "import subprocess; subprocess.run(['python', '-m', 'py_compile', output_path], check=True)"
            message: "Python 语法检查失败"
        L2:  # Subagent 执行
          prompt: "检查代码是否遵循项目规范，重点关注：命名、异常处理、资源释放"
  deploy:
    output_review:
      required: true
      layers:
        L1:
          - assert: "os.path.exists('deploy_log.md')"
            message: "缺少部署日志"
  data:
    output_review:
      required: false  # low 风险，Guardrail 自动
```

### 6.3 反驳权流控

审查者 verdict=needs_revision（有 critical/major）→ spawn 原执行者反驳 → 协商轮次 ≤ max_rounds → 不设超时，有催促通知 → 超轮次升级庞统。

详见 `topic3-challenge-review-proposal.md §5.3`。

### 6.4 评审详情 Schema

评审结果写入 `{task_id}/reviews/{review_id}.json`，包含：
- `issues[]`（status/severity/category/location+context/suggestion）
- `evidence[]`（file_content/command_output）
- `positives[]`、`meta`
- category 含：correctness/security/performance/style/scope_deviation/**architecture/robustness**

详见 `topic3-challenge-review-proposal.md §5.2`。

---

## 7. 经验沉淀

### 7.1 两级蒸馏

| 级别 | 触发时机 | 产出 | 存储 |
|------|---------|------|------|
| 一级（实时） | 任务完成后 | 经验条目（key findings/lessons/tags） | experiences 表 |
| 二级（周期） | 同 tag 积累 N 条 | Skill 草稿（draft→active→deprecated） | skills/ 目录 |

### 7.2 经验注入

build_bootstrap() 按 tag 检索 experiences 表，格式化后注入 L2 上下文。

详见 `topic6-experience-loop-proposal.md`。

---

## 8. Skill 体系

### 8.1 Skill 三层载体

| 载体 | 自由度 | 生命周期 | 产出者 | 存储 |
|------|--------|---------|--------|------|
| **Memory** | 高（自然语言） | 短期（30天过期） | Agent 自动沉淀 | experiences 表 |
| **Skill** | 中（模板+约束） | 中期（版本管理） | 二级蒸馏 / 人工编写 | skills/ 目录 |
| **Rule** | 低（脚本/断言） | 长期（代码级稳定） | 人工提炼 | guardrails.yaml |

信息压缩方向：Memory → Skill → Rule（自由度递减，可靠性递增）。

### 8.2 Skill 目录结构

```
sanguo_moziplus_v2/
├── skills/                          ← 全局 Skill 库
│   ├── builtins/                    ← 系统内置 Skill
│   │   ├── blackboard_operations/   ← 黑板操作规范
│   │   ├── code_review/             ← 代码审查标准
│   │   └── data_validation/         ← 数据验证
│   └── custom/                      ← 用户/蒸馏产出 Skill
│       └── {skill_id}/n    │           ├── SKILL.md            ← 四要素：description/triggers/actions/constraints
    │           ├── template.md         ← 可选：详细模板
    │           └── meta.yaml           ← 版本、来源、tag
    │
├── projects/{pid}/
    │   └── skills/                   ← per-project Skill 覆盖/扩展
    │       └── {skill_id}/
    │           └── project_override.md
```

### 8.3 Skill 四要素（SKILL.md 格式）

```markdown
# {skill_name}

## Description
一句话描述能力。

## Triggers
自动触发条件（任务类型/关键词/产出类型）。

## Actions
执行步骤和产出要求。

## Constraints
硬性约束（必须满足/禁止做）。
```

### 8.4 Skill 生命周期

```
draft（蒸馏产出/人工创建）
  → active（验证通过，build_bootstrap 可引用）
  → deprecated（30天无引用/被更好的替代）
  → deleted（清理）
```

- **draft → active**：二级蒸馏自动标记，或人工在 Dashboard 审批
- **active → deprecated**：`expire_days` 无引用自动降级
- **active → deprecated → deleted**：有新版本替代时

### 8.5 Skill 在 Daemon 中的角色

```python
# daemon/bootstrap.py 中 Skill 加载逻辑

def load_skills(task, role, project_config) -> list[str]:
    """L3 被动参考层：按需加载 Skill description"""
    skills = []

    # 1. 按 task_type 匹配 triggers
    builtin_skills = scan_skills("skills/builtins/", task.task_type)

    # 2. per-project 覆盖
    project_skills = scan_skills(f"projects/{task.project_id}/skills/", task.task_type)

    # 3. 经验匹配（experiences 表按 tag 检索，注入 L2）
    # → 这部分在 build_bootstrap() 的 L2 ⑦ 中处理

    # 4. 只返回 description（四要素摘要），不加载完整 SKILL.md
    return [s.description for s in builtin_skills + project_skills if s.status == 'active']
```

**四层加载**（来源：课题4 D4-6）：

| 层 | 加载时机 | 内容 | 占用 |
|----|---------|------|------|
| Agent 固化 | OpenClaw agent 配置 | SOUL.md/IDENTITY.md/TOOLS.md | L1（Agent 自带） |
| OpenClaw 注册 | agent 启动时 | OpenClaw skills/ 目录 | L3（按需） |
| moziplus 注入 | build_bootstrap() | prompt_templates + guardrails + review_protocols | L2（精确注入） |
| 按需检索 | Agent 执行中主动查询 | Skill SKILL.md 全文 | L3（Agent 自己读） |

### 8.6 template_components.yaml

模板组件库，build_bootstrap() L2 拼装时引用：

```yaml
components:
  - id: executor_ops
    file: prompt_templates/executor.md
    inject_to: [executor]

  - id: reviewer_ops
    file: prompt_templates/reviewer.md
    inject_to: [reviewer]

  - id: planner_ops
    file: prompt_templates/planner.md
    inject_to: [planner]

  - id: guardrails
    file: config/guardrails.yaml
    inject_to: [executor]
    condition: task_type in guardrails

  - id: review_protocol
    file: config/review_protocols/{task_type}_review.yaml
    inject_to: [reviewer, planner]
    condition: review required

  - id: experience_injection
    source: experiences_table
    inject_to: [executor, reviewer]
    condition: matching_tags > 0

  - id: custom
    file: null  # per-project 自定义
    inject_to: []
```

---

## 9. API 设计

### 9.1 黑板 API

| 方法 | 路径 | 说明 |
|------|------|------|
| GET | `/api/projects/{pid}/tasks` | 任务列表（支持过滤） |
| GET | `/api/projects/{pid}/tasks/{id}` | 任务详情 |
| POST | `/api/projects/{pid}/tasks` | 创建任务 |
| POST | `/api/projects/{pid}/tasks/{id}/claim` | 认领 |
| PATCH | `/api/projects/{pid}/tasks/{id}/status` | 更新状态 |
| POST | `/api/projects/{pid}/tasks/{id}/comments` | 添加评论 |
| POST | `/api/projects/{pid}/tasks/{id}/outputs` | 写入产出 |
| POST | `/api/projects/{pid}/tasks/{id}/decisions` | 记录决策 |
| POST | `/api/projects/{pid}/tasks/{id}/observations` | 添加观察 |
| POST | `/api/projects/{pid}/tasks/{id}/reviews` | 提交评审 |
| POST | `/api/projects/{pid}/tasks/{id}/archive` | 归档/取消归档（v2.8） |
| POST | `/api/projects/{pid}/tasks/archive-done` | 一键归档（v2.8） |
| GET | `/api/projects/{pid}/tasks/{id}/checkpoints` | Checkpoint 列表（M3） |
| POST | `/api/projects/{pid}/tasks/{id}/checkpoints` | 创建 Checkpoint（M3） |
| POST | `/api/projects/{pid}/tasks/{id}/checkpoints/{cid}/approve` | Checkpoint 通过（M3） |
| POST | `/api/projects/{pid}/tasks/{id}/checkpoints/{cid}/reject` | Checkpoint 驳回（M3） |

### 9.2 Daemon 控制 API

| 方法 | 路径 | 说明 |
|------|------|------|
| POST | `/api/daemon/tick` | 手动触发 tick |
| GET | `/api/daemon/status` | Daemon 状态 |
| GET | `/api/daemon/sessions` | 活跃 session |

### 9.3 SSE 推送

```
GET /api/events?project={pid}
→ SSE 流，事件类型：
  task_created / task_status_changed / review_submitted / rebuttal_added
  notification（4级：🔴🟡🟢🔵）
```

### 9.4 多项目 API

| 方法 | 路径 | 说明 |
|------|------|------|
| GET | `/api/projects` | 项目列表 |
| POST | `/api/projects` | 创建项目 |
| GET | `/api/projects/{pid}` | 项目详情 |
| DELETE | `/api/projects/{pid}` | 归档项目（安全流程） |

---

## 10. Hook 系统

双重 Hook 架构：

| Hook | 所属 | 触发时机 | 用途 |
|------|------|---------|------|
| `agent_turn_prepare` | OpenClaw Plugin | Agent 接收消息前 | 注入铁律（L0） |
| `agent_turn_complete` | OpenClaw Plugin | Agent 完成后 | 触发 lint/test（工具链集成点） |
| `pre_task_claim` | moziplus HookRegistry | Agent claim 前 | 权限检查 |
| `post_output_write` | moziplus HookRegistry | 产出写入后 | 触发 Guardrail 检查 |
| `post_review_submit` | moziplus HookRegistry | 评审提交后 | 触发反驳权流程 |

---

## 11. 前端架构

### 11.1 技术选型

复用 v1.0 前端框架（React + Vite + TypeScript），重设计页面结构。

### 11.2 页面结构（5页）

| 页面 | 内容 | 来源 |
|------|------|------|
| **任务看板** | 任务卡片、Checkpoint 交互、状态流转 | 课题7+9 |
| **全局监控** | Agent 状态、系统健康、资源使用 | 课题9 |
| **产出档案** | 产出物预览/下载、评审详情 | 课题9 |
| **系统配置** | 项目管理、Agent 配置、Guardrail 编辑 | 课题9 |
| **AI Briefing** | 日报/周报自动生成 | 课题9 |

### 11.3 实时推送

SSE 端点 `/api/events`，前端 EventSource 监听。4 级推送（🔴🟡🟢🔵）。降级：SSE 不可用时 30s 轮询。

### 11.4 构建部署

```bash
cd src/frontend && npm run build
# 产物在 src/frontend/dist/
# FastAPI 直接托管静态文件（port 8083）
```

详见 `topic9-dashboard-design.md`（课题9 Dashboard 前后端完整设计方案）。

---

## 12. 测试策略

### 12.1 单元测试

| 测试文件 | 覆盖 |
|---------|------|
| test_blackboard.py | operations 全函数（claim CAS、状态机、comment_type、review CRUD） |
| test_daemon_tick.py | tick 流程（Inbox 处理、依赖推进、反驳权进度检测） |
| test_dispatcher.py | 三级调度判据 + fallback |
| test_guardrail.py | L1 assert 执行 + L2 prompt 触发 |
| test_review_flow.py | 审查流水线（分级审查、反驳权、升级） |
| test_experience.py | 一级蒸馏 + tag 检索 |
| test_bootstrap.py | 四层上下文拼装（按 role 精确注入） |
| test_counter.py | ActiveAgentCounter 并发控制 |

### 12.2 集成测试

- 创建任务 → 调度执行 → Guardrail → 审查 → 反驳 → 完成 闭环
- 多项目并发：两个项目同时 tick，互不影响
- 竞态测试：两个 Agent 同时 claim + 同时写 inbox

### 12.3 测试数据库

per-project 测试用 `:memory:` SQLite。全局注册表测试用临时文件。

---

## 13. 实现顺序

| Phase | 内容 | 估计时间 |
|-------|------|---------|
| **P1** | 黑板 + Daemon + CLI + API + 多项目 | ~20-25h（含调试 buffer） |
| **P2** | 审查流水线 + Guardrail + 反驳权 + build_bootstrap | ~12h |
| **P3** | 前端重设计 + SSE 推送 + AI Briefing | ~10h |
| **P4** | 经验沉淀 + Skill 进化 + 工具链集成 | ~8h |

---

## 14. 容量估算

### 14.1 存储容量

| 组件 | 单项目估算 | 说明 |
|------|-----------|------|
| blackboard.db | 2-10 MB / 100 任务 | tasks + comments(5-20行/任务) + outputs + reviews + events(5-10行/任务) + experiences，含索引和 WAL overhead |
| artifacts/ | 10-50 MB / 100 任务 | 代码文件、分析报告、数据文件 |
| experiences/ | < 1 MB | 经验条目轻量，文本为主 |
| Inbox JSONL | < 100 KB | 持续 truncate，不累积 |
| _registry.yaml | < 10 KB | 项目元信息，轻量 |

**总磁盘预估（10 项目，1000 任务）**：~1-2 GB，完全在 Mac mini 容量范围内。

### 14.2 内存占用

| 组件 | 占用估算 | 说明 |
|------|---------|------|
| Daemon + FastAPI | 50-100 MB | Python 进程基础 + asyncio event loop |
| 每个 Agent spawn | 100-300 MB | openclaw agent CLI 进程，执行期间临时占用 |
| SQLite 连接池 | < 10 MB | per-project 连接，用完释放 |
| 前端 dist 静态服务 | < 5 MB | 内存映射 |

**峰值内存（max_global=5，5 个 Agent 同时执行）**：~1-1.5 GB，16GB Mac mini 无压力。

### 14.3 并发能力

| 维度 | 设计上限 | 瓶颈分析 |
|------|---------|----------|
| 同时活跃项目 | 无硬限（10+） | tick 30s 扫全部项目，每项目 tick 耗时 < 100ms，10 项目 < 1s |
| 并发 Agent | 5 (max_global) | ActiveAgentCounter 控制，超出排队 |
| SSE 连接 | 10-20 | 单机场景足够，FastAPI SSE 无硬限 |
| Inbox 吞吐 | 200+ 写/秒 | truncate 模式，实测无丢失 |
| API QPS | 100+ | FastAPI 单进程足够，无 LB 瓶颈 |

### 14.4 性能约束

| 场景 | 延迟 | 说明 |
|------|------|------|
| 用户提需求 → 任务写入黑板 | < 5s | Agent 对话 + CLI 写入 |
| 任务 pending → Agent 开始执行 | 30s 内 | 最坏等一轮 tick；Inbox 触发可秒级 |
| Agent 完成 → 下游任务 pending | 30s 内 | tick 扫描依赖推进 |
| SSE 事件推送延迟 | < 1s | event loop 内直接推送 |
| 审查 → 反驳权启动 | 30s 内 | tick 扫描 review 状态 |

---

## 15. 失败模式与可靠性

### 15.1 进程级故障

| 故障 | 检测 | 恢复 |
|------|------|------|
| Daemon 进程崩溃 | PM2 auto restart | PM2 5s 内自动拉起，tick 恢复扫描 |
| Agent spawn 子进程僵死 | health.py 僵尸检测 | 连续 20 tick 无变更 → observation 告警 + reclaim 释放 semaphore |
| Agent spawn 失败（CLI 错误） | spawner 异常捕获 | 标记任务 failed，写入 events 表，不阻塞其他任务 |
| FastAPI 进程异常 | PM2 restart | 与 Daemon 同进程，PM2 统一管理 |

### 15.2 数据级故障

| 故障 | 检测 | 恢复 |
|------|------|------|
| SQLite 写入冲突 | busy_timeout=5s 等待 + WAL 模式 | WAL 允许并发读写；超时后 raise，tick 下次重试 |
| SQLite DB 损坏 | 连接时 PRAGMA integrity_check | per-project 隔离，单 DB 损坏不影响其他项目；从最新 Git 备份恢复 |
| Inbox JSONL 损坏 | JSON 解析异常 | truncate 清空重置，Agent 重发事件 |
| _registry.yaml 损坏 | YAML 解析异常 | Git 版本管理，`git checkout` 恢复 |

### 15.3 逻辑级故障

| 故障 | 检测 | 恢复 |
|------|------|------|
| Agent 无限循环 | 连续 20 tick 无状态变更 | observation 告警 + 通知用户 + reclaim |
| 反驳权无限协商 | max_rounds 兜底 | 超轮次自动升级庞统裁决 |
| 任务卡在 blocked | tick 依赖推进检查 | 每轮 tick 重算依赖，不依赖缓存 |
| Guardrail 误杀 | L1 assert 可能误判 | L2 subagent 二次确认；用户可在 Dashboard 手动 override |

### 15.4 恢复优先级

```
P0: Daemon 进程 → PM2 auto restart
P1: 数据完整性 → SQLite WAL + Git 备份
P2: 任务进度   → tick 全量扫描自动恢复
P3: 经验数据   → experiences 表 + skills/ 目录 Git 版本管理
```

---

## 16. 演进路径

### 16.1 已知限制与扩展点

| 当前限制 | 触发条件 | 演进方向 |
|---------|---------|--------|
| SQLite 单机 | 项目 > 20 或 DB > 100MB | 迁移 PostgreSQL（per-project schema），代码层只改 db.py |
| max_global=5 | Agent 并发不够 | 调整 ActiveAgentCounter 参数；引入优先级队列 |
| 单机部署 | 需要多节点 | Agent spawn 改为远程调度（Windows-Test-Node 已可远程执行） |
| SSE 单进程 | SSE 连接 > 50 | 引入 Redis pub/sub + 多 worker |
| 无用户认证 | 多用户协作需求 | 引入 API token + per-project 权限（project.yaml 扩展） |

### 16.2 接口抽象层（为演进预留）

关键接口已做抽象，替换底层不影响上层逻辑：

| 接口 | 当前实现 | 替换时影响范围 |
|------|---------|--------------|
| `blackboard.db.py` | SQLite | 只改 db.py，operations/queries 不变 |
| `daemon.spawner.py` | asyncio.create_subprocess_exec | 只改 spawner.py，dispatcher 不变 |
| `daemon.counter.py` | asyncio.Semaphore | 只改 counter.py，dispatcher 不变 |
| `api.sse_routes.py` | FastAPI SSE | 只改 sse_routes.py，前端不变 |

---

## 17. 风险

| 风险 | 概率 | 影响 | 缓解 |
|------|------|------|------|
| per-project SQLite 并发 tick | 中 | 中 | WAL + busy_timeout + per-project asyncio.Lock |
| Agent spawn 子进程回收 | 中 | 中 | health.py 僵尸检测 + reclaim |
| Inbox JSONL 并发写入 | 低 | 低 | truncate（不删除），实测 200 并发 0 丢失 |
| 前端 v1→v2 迁移 | 低 | 低 | v1(8082) 和 v2(8083) 独立运行，渐进替换 |
| Daemon 逻辑死循环 | 低 | 中 | 连续 20 tick 无变更 → observation 告警 + 通知用户 |
| 反驳权无限协商 | 低 | 低 | max_rounds 兜底 + 超轮次升级庞统 |
| 上下文窗口膨胀 | 中 | 中 | L0-L3 四层分级 + 产出写入黑板不累积 |
| 经验注入噪声 | 低 | 低 | 只注入 matching tag 的经验；N 条阈值可控 |
| Guardrail 误杀 | 低 | 中 | L1+L2 双层验证；用户可 Dashboard override |