docs: 共享意识空间调研报告 v1.0 - 综合 wiki + 学术 + 生产实践

This commit is contained in:
cfdaily
2026-05-14 07:58:21 +08:00
parent 7ad5a91bdf
commit 745c9d4218
@@ -0,0 +1,416 @@
# 共享意识空间(Shared Consciousness)调研报告
**版本**: v1.0
**日期**: 2026-05-14
**作者**: 庞统(副军师)
**目的**: 为 moziplus v2.0 AI 原生架构设计共享意识空间,综合 wiki 已有经验 + 前沿学术 + 生产实践
---
## 第一部分:Wiki 已有经验(知识库检索)
> ⚠️ 以下内容来自 wiki-vault practices/,是之前项目调研中已经蒸馏的结构化知识。
### 1. AI Native 多Agent架构实践
**来源**: `practices/ai-native-multi-agent-architecture`
#### 编排混合模式
- 业界共识:不纯 DAG 也不纯 ReAct,而是"可预测骨架 + LLM 动态填充"
- LangGraph:图定义结构,条件边动态路由
- OpenAI Agent SDKHandoff 显式转交 + 对话历史传递
- Google ADK:层级树 + LLM 做委派决策
- **实践**:保留确定性引擎做底层保障(状态追踪、超时保护),在决策点插入 LLM 判断
#### 通信四模式(按 AI native 程度递进)
1. **点对点异步消息**Sanguo Mail):有损、延迟、缺上下文——最基础
2. **共享工作区 + 结构化产出**Claude Code):文件系统 + JSON 接口——简单有效
3. **对话历史传递**OpenAI Handoff):转交时携带完整上下文——"surprisingly effective"
4. **Blackboard 广播**(学术前沿):全局黑板 + LLM 控制单元路由——最强但最复杂
#### Skill 三层组合
- Execution Layer + Enhancement Layer + Guarantee Layer
- 从工具层→行为层→认知层演进
#### 经验沉淀:Memory → Skills → Rules 三层压缩
- Memory:原始执行 trace 存档
- Skills:从多次经验中抽象的可复用操作序列
- Rules:高度压缩的启发式规则/偏好
#### 对 v2.0 的具体借鉴
| 方向 | 做法 | 来源 |
|------|------|------|
| 编排动态化 | Goal-first + Coordinator 动态分解 | open-multi-agent |
| 质量门禁 | 三方共识(Planner+Architect+Critic | oh-my-claudecode |
| 并行安全 | propose→validate→commit 原子写入 | Network-AI |
| 防偷懒 | Scope Reduction Detection | get-shit-done |
| 紧急中断 | Steer 优先级消息 | wanman |
| 经验沉淀 | 任务完成后 nudge 持久化 | hermes |
| 上下文隔离 | Wave Execution 独立上下文 | get-shit-done |
| 运维保障 | 心跳+reclaim+幻觉门控+per-task retry | Hermes v0.13 |
| 跨Agent传递 | Canonical IR + Fidelity 三档 | Opal-Bridge |
### 2. 多Agent协作模式
**来源**: `practices/multi-agent-collaboration-patterns`
#### 四种编排模式
| 模式 | 结构 | 适用场景 |
|------|------|----------|
| 线性流水线 | A→B→C→D | 明确先后顺序 |
| 并行扇出 | A→[B,C,D]→Merge | 子任务独立可并行 |
| 主从模式 | Supervisor→Workers | 有明确协调者 |
| 网状协作 | Agent互调 | 需要灵活路由(谨慎) |
#### 三种通信协议
| 协议 | 优点 | 缺点 | 适用场景 |
|------|------|------|----------|
| 文件通信 | 简单可靠可追溯 | 慢需轮询 | 大文件、持久化 |
| 消息队列 | 异步解耦可扩展 | 复杂需基础设施 | 高并发 |
| RPC/API | 快同步类型安全 | 耦合紧 | 实时通信 |
#### 冲突解决策略
- 写冲突:锁定+排队(try_acquire + release
- 逻辑冲突:优先级+仲裁(Supervisor 决策)
- 资源冲突:队列+限流
### 3. Network-AI 原子黑板
**来源**: `practices/network-ai-practices`
#### 核心机制
- **propose→validate→commit** 三阶段原子写入,消除 split-brain
- **Priority-Wins** 优先级抢占:0-3级(low/normal/high/critical),高优先级可抢占低优先级
- **FileLock** 文件系统互斥锁:零外部依赖,wx标志保证原子性
- **FederatedBudget** 联邦预算追踪:全局上限 + per-Agent 上限
#### 启示
- 风控Agent(关羽)应该是最高优先级
- 数据验证Agent(赵云)的校验结果也应高优先级
- NAS上的共享数据文件写入需要锁机制防并发损坏
### 4. Opal-Bridge 跨Agent Session 翻译
**来源**: `practices/opal-bridge-practices`
#### 五大核心机制
1. **Canonical IR 中间表示**N个Agent只需2N个adapter,结构对称不偏袒
2. **Moments 原子事件**:13种事件类型,时间戳单调递增,source_ref可追溯
3. **Fidelity 三档**:无损(Mode A/ LLM摘要(Mode B/ 混合保留最近N条(Mode C)
4. **Subagent 策略**inline(拼入主线)/ split(独立文件)/ drop(只保留结果)
5. **覆盖保护**:翻译器永远不修改用户原始数据
### 5. ClawTeam OpenClaw 多Agent协作
**来源**: `practices/clawteam-openclaw-practices`
#### 关键实践(28条中的精选)
| # | 实践 | 核心思路 | v2.0 借鉴点 |
|---|------|----------|------------|
| 1 | Git Worktree 隔离 | 每个Agent独立分支,零合并冲突 | 并行编码隔离 |
| 2 | fcntl文件锁+原子rename | 无数据库并发安全 | 黑板写入安全 |
| 3 | Inbox文件消息系统 | JSON文件即消息,claim→ack模式 | Agent间通信 |
| 4 | 任务依赖链+自动解除 | blocked_by字段+DFS环检测+自动流转 | 动态计划 |
| 5 | Boids群体智能规则 | Separation/Alignment/Cohesion/Boundary | Agent行为注入 |
| 6 | 任务锁机制 | locked_by+死锁回收 | 防止任务重复执行 |
| 7 | Agent生命周期感知 | tmux pane存活检测+任务自动回收 | 僵尸检测 |
| 8 | 元认知自评 | [confidence: 0.X] 置信度标注 | 产出质量信号 |
| 10 | Auftragstaktik任务式指挥 | Intent→End State→Constraints | 任务分配方式 |
| 11 | 成本追踪 | Agent自报Token消耗+增量汇总 | Token治理 |
| 12 | Agent数量限制 | 默认max=4,有学术依据 | 并行度控制 |
| 14 | Plan审批工作流 | Worker提交计划→Leader审批→执行 | 复杂任务门控 |
| 15 | Dead Letter隔离 | 格式错误消息不阻塞队列 | 消息处理韧性 |
| 19 | 不可变事件日志 | inbox消息消费删除+事件日志永久保留 | 审计追溯 |
| 20 | on-exit钩子 | trap EXIT自动清理+通知 | Agent崩溃恢复 |
| 27 | 共享记忆作用域 | team级memory scope | 团队知识共享 |
### 6. Hermes v0.13 Kanban 运维保障
**来源**: `practices/hermes-kanban-v0.13-practices`
| 机制 | 做法 | v2.0 借鉴 |
|------|------|----------|
| 心跳+Reclaim | 定期心跳,超时自动回收任务 | Worker生命周期管理 |
| 幻觉门控 | Agent声称完成时验证产出是否存在 | "不验证不算完" |
| Per-Task重试 | 每个任务独立max_retries | 灵活重试策略 |
| Worker自动Block | 异常Worker不再接新活 | 防止坏Agent继续接活 |
| /goal Ralph Loop | 持久目标跨turn保持 | "持续指挥官"原语 |
### 7. 知识管理体系
**来源**: `practices/knowledge-management-system`
#### 闭环学习(DISCOVER→DISTILL→APPLY→IMPROVE
- 只记录不应用的知识是浪费
- 只应用不沉淀的知识是重复劳动
- 闭环必须完整
#### 四层金字塔
- L0 记忆层(MEMORY.md)→ L1 经验层 → L2 知识层(wiki) → L3 体系层(设计文档)
#### 五路径增长
- 调研驱动 / 问题驱动 / 外部注入 / 反向触发 / 交叉碰撞
---
## 第二部分:前沿学术与生产实践(Web 调研)
### 8. bMASBlackboard LLM Multi-Agent System
**来源**: *"Exploring Advanced LLM Multi-Agent Systems Based on Blackboard Architecture"* (arXiv:2507.01701, 2025.07)
#### 三大核心组件
1. **Control Unit**:LLM驱动,根据黑板内容动态选择下一轮该哪个Agent行动
2. **Blackboard**:全局共享信息空间,所有Agent读写,是唯一的记忆和消息传递中枢
3. **Agent Group**:不同专业角色的LLM Agent
#### 关键机制
- **动态选择**:不是固定DAGControl Unit根据黑板当前内容决定下一步
- **迭代收敛**:Agent轮流行动→更新黑板→Control Unit判断→直到黑板达成共识
- **全息可见**:所有Agent能看到黑板上的所有信息
#### 实验结果
- bMAS在常识推理和数学任务上**匹配甚至超过**静态编排和动态编排系统
- **token效率更高**(因为Control Unit做智能路由,不浪费在不相关的Agent上)
### 9. Global Workspace TheoryGWT)与AI意识
**来源**: Bernard Baars 认知科学理论 + ACM CENs 论文 (2025)
#### 核心循环
```
竞争(各模块提交信息)→ 选择(Control Unit选出胜出者)→ 广播(胜出信息共享给所有模块)→ 下一轮
```
#### 对共享意识空间的映射
- GWT的"专业模块" = 我们的各个Agent
- GWT的"全局工作空间" = 我们的Blackboard
- GWT的"竞争→选择→广播" = 我们的Control Unit路由机制
- **Serial bottleneck is a feature, not a bug**:串行瓶颈确保信息不冲突
### 10. KVCOMMNeurIPS 2025)—— 共享 KV Cache
**来源**: *"KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems"*
#### 关键洞察
- 多个Agent共享前缀文本时,可复用KV Cache
- 5个Agent场景下 **7.8× 加速**TTFT从~430ms降到~55ms
- **70%+ KV-cache reuse** in five-agent settings
#### 启示
- 共享意识空间不需要每个Agent都重新"理解"全部上下文
- 公共部分可以缓存和复用(这是模型层面的优化,我们暂不实现,但未来方向)
### 11. PSMASPhase-Scheduled Multi-Agent Systems
**来源**: arXiv:2604.17400, 2026.04
#### 关键思路
- 把Agent激活看作**连续控制**而非离散RPC
- 在共享注意力空间(circular manifold)上调度Agent
- **34.8% token reduction**
### 12. O'Reilly 模式总结(2026.02
**来源**: *"Designing Effective Multi-Agent Architectures"* (O'Reilly Radar)
#### 关键洞察
- **共享产出物(shared artifacts)比共享消息更重要**
- **Blackboard + shared memory > manager routing every thought**
- 2026存活下来的协作系统共同特征:**Phase gates + shared artifacts + final supervisor**
- **纯 Open Mesh(无结构自由协作)是失败模式**
### 13. Meta 生产实践
**来源**: Multi-Agent in Production 2026 总结
- Meta's tribal-knowledge engine: **critics, fixers, upgraders, testers** over **shared artifacts inside one session**
- 关键:**在一个session内围绕共享artifacts协作**,不同角色轮流在同一空间工作
- Spotify's Ads AI: decomposes media planning into specialized agents working in parallel
### 14. LangGraph 共享状态模式
**来源**: LangGraph 文档 + 生产案例
- 每个Agent是一个节点,接受和返回**共享状态**(TypedDict
- Supervisor节点负责路由决策
- **Postgres-backed checkpointers** 做长期持久化
- 关键:**状态是 reducer 模式**——多个Agent可并发写入同一个key,通过reducer合并
### 15. OpenClaw RFC #35203
**来源**: github.com/openclaw/openclaw/issues/35203
OpenClaw官方已提出RFC**Capability Profiling + Shared Blackboard + Layered Memory + Token Cost Governance**
- 每个Agent的capability profiling(能力画像)
- 共享黑板机制
- 分层记忆边界
- Token成本治理
---
## 第三部分:综合分析与方案设计
### 设计原则(从调研中提炼)
1. **黑板是唯一真相源**:所有Agent通过黑板共享信息,没有私下通信
2. **Control Unit是AI驱动的**:不是规则路由,而是LLM根据当前黑板状态动态决策
3. **写入保护**:不是谁都能随意改任何字段,需要propose→validate→commit
4. **信息分级**:不是所有Agent都看全量信息,Fidelity三档按需路由
5. **产出物>消息**:共享产出物比共享消息更重要
6. **验证才算完**:Agent声称完成时必须验证产出是否真实存在
7. **结构对称**:不把任何一个Agent当"主"——Canonical IR原则
8. **有界并行**:默认max=4个并行Agent,有学术依据
9. **任务式指挥**Intent→End State→ConstraintsAgent自主决定怎么做
10. **闭环学习**:执行→经验沉淀→下次改进
### 共享意识空间架构
```
┌─────────────────────────────────────────────────────────────────┐
│ 用户(自然语言入口) │
└──────────────────────────┬──────────────────────────────────────┘
┌──────────────────────────▼──────────────────────────────────────┐
│ 庞统(指挥官 + Control Unit
│ │
│ 四相循环: │
│ Phase 1: 苏格拉底对话 → 理解需求 │
│ Phase 2: 动态规划 → 生成/调整计划 │
│ Phase 3: 持续指挥 → 调度Agent + 监控 + 异常处理 │
│ Phase 4: 主动汇报 → 推送进展 + 验收 │
│ │
│ ┌───────────────────────────────────────────────────────────┐ │
│ │ Blackboard(全局共享黑板) │ │
│ │ │ │
│ │ ┌────────────┐ ┌────────────┐ ┌────────────┐ │ │
│ │ │ TaskCtx │ │ Moments │ │ Artifacts │ │ │
│ │ │ 任务上下文 │ │ 原子事件流 │ │ 产出物索引 │ │ │
│ │ └────────────┘ └────────────┘ └────────────┘ │ │
│ │ ┌────────────┐ ┌────────────┐ ┌────────────┐ │ │
│ │ │ PlanGraph │ │ AgentStates│ │ Experience │ │ │
│ │ │ 动态计划 │ │ Agent状态 │ │ 经验记忆 │ │ │
│ │ └────────────┘ └────────────┘ └────────────┘ │ │
│ │ ┌────────────┐ │ │
│ │ │ EventLog │ ← 不可变事件日志(审计追溯) │ │
│ │ └────────────┘ │ │
│ └───────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
│ Fidelity三档读写
┌──────────────────┼──────────────────┐
│ │ │
┌────▼────┐ ┌────▼────┐ ┌────▼────┐
│ 张飞 │ │ 关羽 │ │ 赵云 │ ...
│ 编码 │ │ 风控 │ │ 数据 │
└─────────┘ └─────────┘ └─────────┘
```
### 七大核心机制
#### 1. Blackboard 物理结构(文件系统 + 结构化JSON)
```
consciousness/
├── tasks/{task-id}/
│ ├── context.json # 任务上下文
│ ├── moments.jsonl # 原子事件流(追加写入)
│ ├── artifacts/ # 产出物
│ ├── decisions.jsonl # 决策记录
│ ├── plan.json # 动态计划图谱
│ └── agents/{agent-id}.json # Agent当前状态
├── global/
│ ├── agent-registry.json # Agent能力画像
│ ├── experience/ # 跨任务经验
│ └── templates/ # 任务模板
├── events/ # 不可变事件日志
│ └── evt-{ts}-{uuid}.json
└── inbox/ # 用户需求入口
```
#### 2. Control Unit(庞统)
- 苏格拉底对话理解需求
- 根据黑板状态动态规划
- 根据能力画像选择Agent
- 监控Agent状态、检测异常
- Fidelity分档信息路由
#### 3. Moments 原子事件流(借鉴 Opal-Bridge
13+ 种事件类型,追加写入JSONL,时间戳单调递增。
#### 4. Fidelity 三档信息路由
| 档位 | 内容 | 对象 |
|------|------|------|
| Full | 完整moments + 全部artifacts | 庞统 |
| Summary | AI压缩关键节点 + 相关artifacts | 协作伙伴 |
| Signal | 只传需行动通知 + 最终结论 | 外围Agent |
#### 5. Agent 能力画像(借鉴 RFC #35203
capabilities / tools / performance_history / current_load
#### 6. 动态计划图谱(替代固定DAG)
计划可在执行中动态调整——庞统发现需额外步骤可直接插入。
#### 7. 写入保护(借鉴 Network-AI
propose→validate→commit 三阶段,配合文件锁。
### 额外借鉴的设计元素
从 wiki 调研中发现的、之前方案未覆盖的重要设计:
| # | 来源 | 设计元素 | v2.0应用 |
|---|------|----------|----------|
| A | ClawTeam #5 | **Boids群体智能规则** | 在Agent prompt中注入 Separation/Alignment/Cohesion/Boundary 四条协作规则 |
| B | ClawTeam #8 | **元认知自评 [confidence: 0.X]** | Agent产出自带质量信号,指挥官据此决定是否需人工介入 |
| C | ClawTeam #10 | **Auftragstaktik任务式指挥** | 任务分配用 Intent→End State→Constraints 三元组,不指定步骤 |
| D | ClawTeam #14 | **Plan审批工作流** | 复杂任务Agent先提交计划,指挥官审批后执行 |
| E | ClawTeam #19 | **不可变事件日志** | Blackboard事件消费语义 + 事件溯源的审计能力 |
| F | ClawTeam #27 | **共享记忆作用域** | team级memory scope实现跨Agent知识共享 |
| G | Hermes #5 | **/goal Ralph Loop** | 持久目标跨turn保持——"持续指挥官"的原语 |
| H | Hermes #2 | **幻觉门控** | Agent声称完成时验证产出是否真实存在 |
| I | Network-AI | **优先级抢占** | 风控Agent(关羽)最高优先级,能抢占其他Agent写入 |
| J | 知识管理 | **闭环学习循环** | DISCOVER→DISTILL→APPLY→IMPROVE |
| K | 学术 bMAS | **迭代收敛到共识** | Agent轮流行动直到黑板达成consensus |
| L | O'Reilly | **Phase gates** | 阶段门控确保质量,不是无结构自由协作 |
| M | OpenClaw RFC | **Token成本治理** | 全局上限 + per-Agent上限 |
---
## 第四部分:待深入问题
1. **物理载体**:文件系统 vs 数据库?——倾向文件系统(与OpenClaw天然兼容、可git追踪)
2. **庞统运行方式**persistent session vs 事件驱动唤醒?
3. **与v1.0 Agent的兼容**:v2.0的Agent是否复用三国团队,还是重新定义?
4. **信息过载防御**:当任务量大时,黑板上的Moments流如何保持可管理?
5. **共识机制**bMAS的"迭代收敛到共识"具体怎么实现?简单投票?LLM仲裁?
---
## 参考来源
### Wiki 知识库
- `practices/ai-native-multi-agent-architecture`
- `practices/multi-agent-collaboration-patterns`
- `practices/network-ai-practices`
- `practices/opal-bridge-practices`
- `practices/clawteam-openclaw-practices`
- `practices/hermes-kanban-v0.13-practices`
- `practices/knowledge-management-system`
### 学术论文
- bMAS: arXiv:2507.01701 (2025.07)
- KVCOMM: NeurIPS 2025
- PSMAS: arXiv:2604.17400 (2026.04)
- GWT: Baars (1988) + ACM CENs (2025)
### 生产实践
- O'Reilly: "Designing Effective Multi-Agent Architectures" (2026.02)
- Meta: shared artifacts in one session
- LangGraph: shared state + reducer pattern
- OpenClaw RFC #35203