# 共享意识空间(Shared Consciousness)调研报告 **版本**: v1.0 **日期**: 2026-05-14 **作者**: 庞统(副军师) **目的**: 为 moziplus v2.0 AI 原生架构设计共享意识空间,综合 wiki 已有经验 + 前沿学术 + 生产实践 --- ## 第一部分:Wiki 已有经验(知识库检索) > ⚠️ 以下内容来自 wiki-vault practices/,是之前项目调研中已经蒸馏的结构化知识。 ### 1. AI Native 多Agent架构实践 **来源**: `practices/ai-native-multi-agent-architecture` #### 编排混合模式 - 业界共识:不纯 DAG 也不纯 ReAct,而是"可预测骨架 + LLM 动态填充" - LangGraph:图定义结构,条件边动态路由 - OpenAI Agent SDK:Handoff 显式转交 + 对话历史传递 - Google ADK:层级树 + LLM 做委派决策 - **实践**:保留确定性引擎做底层保障(状态追踪、超时保护),在决策点插入 LLM 判断 #### 通信四模式(按 AI native 程度递进) 1. **点对点异步消息**(Sanguo Mail):有损、延迟、缺上下文——最基础 2. **共享工作区 + 结构化产出**(Claude Code):文件系统 + JSON 接口——简单有效 3. **对话历史传递**(OpenAI Handoff):转交时携带完整上下文——"surprisingly effective" 4. **Blackboard 广播**(学术前沿):全局黑板 + LLM 控制单元路由——最强但最复杂 #### Skill 三层组合 - Execution Layer + Enhancement Layer + Guarantee Layer - 从工具层→行为层→认知层演进 #### 经验沉淀:Memory → Skills → Rules 三层压缩 - Memory:原始执行 trace 存档 - Skills:从多次经验中抽象的可复用操作序列 - Rules:高度压缩的启发式规则/偏好 #### 对 v2.0 的具体借鉴 | 方向 | 做法 | 来源 | |------|------|------| | 编排动态化 | Goal-first + Coordinator 动态分解 | open-multi-agent | | 质量门禁 | 三方共识(Planner+Architect+Critic) | oh-my-claudecode | | 并行安全 | propose→validate→commit 原子写入 | Network-AI | | 防偷懒 | Scope Reduction Detection | get-shit-done | | 紧急中断 | Steer 优先级消息 | wanman | | 经验沉淀 | 任务完成后 nudge 持久化 | hermes | | 上下文隔离 | Wave Execution 独立上下文 | get-shit-done | | 运维保障 | 心跳+reclaim+幻觉门控+per-task retry | Hermes v0.13 | | 跨Agent传递 | Canonical IR + Fidelity 三档 | Opal-Bridge | ### 2. 多Agent协作模式 **来源**: `practices/multi-agent-collaboration-patterns` #### 四种编排模式 | 模式 | 结构 | 适用场景 | |------|------|----------| | 线性流水线 | A→B→C→D | 明确先后顺序 | | 并行扇出 | A→[B,C,D]→Merge | 子任务独立可并行 | | 主从模式 | Supervisor→Workers | 有明确协调者 | | 网状协作 | Agent互调 | 需要灵活路由(谨慎) | #### 三种通信协议 | 协议 | 优点 | 缺点 | 适用场景 | |------|------|------|----------| | 文件通信 | 简单可靠可追溯 | 慢需轮询 | 大文件、持久化 | | 消息队列 | 异步解耦可扩展 | 复杂需基础设施 | 高并发 | | RPC/API | 快同步类型安全 | 耦合紧 | 实时通信 | #### 冲突解决策略 - 写冲突:锁定+排队(try_acquire + release) - 逻辑冲突:优先级+仲裁(Supervisor 决策) - 资源冲突:队列+限流 ### 3. Network-AI 原子黑板 **来源**: `practices/network-ai-practices` #### 核心机制 - **propose→validate→commit** 三阶段原子写入,消除 split-brain - **Priority-Wins** 优先级抢占:0-3级(low/normal/high/critical),高优先级可抢占低优先级 - **FileLock** 文件系统互斥锁:零外部依赖,wx标志保证原子性 - **FederatedBudget** 联邦预算追踪:全局上限 + per-Agent 上限 #### 启示 - 风控Agent(关羽)应该是最高优先级 - 数据验证Agent(赵云)的校验结果也应高优先级 - NAS上的共享数据文件写入需要锁机制防并发损坏 ### 4. Opal-Bridge 跨Agent Session 翻译 **来源**: `practices/opal-bridge-practices` #### 五大核心机制 1. **Canonical IR 中间表示**:N个Agent只需2N个adapter,结构对称不偏袒 2. **Moments 原子事件**:13种事件类型,时间戳单调递增,source_ref可追溯 3. **Fidelity 三档**:无损(Mode A)/ LLM摘要(Mode B)/ 混合保留最近N条(Mode C) 4. **Subagent 策略**:inline(拼入主线)/ split(独立文件)/ drop(只保留结果) 5. **覆盖保护**:翻译器永远不修改用户原始数据 ### 5. ClawTeam OpenClaw 多Agent协作 **来源**: `practices/clawteam-openclaw-practices` #### 关键实践(28条中的精选) | # | 实践 | 核心思路 | v2.0 借鉴点 | |---|------|----------|------------| | 1 | Git Worktree 隔离 | 每个Agent独立分支,零合并冲突 | 并行编码隔离 | | 2 | fcntl文件锁+原子rename | 无数据库并发安全 | 黑板写入安全 | | 3 | Inbox文件消息系统 | JSON文件即消息,claim→ack模式 | Agent间通信 | | 4 | 任务依赖链+自动解除 | blocked_by字段+DFS环检测+自动流转 | 动态计划 | | 5 | Boids群体智能规则 | Separation/Alignment/Cohesion/Boundary | Agent行为注入 | | 6 | 任务锁机制 | locked_by+死锁回收 | 防止任务重复执行 | | 7 | Agent生命周期感知 | tmux pane存活检测+任务自动回收 | 僵尸检测 | | 8 | 元认知自评 | [confidence: 0.X] 置信度标注 | 产出质量信号 | | 10 | Auftragstaktik任务式指挥 | Intent→End State→Constraints | 任务分配方式 | | 11 | 成本追踪 | Agent自报Token消耗+增量汇总 | Token治理 | | 12 | Agent数量限制 | 默认max=4,有学术依据 | 并行度控制 | | 14 | Plan审批工作流 | Worker提交计划→Leader审批→执行 | 复杂任务门控 | | 15 | Dead Letter隔离 | 格式错误消息不阻塞队列 | 消息处理韧性 | | 19 | 不可变事件日志 | inbox消息消费删除+事件日志永久保留 | 审计追溯 | | 20 | on-exit钩子 | trap EXIT自动清理+通知 | Agent崩溃恢复 | | 27 | 共享记忆作用域 | team级memory scope | 团队知识共享 | ### 6. Hermes v0.13 Kanban 运维保障 **来源**: `practices/hermes-kanban-v0.13-practices` | 机制 | 做法 | v2.0 借鉴 | |------|------|----------| | 心跳+Reclaim | 定期心跳,超时自动回收任务 | Worker生命周期管理 | | 幻觉门控 | Agent声称完成时验证产出是否存在 | "不验证不算完" | | Per-Task重试 | 每个任务独立max_retries | 灵活重试策略 | | Worker自动Block | 异常Worker不再接新活 | 防止坏Agent继续接活 | | /goal Ralph Loop | 持久目标跨turn保持 | "持续指挥官"原语 | ### 7. 知识管理体系 **来源**: `practices/knowledge-management-system` #### 闭环学习(DISCOVER→DISTILL→APPLY→IMPROVE) - 只记录不应用的知识是浪费 - 只应用不沉淀的知识是重复劳动 - 闭环必须完整 #### 四层金字塔 - L0 记忆层(MEMORY.md)→ L1 经验层 → L2 知识层(wiki) → L3 体系层(设计文档) #### 五路径增长 - 调研驱动 / 问题驱动 / 外部注入 / 反向触发 / 交叉碰撞 --- ## 第二部分:前沿学术与生产实践(Web 调研) ### 8. bMAS(Blackboard LLM Multi-Agent System) **来源**: *"Exploring Advanced LLM Multi-Agent Systems Based on Blackboard Architecture"* (arXiv:2507.01701, 2025.07) #### 三大核心组件 1. **Control Unit**:LLM驱动,根据黑板内容动态选择下一轮该哪个Agent行动 2. **Blackboard**:全局共享信息空间,所有Agent读写,是唯一的记忆和消息传递中枢 3. **Agent Group**:不同专业角色的LLM Agent #### 关键机制 - **动态选择**:不是固定DAG,Control Unit根据黑板当前内容决定下一步 - **迭代收敛**:Agent轮流行动→更新黑板→Control Unit判断→直到黑板达成共识 - **全息可见**:所有Agent能看到黑板上的所有信息 #### 实验结果 - bMAS在常识推理和数学任务上**匹配甚至超过**静态编排和动态编排系统 - **token效率更高**(因为Control Unit做智能路由,不浪费在不相关的Agent上) ### 9. Global Workspace Theory(GWT)与AI意识 **来源**: Bernard Baars 认知科学理论 + ACM CENs 论文 (2025) #### 核心循环 ``` 竞争(各模块提交信息)→ 选择(Control Unit选出胜出者)→ 广播(胜出信息共享给所有模块)→ 下一轮 ``` #### 对共享意识空间的映射 - GWT的"专业模块" = 我们的各个Agent - GWT的"全局工作空间" = 我们的Blackboard - GWT的"竞争→选择→广播" = 我们的Control Unit路由机制 - **Serial bottleneck is a feature, not a bug**:串行瓶颈确保信息不冲突 ### 10. KVCOMM(NeurIPS 2025)—— 共享 KV Cache **来源**: *"KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems"* #### 关键洞察 - 多个Agent共享前缀文本时,可复用KV Cache - 5个Agent场景下 **7.8× 加速**,TTFT从~430ms降到~55ms - **70%+ KV-cache reuse** in five-agent settings #### 启示 - 共享意识空间不需要每个Agent都重新"理解"全部上下文 - 公共部分可以缓存和复用(这是模型层面的优化,我们暂不实现,但未来方向) ### 11. PSMAS(Phase-Scheduled Multi-Agent Systems) **来源**: arXiv:2604.17400, 2026.04 #### 关键思路 - 把Agent激活看作**连续控制**而非离散RPC - 在共享注意力空间(circular manifold)上调度Agent - **34.8% token reduction** ### 12. O'Reilly 模式总结(2026.02) **来源**: *"Designing Effective Multi-Agent Architectures"* (O'Reilly Radar) #### 关键洞察 - **共享产出物(shared artifacts)比共享消息更重要** - **Blackboard + shared memory > manager routing every thought** - 2026存活下来的协作系统共同特征:**Phase gates + shared artifacts + final supervisor** - **纯 Open Mesh(无结构自由协作)是失败模式** ### 13. Meta 生产实践 **来源**: Multi-Agent in Production 2026 总结 - Meta's tribal-knowledge engine: **critics, fixers, upgraders, testers** over **shared artifacts inside one session** - 关键:**在一个session内围绕共享artifacts协作**,不同角色轮流在同一空间工作 - Spotify's Ads AI: decomposes media planning into specialized agents working in parallel ### 14. LangGraph 共享状态模式 **来源**: LangGraph 文档 + 生产案例 - 每个Agent是一个节点,接受和返回**共享状态**(TypedDict) - Supervisor节点负责路由决策 - **Postgres-backed checkpointers** 做长期持久化 - 关键:**状态是 reducer 模式**——多个Agent可并发写入同一个key,通过reducer合并 ### 15. OpenClaw RFC #35203 **来源**: github.com/openclaw/openclaw/issues/35203 OpenClaw官方已提出RFC:**Capability Profiling + Shared Blackboard + Layered Memory + Token Cost Governance** - 每个Agent的capability profiling(能力画像) - 共享黑板机制 - 分层记忆边界 - Token成本治理 --- ## 第三部分:综合分析与方案设计 ### 设计原则(从调研中提炼) 1. **黑板是唯一真相源**:所有Agent通过黑板共享信息,没有私下通信 2. **Control Unit是AI驱动的**:不是规则路由,而是LLM根据当前黑板状态动态决策 3. **写入保护**:不是谁都能随意改任何字段,需要propose→validate→commit 4. **信息分级**:不是所有Agent都看全量信息,Fidelity三档按需路由 5. **产出物>消息**:共享产出物比共享消息更重要 6. **验证才算完**:Agent声称完成时必须验证产出是否真实存在 7. **结构对称**:不把任何一个Agent当"主"——Canonical IR原则 8. **有界并行**:默认max=4个并行Agent,有学术依据 9. **任务式指挥**:Intent→End State→Constraints,Agent自主决定怎么做 10. **闭环学习**:执行→经验沉淀→下次改进 ### 共享意识空间架构 ``` ┌─────────────────────────────────────────────────────────────────┐ │ 用户(自然语言入口) │ └──────────────────────────┬──────────────────────────────────────┘ │ ┌──────────────────────────▼──────────────────────────────────────┐ │ 庞统(指挥官 + Control Unit) │ │ │ │ 四相循环: │ │ Phase 1: 苏格拉底对话 → 理解需求 │ │ Phase 2: 动态规划 → 生成/调整计划 │ │ Phase 3: 持续指挥 → 调度Agent + 监控 + 异常处理 │ │ Phase 4: 主动汇报 → 推送进展 + 验收 │ │ │ │ ┌───────────────────────────────────────────────────────────┐ │ │ │ Blackboard(全局共享黑板) │ │ │ │ │ │ │ │ ┌────────────┐ ┌────────────┐ ┌────────────┐ │ │ │ │ │ TaskCtx │ │ Moments │ │ Artifacts │ │ │ │ │ │ 任务上下文 │ │ 原子事件流 │ │ 产出物索引 │ │ │ │ │ └────────────┘ └────────────┘ └────────────┘ │ │ │ │ ┌────────────┐ ┌────────────┐ ┌────────────┐ │ │ │ │ │ PlanGraph │ │ AgentStates│ │ Experience │ │ │ │ │ │ 动态计划 │ │ Agent状态 │ │ 经验记忆 │ │ │ │ │ └────────────┘ └────────────┘ └────────────┘ │ │ │ │ ┌────────────┐ │ │ │ │ │ EventLog │ ← 不可变事件日志(审计追溯) │ │ │ │ └────────────┘ │ │ │ └───────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────┘ │ Fidelity三档读写 ┌──────────────────┼──────────────────┐ │ │ │ ┌────▼────┐ ┌────▼────┐ ┌────▼────┐ │ 张飞 │ │ 关羽 │ │ 赵云 │ ... │ 编码 │ │ 风控 │ │ 数据 │ └─────────┘ └─────────┘ └─────────┘ ``` ### 七大核心机制 #### 1. Blackboard 物理结构(文件系统 + 结构化JSON) ``` consciousness/ ├── tasks/{task-id}/ │ ├── context.json # 任务上下文 │ ├── moments.jsonl # 原子事件流(追加写入) │ ├── artifacts/ # 产出物 │ ├── decisions.jsonl # 决策记录 │ ├── plan.json # 动态计划图谱 │ └── agents/{agent-id}.json # Agent当前状态 ├── global/ │ ├── agent-registry.json # Agent能力画像 │ ├── experience/ # 跨任务经验 │ └── templates/ # 任务模板 ├── events/ # 不可变事件日志 │ └── evt-{ts}-{uuid}.json └── inbox/ # 用户需求入口 ``` #### 2. Control Unit(庞统) - 苏格拉底对话理解需求 - 根据黑板状态动态规划 - 根据能力画像选择Agent - 监控Agent状态、检测异常 - Fidelity分档信息路由 #### 3. Moments 原子事件流(借鉴 Opal-Bridge) 13+ 种事件类型,追加写入JSONL,时间戳单调递增。 #### 4. Fidelity 三档信息路由 | 档位 | 内容 | 对象 | |------|------|------| | Full | 完整moments + 全部artifacts | 庞统 | | Summary | AI压缩关键节点 + 相关artifacts | 协作伙伴 | | Signal | 只传需行动通知 + 最终结论 | 外围Agent | #### 5. Agent 能力画像(借鉴 RFC #35203) capabilities / tools / performance_history / current_load #### 6. 动态计划图谱(替代固定DAG) 计划可在执行中动态调整——庞统发现需额外步骤可直接插入。 #### 7. 写入保护(借鉴 Network-AI) propose→validate→commit 三阶段,配合文件锁。 ### 额外借鉴的设计元素 从 wiki 调研中发现的、之前方案未覆盖的重要设计: | # | 来源 | 设计元素 | v2.0应用 | |---|------|----------|----------| | A | ClawTeam #5 | **Boids群体智能规则** | 在Agent prompt中注入 Separation/Alignment/Cohesion/Boundary 四条协作规则 | | B | ClawTeam #8 | **元认知自评 [confidence: 0.X]** | Agent产出自带质量信号,指挥官据此决定是否需人工介入 | | C | ClawTeam #10 | **Auftragstaktik任务式指挥** | 任务分配用 Intent→End State→Constraints 三元组,不指定步骤 | | D | ClawTeam #14 | **Plan审批工作流** | 复杂任务Agent先提交计划,指挥官审批后执行 | | E | ClawTeam #19 | **不可变事件日志** | Blackboard事件消费语义 + 事件溯源的审计能力 | | F | ClawTeam #27 | **共享记忆作用域** | team级memory scope实现跨Agent知识共享 | | G | Hermes #5 | **/goal Ralph Loop** | 持久目标跨turn保持——"持续指挥官"的原语 | | H | Hermes #2 | **幻觉门控** | Agent声称完成时验证产出是否真实存在 | | I | Network-AI | **优先级抢占** | 风控Agent(关羽)最高优先级,能抢占其他Agent写入 | | J | 知识管理 | **闭环学习循环** | DISCOVER→DISTILL→APPLY→IMPROVE | | K | 学术 bMAS | **迭代收敛到共识** | Agent轮流行动直到黑板达成consensus | | L | O'Reilly | **Phase gates** | 阶段门控确保质量,不是无结构自由协作 | | M | OpenClaw RFC | **Token成本治理** | 全局上限 + per-Agent上限 | --- ## 第四部分:待深入问题 1. **物理载体**:文件系统 vs 数据库?——倾向文件系统(与OpenClaw天然兼容、可git追踪) 2. **庞统运行方式**:persistent session vs 事件驱动唤醒? 3. **与v1.0 Agent的兼容**:v2.0的Agent是否复用三国团队,还是重新定义? 4. **信息过载防御**:当任务量大时,黑板上的Moments流如何保持可管理? 5. **共识机制**:bMAS的"迭代收敛到共识"具体怎么实现?简单投票?LLM仲裁? --- ## 参考来源 ### Wiki 知识库 - `practices/ai-native-multi-agent-architecture` - `practices/multi-agent-collaboration-patterns` - `practices/network-ai-practices` - `practices/opal-bridge-practices` - `practices/clawteam-openclaw-practices` - `practices/hermes-kanban-v0.13-practices` - `practices/knowledge-management-system` ### 学术论文 - bMAS: arXiv:2507.01701 (2025.07) - KVCOMM: NeurIPS 2025 - PSMAS: arXiv:2604.17400 (2026.04) - GWT: Baars (1988) + ACM CENs (2025) ### 生产实践 - O'Reilly: "Designing Effective Multi-Agent Architectures" (2026.02) - Meta: shared artifacts in one session - LangGraph: shared state + reducer pattern - OpenClaw RFC #35203