Files
sanguo_moziplus_v2/docs/research/shared-consciousness-research.md
T

417 lines
20 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 共享意识空间(Shared Consciousness)调研报告
**版本**: v1.0
**日期**: 2026-05-14
**作者**: 庞统(副军师)
**目的**: 为 moziplus v2.0 AI 原生架构设计共享意识空间,综合 wiki 已有经验 + 前沿学术 + 生产实践
---
## 第一部分:Wiki 已有经验(知识库检索)
> ⚠️ 以下内容来自 wiki-vault practices/,是之前项目调研中已经蒸馏的结构化知识。
### 1. AI Native 多Agent架构实践
**来源**: `practices/ai-native-multi-agent-architecture`
#### 编排混合模式
- 业界共识:不纯 DAG 也不纯 ReAct,而是"可预测骨架 + LLM 动态填充"
- LangGraph:图定义结构,条件边动态路由
- OpenAI Agent SDKHandoff 显式转交 + 对话历史传递
- Google ADK:层级树 + LLM 做委派决策
- **实践**:保留确定性引擎做底层保障(状态追踪、超时保护),在决策点插入 LLM 判断
#### 通信四模式(按 AI native 程度递进)
1. **点对点异步消息**Sanguo Mail):有损、延迟、缺上下文——最基础
2. **共享工作区 + 结构化产出**Claude Code):文件系统 + JSON 接口——简单有效
3. **对话历史传递**OpenAI Handoff):转交时携带完整上下文——"surprisingly effective"
4. **Blackboard 广播**(学术前沿):全局黑板 + LLM 控制单元路由——最强但最复杂
#### Skill 三层组合
- Execution Layer + Enhancement Layer + Guarantee Layer
- 从工具层→行为层→认知层演进
#### 经验沉淀:Memory → Skills → Rules 三层压缩
- Memory:原始执行 trace 存档
- Skills:从多次经验中抽象的可复用操作序列
- Rules:高度压缩的启发式规则/偏好
#### 对 v2.0 的具体借鉴
| 方向 | 做法 | 来源 |
|------|------|------|
| 编排动态化 | Goal-first + Coordinator 动态分解 | open-multi-agent |
| 质量门禁 | 三方共识(Planner+Architect+Critic | oh-my-claudecode |
| 并行安全 | propose→validate→commit 原子写入 | Network-AI |
| 防偷懒 | Scope Reduction Detection | get-shit-done |
| 紧急中断 | Steer 优先级消息 | wanman |
| 经验沉淀 | 任务完成后 nudge 持久化 | hermes |
| 上下文隔离 | Wave Execution 独立上下文 | get-shit-done |
| 运维保障 | 心跳+reclaim+幻觉门控+per-task retry | Hermes v0.13 |
| 跨Agent传递 | Canonical IR + Fidelity 三档 | Opal-Bridge |
### 2. 多Agent协作模式
**来源**: `practices/multi-agent-collaboration-patterns`
#### 四种编排模式
| 模式 | 结构 | 适用场景 |
|------|------|----------|
| 线性流水线 | A→B→C→D | 明确先后顺序 |
| 并行扇出 | A→[B,C,D]→Merge | 子任务独立可并行 |
| 主从模式 | Supervisor→Workers | 有明确协调者 |
| 网状协作 | Agent互调 | 需要灵活路由(谨慎) |
#### 三种通信协议
| 协议 | 优点 | 缺点 | 适用场景 |
|------|------|------|----------|
| 文件通信 | 简单可靠可追溯 | 慢需轮询 | 大文件、持久化 |
| 消息队列 | 异步解耦可扩展 | 复杂需基础设施 | 高并发 |
| RPC/API | 快同步类型安全 | 耦合紧 | 实时通信 |
#### 冲突解决策略
- 写冲突:锁定+排队(try_acquire + release
- 逻辑冲突:优先级+仲裁(Supervisor 决策)
- 资源冲突:队列+限流
### 3. Network-AI 原子黑板
**来源**: `practices/network-ai-practices`
#### 核心机制
- **propose→validate→commit** 三阶段原子写入,消除 split-brain
- **Priority-Wins** 优先级抢占:0-3级(low/normal/high/critical),高优先级可抢占低优先级
- **FileLock** 文件系统互斥锁:零外部依赖,wx标志保证原子性
- **FederatedBudget** 联邦预算追踪:全局上限 + per-Agent 上限
#### 启示
- 风控Agent(关羽)应该是最高优先级
- 数据验证Agent(赵云)的校验结果也应高优先级
- NAS上的共享数据文件写入需要锁机制防并发损坏
### 4. Opal-Bridge 跨Agent Session 翻译
**来源**: `practices/opal-bridge-practices`
#### 五大核心机制
1. **Canonical IR 中间表示**N个Agent只需2N个adapter,结构对称不偏袒
2. **Moments 原子事件**:13种事件类型,时间戳单调递增,source_ref可追溯
3. **Fidelity 三档**:无损(Mode A/ LLM摘要(Mode B/ 混合保留最近N条(Mode C)
4. **Subagent 策略**inline(拼入主线)/ split(独立文件)/ drop(只保留结果)
5. **覆盖保护**:翻译器永远不修改用户原始数据
### 5. ClawTeam OpenClaw 多Agent协作
**来源**: `practices/clawteam-openclaw-practices`
#### 关键实践(28条中的精选)
| # | 实践 | 核心思路 | v2.0 借鉴点 |
|---|------|----------|------------|
| 1 | Git Worktree 隔离 | 每个Agent独立分支,零合并冲突 | 并行编码隔离 |
| 2 | fcntl文件锁+原子rename | 无数据库并发安全 | 黑板写入安全 |
| 3 | Inbox文件消息系统 | JSON文件即消息,claim→ack模式 | Agent间通信 |
| 4 | 任务依赖链+自动解除 | blocked_by字段+DFS环检测+自动流转 | 动态计划 |
| 5 | Boids群体智能规则 | Separation/Alignment/Cohesion/Boundary | Agent行为注入 |
| 6 | 任务锁机制 | locked_by+死锁回收 | 防止任务重复执行 |
| 7 | Agent生命周期感知 | tmux pane存活检测+任务自动回收 | 僵尸检测 |
| 8 | 元认知自评 | [confidence: 0.X] 置信度标注 | 产出质量信号 |
| 10 | Auftragstaktik任务式指挥 | Intent→End State→Constraints | 任务分配方式 |
| 11 | 成本追踪 | Agent自报Token消耗+增量汇总 | Token治理 |
| 12 | Agent数量限制 | 默认max=4,有学术依据 | 并行度控制 |
| 14 | Plan审批工作流 | Worker提交计划→Leader审批→执行 | 复杂任务门控 |
| 15 | Dead Letter隔离 | 格式错误消息不阻塞队列 | 消息处理韧性 |
| 19 | 不可变事件日志 | inbox消息消费删除+事件日志永久保留 | 审计追溯 |
| 20 | on-exit钩子 | trap EXIT自动清理+通知 | Agent崩溃恢复 |
| 27 | 共享记忆作用域 | team级memory scope | 团队知识共享 |
### 6. Hermes v0.13 Kanban 运维保障
**来源**: `practices/hermes-kanban-v0.13-practices`
| 机制 | 做法 | v2.0 借鉴 |
|------|------|----------|
| 心跳+Reclaim | 定期心跳,超时自动回收任务 | Worker生命周期管理 |
| 幻觉门控 | Agent声称完成时验证产出是否存在 | "不验证不算完" |
| Per-Task重试 | 每个任务独立max_retries | 灵活重试策略 |
| Worker自动Block | 异常Worker不再接新活 | 防止坏Agent继续接活 |
| /goal Ralph Loop | 持久目标跨turn保持 | "持续指挥官"原语 |
### 7. 知识管理体系
**来源**: `practices/knowledge-management-system`
#### 闭环学习(DISCOVER→DISTILL→APPLY→IMPROVE
- 只记录不应用的知识是浪费
- 只应用不沉淀的知识是重复劳动
- 闭环必须完整
#### 四层金字塔
- L0 记忆层(MEMORY.md)→ L1 经验层 → L2 知识层(wiki) → L3 体系层(设计文档)
#### 五路径增长
- 调研驱动 / 问题驱动 / 外部注入 / 反向触发 / 交叉碰撞
---
## 第二部分:前沿学术与生产实践(Web 调研)
### 8. bMASBlackboard LLM Multi-Agent System
**来源**: *"Exploring Advanced LLM Multi-Agent Systems Based on Blackboard Architecture"* (arXiv:2507.01701, 2025.07)
#### 三大核心组件
1. **Control Unit**:LLM驱动,根据黑板内容动态选择下一轮该哪个Agent行动
2. **Blackboard**:全局共享信息空间,所有Agent读写,是唯一的记忆和消息传递中枢
3. **Agent Group**:不同专业角色的LLM Agent
#### 关键机制
- **动态选择**:不是固定DAGControl Unit根据黑板当前内容决定下一步
- **迭代收敛**:Agent轮流行动→更新黑板→Control Unit判断→直到黑板达成共识
- **全息可见**:所有Agent能看到黑板上的所有信息
#### 实验结果
- bMAS在常识推理和数学任务上**匹配甚至超过**静态编排和动态编排系统
- **token效率更高**(因为Control Unit做智能路由,不浪费在不相关的Agent上)
### 9. Global Workspace TheoryGWT)与AI意识
**来源**: Bernard Baars 认知科学理论 + ACM CENs 论文 (2025)
#### 核心循环
```
竞争(各模块提交信息)→ 选择(Control Unit选出胜出者)→ 广播(胜出信息共享给所有模块)→ 下一轮
```
#### 对共享意识空间的映射
- GWT的"专业模块" = 我们的各个Agent
- GWT的"全局工作空间" = 我们的Blackboard
- GWT的"竞争→选择→广播" = 我们的Control Unit路由机制
- **Serial bottleneck is a feature, not a bug**:串行瓶颈确保信息不冲突
### 10. KVCOMMNeurIPS 2025)—— 共享 KV Cache
**来源**: *"KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems"*
#### 关键洞察
- 多个Agent共享前缀文本时,可复用KV Cache
- 5个Agent场景下 **7.8× 加速**TTFT从~430ms降到~55ms
- **70%+ KV-cache reuse** in five-agent settings
#### 启示
- 共享意识空间不需要每个Agent都重新"理解"全部上下文
- 公共部分可以缓存和复用(这是模型层面的优化,我们暂不实现,但未来方向)
### 11. PSMASPhase-Scheduled Multi-Agent Systems
**来源**: arXiv:2604.17400, 2026.04
#### 关键思路
- 把Agent激活看作**连续控制**而非离散RPC
- 在共享注意力空间(circular manifold)上调度Agent
- **34.8% token reduction**
### 12. O'Reilly 模式总结(2026.02
**来源**: *"Designing Effective Multi-Agent Architectures"* (O'Reilly Radar)
#### 关键洞察
- **共享产出物(shared artifacts)比共享消息更重要**
- **Blackboard + shared memory > manager routing every thought**
- 2026存活下来的协作系统共同特征:**Phase gates + shared artifacts + final supervisor**
- **纯 Open Mesh(无结构自由协作)是失败模式**
### 13. Meta 生产实践
**来源**: Multi-Agent in Production 2026 总结
- Meta's tribal-knowledge engine: **critics, fixers, upgraders, testers** over **shared artifacts inside one session**
- 关键:**在一个session内围绕共享artifacts协作**,不同角色轮流在同一空间工作
- Spotify's Ads AI: decomposes media planning into specialized agents working in parallel
### 14. LangGraph 共享状态模式
**来源**: LangGraph 文档 + 生产案例
- 每个Agent是一个节点,接受和返回**共享状态**(TypedDict
- Supervisor节点负责路由决策
- **Postgres-backed checkpointers** 做长期持久化
- 关键:**状态是 reducer 模式**——多个Agent可并发写入同一个key,通过reducer合并
### 15. OpenClaw RFC #35203
**来源**: github.com/openclaw/openclaw/issues/35203
OpenClaw官方已提出RFC**Capability Profiling + Shared Blackboard + Layered Memory + Token Cost Governance**
- 每个Agent的capability profiling(能力画像)
- 共享黑板机制
- 分层记忆边界
- Token成本治理
---
## 第三部分:综合分析与方案设计
### 设计原则(从调研中提炼)
1. **黑板是唯一真相源**:所有Agent通过黑板共享信息,没有私下通信
2. **Control Unit是AI驱动的**:不是规则路由,而是LLM根据当前黑板状态动态决策
3. **写入保护**:不是谁都能随意改任何字段,需要propose→validate→commit
4. **信息分级**:不是所有Agent都看全量信息,Fidelity三档按需路由
5. **产出物>消息**:共享产出物比共享消息更重要
6. **验证才算完**:Agent声称完成时必须验证产出是否真实存在
7. **结构对称**:不把任何一个Agent当"主"——Canonical IR原则
8. **有界并行**:默认max=4个并行Agent,有学术依据
9. **任务式指挥**Intent→End State→ConstraintsAgent自主决定怎么做
10. **闭环学习**:执行→经验沉淀→下次改进
### 共享意识空间架构
```
┌─────────────────────────────────────────────────────────────────┐
│ 用户(自然语言入口) │
└──────────────────────────┬──────────────────────────────────────┘
┌──────────────────────────▼──────────────────────────────────────┐
│ 庞统(指挥官 + Control Unit
│ │
│ 四相循环: │
│ Phase 1: 苏格拉底对话 → 理解需求 │
│ Phase 2: 动态规划 → 生成/调整计划 │
│ Phase 3: 持续指挥 → 调度Agent + 监控 + 异常处理 │
│ Phase 4: 主动汇报 → 推送进展 + 验收 │
│ │
│ ┌───────────────────────────────────────────────────────────┐ │
│ │ Blackboard(全局共享黑板) │ │
│ │ │ │
│ │ ┌────────────┐ ┌────────────┐ ┌────────────┐ │ │
│ │ │ TaskCtx │ │ Moments │ │ Artifacts │ │ │
│ │ │ 任务上下文 │ │ 原子事件流 │ │ 产出物索引 │ │ │
│ │ └────────────┘ └────────────┘ └────────────┘ │ │
│ │ ┌────────────┐ ┌────────────┐ ┌────────────┐ │ │
│ │ │ PlanGraph │ │ AgentStates│ │ Experience │ │ │
│ │ │ 动态计划 │ │ Agent状态 │ │ 经验记忆 │ │ │
│ │ └────────────┘ └────────────┘ └────────────┘ │ │
│ │ ┌────────────┐ │ │
│ │ │ EventLog │ ← 不可变事件日志(审计追溯) │ │
│ │ └────────────┘ │ │
│ └───────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
│ Fidelity三档读写
┌──────────────────┼──────────────────┐
│ │ │
┌────▼────┐ ┌────▼────┐ ┌────▼────┐
│ 张飞 │ │ 关羽 │ │ 赵云 │ ...
│ 编码 │ │ 风控 │ │ 数据 │
└─────────┘ └─────────┘ └─────────┘
```
### 七大核心机制
#### 1. Blackboard 物理结构(文件系统 + 结构化JSON)
```
consciousness/
├── tasks/{task-id}/
│ ├── context.json # 任务上下文
│ ├── moments.jsonl # 原子事件流(追加写入)
│ ├── artifacts/ # 产出物
│ ├── decisions.jsonl # 决策记录
│ ├── plan.json # 动态计划图谱
│ └── agents/{agent-id}.json # Agent当前状态
├── global/
│ ├── agent-registry.json # Agent能力画像
│ ├── experience/ # 跨任务经验
│ └── templates/ # 任务模板
├── events/ # 不可变事件日志
│ └── evt-{ts}-{uuid}.json
└── inbox/ # 用户需求入口
```
#### 2. Control Unit(庞统)
- 苏格拉底对话理解需求
- 根据黑板状态动态规划
- 根据能力画像选择Agent
- 监控Agent状态、检测异常
- Fidelity分档信息路由
#### 3. Moments 原子事件流(借鉴 Opal-Bridge
13+ 种事件类型,追加写入JSONL,时间戳单调递增。
#### 4. Fidelity 三档信息路由
| 档位 | 内容 | 对象 |
|------|------|------|
| Full | 完整moments + 全部artifacts | 庞统 |
| Summary | AI压缩关键节点 + 相关artifacts | 协作伙伴 |
| Signal | 只传需行动通知 + 最终结论 | 外围Agent |
#### 5. Agent 能力画像(借鉴 RFC #35203
capabilities / tools / performance_history / current_load
#### 6. 动态计划图谱(替代固定DAG)
计划可在执行中动态调整——庞统发现需额外步骤可直接插入。
#### 7. 写入保护(借鉴 Network-AI
propose→validate→commit 三阶段,配合文件锁。
### 额外借鉴的设计元素
从 wiki 调研中发现的、之前方案未覆盖的重要设计:
| # | 来源 | 设计元素 | v2.0应用 |
|---|------|----------|----------|
| A | ClawTeam #5 | **Boids群体智能规则** | 在Agent prompt中注入 Separation/Alignment/Cohesion/Boundary 四条协作规则 |
| B | ClawTeam #8 | **元认知自评 [confidence: 0.X]** | Agent产出自带质量信号,指挥官据此决定是否需人工介入 |
| C | ClawTeam #10 | **Auftragstaktik任务式指挥** | 任务分配用 Intent→End State→Constraints 三元组,不指定步骤 |
| D | ClawTeam #14 | **Plan审批工作流** | 复杂任务Agent先提交计划,指挥官审批后执行 |
| E | ClawTeam #19 | **不可变事件日志** | Blackboard事件消费语义 + 事件溯源的审计能力 |
| F | ClawTeam #27 | **共享记忆作用域** | team级memory scope实现跨Agent知识共享 |
| G | Hermes #5 | **/goal Ralph Loop** | 持久目标跨turn保持——"持续指挥官"的原语 |
| H | Hermes #2 | **幻觉门控** | Agent声称完成时验证产出是否真实存在 |
| I | Network-AI | **优先级抢占** | 风控Agent(关羽)最高优先级,能抢占其他Agent写入 |
| J | 知识管理 | **闭环学习循环** | DISCOVER→DISTILL→APPLY→IMPROVE |
| K | 学术 bMAS | **迭代收敛到共识** | Agent轮流行动直到黑板达成consensus |
| L | O'Reilly | **Phase gates** | 阶段门控确保质量,不是无结构自由协作 |
| M | OpenClaw RFC | **Token成本治理** | 全局上限 + per-Agent上限 |
---
## 第四部分:待深入问题
1. **物理载体**:文件系统 vs 数据库?——倾向文件系统(与OpenClaw天然兼容、可git追踪)
2. **庞统运行方式**persistent session vs 事件驱动唤醒?
3. **与v1.0 Agent的兼容**:v2.0的Agent是否复用三国团队,还是重新定义?
4. **信息过载防御**:当任务量大时,黑板上的Moments流如何保持可管理?
5. **共识机制**bMAS的"迭代收敛到共识"具体怎么实现?简单投票?LLM仲裁?
---
## 参考来源
### Wiki 知识库
- `practices/ai-native-multi-agent-architecture`
- `practices/multi-agent-collaboration-patterns`
- `practices/network-ai-practices`
- `practices/opal-bridge-practices`
- `practices/clawteam-openclaw-practices`
- `practices/hermes-kanban-v0.13-practices`
- `practices/knowledge-management-system`
### 学术论文
- bMAS: arXiv:2507.01701 (2025.07)
- KVCOMM: NeurIPS 2025
- PSMAS: arXiv:2604.17400 (2026.04)
- GWT: Baars (1988) + ACM CENs (2025)
### 生产实践
- O'Reilly: "Designing Effective Multi-Agent Architectures" (2026.02)
- Meta: shared artifacts in one session
- LangGraph: shared state + reducer pattern
- OpenClaw RFC #35203