auto-sync: 2026-04-06 23:10:07

2026-04-06 23:10:07 +08:00
parent a50cf51de7
commit 0b8afe76bd
1 changed files with 229 additions and 0 deletions
@@ -0,0 +1,229 @@
+# OpenClaw 记忆体系调研成果报告
+
+**项目**: sanguo_quant_live 三国量化实战项目  
+**调研人**: 庞统（副军师）  
+**日期**: 2026-04-06  
+**分类**: 技术调研 / 架构分析
+
+---
+
+## 一、OpenClaw 官方记忆体系核心设计
+
+### 1.1 核心理念
+**File-first 设计原则**：
+- 所有记忆都以**纯Markdown文件**存储在磁盘上
+- 模型只"记住"写入磁盘的内容，不存在隐藏状态
+- 完全可读、可编辑、可版本控制
+
+### 1.2 基础双层结构
+
+| 文件 | 位置 | 用途 | 维护者 |
+|------|------|------|--------|
+| `MEMORY.md` | 工作区根目录 | **长期记忆**，保存持久事实、偏好、决策 | 总军师 |
+| `memory/YYYY-MM-DD.md` | 工作区memory目录 | **每日笔记**，详细记录当天对话 | 系统自动 |
+
+### 1.3 三层防失忆机制
+
+1. **Memory Flush（记忆刷新）**  
+   当会话上下文接近token限制时，触发**静默智能体轮次**，提醒模型在压缩前将重要信息写入持久记忆文件。
+
+2. **Compaction（压缩）**  
+   上下文满了之后，使用LLM对历史对话进行总结压缩，保持上下文清爽。
+
+3. **Dreaming（梦境整理）**  
+   可选的**后台自动化整合过程**：
+   - 每日深夜重新浏览每日短期记忆
+   - 评分提取重要信息升级到长期记忆（MEMORY.md）
+   - 自动归档旧记忆，保持长期记忆精简
+
+---
+
+## 二、OpenClaw 记忆检索核心技术
+
+### 2.1 混合检索（Hybrid Search）
+
+默认配置：**向量检索 (0.7) + 关键词BM25检索 (0.3)**
+
+| 检索方式 | 优势 | 适用场景 |
+|---------|------|----------|
+| 向量语义检索 | 找到语义相似的内容 | 概念、思路、方法回忆 |
+| BM25关键词检索 | 精确匹配术语 | ID、代码符号、特定名称 |
+
+**配置示例**：
+```json
+{
+  "agents": {
+    "defaults": {
+      "memorySearch": {
+        "enabled": true,
+        "provider": "gemini",
+        "query": {
+          "hybrid": {
+            "enabled": true,
+            "vectorWeight": 0.7,
+            "textWeight": 0.3
+          },
+          "maxResults": 8,
+          "temporalDecay": {
+            "enabled": true,
+            "halfLifeDays": 30
+          }
+        }
+      }
+    }
+  }
+}
+```
+
+### 2.2 支持的Embedding提供商
+- OpenAI
+- Gemini (Google)
+- Voyage
+- 本地模型 (via Ollama)
+
+---
+
+## 三、社区成熟的进阶记忆方案
+
+### 3.1 QMD 混合检索方案（推荐进阶用户）
+
+**项目**: https://github.com/sac3433/openclawmemory
+
+**特性**：
+- 三层检索：BM25 + Vector + LLM重排序
+- 100% 本地运行，无API成本
+- 支持目录递归检索
+- 适合需要高精度检索的场景
+
+### 3.2 LanceDB 专业记忆（企业/专业用户）
+
+**项目**: https://github.com/CortexReach/memory-lancedb-pro
+
+**特性**：
+- LanceDB高性能向量存储
+- Cross-Encoder重排序提升准确率
+- 多作用域隔离
+- 完整管理CLI工具
+
+### 3.3 ClawIntelligentMemory 三层自动化架构
+
+**项目**: https://github.com/denda188/ClawIntelligentMemory
+
+**架构**：
+```
+原始对话 → memory/YYYY-MM-DD.md（原始日志）
+    ↓
+MEMORY.md（精选记忆，控制在3000字符以内）
+    ↓
+life/archives/（归档记忆，按需检索）
+```
+
+**自动化流程**：
+- 任务完成 → 自动生成 ~150字摘要
+- 积累20个摘要 → 生成 ~200字宏观摘要
+- 每6小时 → 自动维护记忆系统
+- 每日06:00 → QMD索引重建
+- 每日03:00 → 夜间深度分析整理
+
+### 3.4 12层记忆架构（顶级复杂场景）
+
+**项目**: https://github.com/coolmanns/openclaw-memory-architecture
+
+**特性**：
+- 知识图谱存储事实关系
+- 多语言语义搜索 (GPU 7ms响应)
+- 激活/衰减记忆权重系统
+- Domain RAG 领域适配
+
+---
+
+## 四、ClawHub 记忆相关技能
+
+| 技能 | 功能 |
+|------|------|
+| `memory-complete` | SESSION-STATE.md、RECENT_CONTEXT.md、AGENTS memory protocol、HEARTBEAT自动捕获 |
+| `viking-memory` | 基于OpenViking的向量化长期记忆，提供语义检索HTTP API |
+| `agent-brain` | 本地优先持久记忆，SQLite存储 |
+
+---
+
+## 五、与 Claude Code 记忆体系对比
+
+### 5.1 Claude Code 记忆架构
+
+**五层架构**：
+1. Managed - 系统全局规则
+2. User - 用户全局规则
+3. Project - 项目规则（Git提交）
+4. Local - 用户私有项目规则（不提交Git）
+5. AutoMem/TeamMem - 自动记忆/团队共享记忆
+
+**核心特性**：
+- 从当前目录向上遍历查找，越近优先级越高
+- 支持 `@include` 模块化包含其他文件（最大深度5层，防循环）
+- 支持 frontmatter `paths` 字段，路径glob匹配规则，不同文件不同规则
+- 单文件最大 40,000 字符限制
+
+### 5.2 对比总结
+
+| 维度 | Claude Code | OpenClaw |
+|------|-------------|----------|
+| **设计目标** | 单人软件开发，精细化规则 | 多Agent分布式团队协作 |
+| **记忆存放** | 规则型记忆，层级覆盖 | 文件分层 + 向量检索 |
+| **团队协作** | TeamMem支持，但原生设计偏向单人 | 原生分布式，每个Agent独立工作区，Sanguo Mail通信归档 |
+| **上下文管理** | 每次会话加载所有记忆，容易膨胀 | 只加载最近两天对话，长期记忆通过检索获取，保持上下文简洁 |
+| **适用场景** | 单Repo持续开发 | 长期多Agent量化研究项目 |
+
+---
+
+## 六、最佳实践推荐
+
+### 6.1 新手入门配置
+```
+1. 使用官方标准方案
+2. 配置 Gemini Embedding
+3. 启用混合检索 (Vector 0.7 + BM25 0.3)
+4. 开启自动记忆刷新
+5. 配置每日Dreaming整理
+```
+
+### 6.2 进阶用户配置
+```
+1. 官方基础 + QMD混合检索
+2. 启用Dreaming后台整理
+3. 使用ClawIntelligentMemory自动化三层架构
+```
+
+### 6.3 企业生产配置
+```
+1. LanceDB专业记忆插件
+2. Cross-Encoder重排序
+3. 多作用域隔离
+4. 定期Dreaming归档
+```
+
+## 七、常见问题排查
+
+| 问题 | 解决方案 |
+|------|----------|
+| 记忆不工作 | 1. 检查Embedding API Key配置；2. `openclaw doctor` 检查；3. 检查memory目录是否有内容 |
+| 压缩丢失信息 | 1. 启用预压缩memory flush；2. 使用LosslessClaw插件；3. 重要信息手动保存到MEMORY.md |
+| 检索不准确 | 1. 启用混合检索；2. 调整vector/text权重；3. 考虑QMD+LLM重排序；4. 优化Embedding模型选择 |
+
+---
+
+## 八、资源汇总
+
+### 官方资源
+- 官方文档：https://docs.openclaw.ai/zh-CN/concepts/memory
+- GitHub：https://github.com/openclaw/openclaw
+- ClawHub：https://www.clawhub.com
+
+### 社区资源
+- 中文教程合集：https://github.com/xianyu110/awesome-openclaw-tutorial
+- OpenClaw 101：https://github.com/mengjian-github/openclaw101
+
+---
+
+**调研完成**  
+**报告版本**: v1.0 (2026-04-06)