From 0b8afe76bda41d4c086b7a79231ca18e682cabf0 Mon Sep 17 00:00:00 2001 From: cfdaily Date: Mon, 6 Apr 2026 23:10:07 +0800 Subject: [PATCH] auto-sync: 2026-04-06 23:10:07 --- .../report.md | 229 ++++++++++++++++++ 1 file changed, 229 insertions(+) create mode 100644 pangtong-value/research/20260406-openclaw-memory-system-research/report.md diff --git a/pangtong-value/research/20260406-openclaw-memory-system-research/report.md b/pangtong-value/research/20260406-openclaw-memory-system-research/report.md new file mode 100644 index 000000000..19a0ec3bb --- /dev/null +++ b/pangtong-value/research/20260406-openclaw-memory-system-research/report.md @@ -0,0 +1,229 @@ +# OpenClaw 记忆体系调研成果报告 + +**项目**: sanguo_quant_live 三国量化实战项目 +**调研人**: 庞统(副军师) +**日期**: 2026-04-06 +**分类**: 技术调研 / 架构分析 + +--- + +## 一、OpenClaw 官方记忆体系核心设计 + +### 1.1 核心理念 +**File-first 设计原则**: +- 所有记忆都以**纯Markdown文件**存储在磁盘上 +- 模型只"记住"写入磁盘的内容,不存在隐藏状态 +- 完全可读、可编辑、可版本控制 + +### 1.2 基础双层结构 + +| 文件 | 位置 | 用途 | 维护者 | +|------|------|------|--------| +| `MEMORY.md` | 工作区根目录 | **长期记忆**,保存持久事实、偏好、决策 | 总军师 | +| `memory/YYYY-MM-DD.md` | 工作区memory目录 | **每日笔记**,详细记录当天对话 | 系统自动 | + +### 1.3 三层防失忆机制 + +1. **Memory Flush(记忆刷新)** + 当会话上下文接近token限制时,触发**静默智能体轮次**,提醒模型在压缩前将重要信息写入持久记忆文件。 + +2. **Compaction(压缩)** + 上下文满了之后,使用LLM对历史对话进行总结压缩,保持上下文清爽。 + +3. **Dreaming(梦境整理)** + 可选的**后台自动化整合过程**: + - 每日深夜重新浏览每日短期记忆 + - 评分提取重要信息升级到长期记忆(MEMORY.md) + - 自动归档旧记忆,保持长期记忆精简 + +--- + +## 二、OpenClaw 记忆检索核心技术 + +### 2.1 混合检索(Hybrid Search) + +默认配置:**向量检索 (0.7) + 关键词BM25检索 (0.3)** + +| 检索方式 | 优势 | 适用场景 | +|---------|------|----------| +| 向量语义检索 | 找到语义相似的内容 | 概念、思路、方法回忆 | +| BM25关键词检索 | 精确匹配术语 | ID、代码符号、特定名称 | + +**配置示例**: +```json +{ + "agents": { + "defaults": { + "memorySearch": { + "enabled": true, + "provider": "gemini", + "query": { + "hybrid": { + "enabled": true, + "vectorWeight": 0.7, + "textWeight": 0.3 + }, + "maxResults": 8, + "temporalDecay": { + "enabled": true, + "halfLifeDays": 30 + } + } + } + } + } +} +``` + +### 2.2 支持的Embedding提供商 +- OpenAI +- Gemini (Google) +- Voyage +- 本地模型 (via Ollama) + +--- + +## 三、社区成熟的进阶记忆方案 + +### 3.1 QMD 混合检索方案(推荐进阶用户) + +**项目**: https://github.com/sac3433/openclawmemory + +**特性**: +- 三层检索:BM25 + Vector + LLM重排序 +- 100% 本地运行,无API成本 +- 支持目录递归检索 +- 适合需要高精度检索的场景 + +### 3.2 LanceDB 专业记忆(企业/专业用户) + +**项目**: https://github.com/CortexReach/memory-lancedb-pro + +**特性**: +- LanceDB高性能向量存储 +- Cross-Encoder重排序提升准确率 +- 多作用域隔离 +- 完整管理CLI工具 + +### 3.3 ClawIntelligentMemory 三层自动化架构 + +**项目**: https://github.com/denda188/ClawIntelligentMemory + +**架构**: +``` +原始对话 → memory/YYYY-MM-DD.md(原始日志) + ↓ +MEMORY.md(精选记忆,控制在3000字符以内) + ↓ +life/archives/(归档记忆,按需检索) +``` + +**自动化流程**: +- 任务完成 → 自动生成 ~150字摘要 +- 积累20个摘要 → 生成 ~200字宏观摘要 +- 每6小时 → 自动维护记忆系统 +- 每日06:00 → QMD索引重建 +- 每日03:00 → 夜间深度分析整理 + +### 3.4 12层记忆架构(顶级复杂场景) + +**项目**: https://github.com/coolmanns/openclaw-memory-architecture + +**特性**: +- 知识图谱存储事实关系 +- 多语言语义搜索 (GPU 7ms响应) +- 激活/衰减记忆权重系统 +- Domain RAG 领域适配 + +--- + +## 四、ClawHub 记忆相关技能 + +| 技能 | 功能 | +|------|------| +| `memory-complete` | SESSION-STATE.md、RECENT_CONTEXT.md、AGENTS memory protocol、HEARTBEAT自动捕获 | +| `viking-memory` | 基于OpenViking的向量化长期记忆,提供语义检索HTTP API | +| `agent-brain` | 本地优先持久记忆,SQLite存储 | + +--- + +## 五、与 Claude Code 记忆体系对比 + +### 5.1 Claude Code 记忆架构 + +**五层架构**: +1. Managed - 系统全局规则 +2. User - 用户全局规则 +3. Project - 项目规则(Git提交) +4. Local - 用户私有项目规则(不提交Git) +5. AutoMem/TeamMem - 自动记忆/团队共享记忆 + +**核心特性**: +- 从当前目录向上遍历查找,越近优先级越高 +- 支持 `@include` 模块化包含其他文件(最大深度5层,防循环) +- 支持 frontmatter `paths` 字段,路径glob匹配规则,不同文件不同规则 +- 单文件最大 40,000 字符限制 + +### 5.2 对比总结 + +| 维度 | Claude Code | OpenClaw | +|------|-------------|----------| +| **设计目标** | 单人软件开发,精细化规则 | 多Agent分布式团队协作 | +| **记忆存放** | 规则型记忆,层级覆盖 | 文件分层 + 向量检索 | +| **团队协作** | TeamMem支持,但原生设计偏向单人 | 原生分布式,每个Agent独立工作区,Sanguo Mail通信归档 | +| **上下文管理** | 每次会话加载所有记忆,容易膨胀 | 只加载最近两天对话,长期记忆通过检索获取,保持上下文简洁 | +| **适用场景** | 单Repo持续开发 | 长期多Agent量化研究项目 | + +--- + +## 六、最佳实践推荐 + +### 6.1 新手入门配置 +``` +1. 使用官方标准方案 +2. 配置 Gemini Embedding +3. 启用混合检索 (Vector 0.7 + BM25 0.3) +4. 开启自动记忆刷新 +5. 配置每日Dreaming整理 +``` + +### 6.2 进阶用户配置 +``` +1. 官方基础 + QMD混合检索 +2. 启用Dreaming后台整理 +3. 使用ClawIntelligentMemory自动化三层架构 +``` + +### 6.3 企业生产配置 +``` +1. LanceDB专业记忆插件 +2. Cross-Encoder重排序 +3. 多作用域隔离 +4. 定期Dreaming归档 +``` + +## 七、常见问题排查 + +| 问题 | 解决方案 | +|------|----------| +| 记忆不工作 | 1. 检查Embedding API Key配置;2. `openclaw doctor` 检查;3. 检查memory目录是否有内容 | +| 压缩丢失信息 | 1. 启用预压缩memory flush;2. 使用LosslessClaw插件;3. 重要信息手动保存到MEMORY.md | +| 检索不准确 | 1. 启用混合检索;2. 调整vector/text权重;3. 考虑QMD+LLM重排序;4. 优化Embedding模型选择 | + +--- + +## 八、资源汇总 + +### 官方资源 +- 官方文档:https://docs.openclaw.ai/zh-CN/concepts/memory +- GitHub:https://github.com/openclaw/openclaw +- ClawHub:https://www.clawhub.com + +### 社区资源 +- 中文教程合集:https://github.com/xianyu110/awesome-openclaw-tutorial +- OpenClaw 101:https://github.com/mengjian-github/openclaw101 + +--- + +**调研完成** +**报告版本**: v1.0 (2026-04-06)