auto-sync: 2026-04-06 23:10:07

This commit is contained in:
cfdaily
2026-04-06 23:10:07 +08:00
parent a50cf51de7
commit 0b8afe76bd
@@ -0,0 +1,229 @@
# OpenClaw 记忆体系调研成果报告
**项目**: sanguo_quant_live 三国量化实战项目
**调研人**: 庞统(副军师)
**日期**: 2026-04-06
**分类**: 技术调研 / 架构分析
---
## 一、OpenClaw 官方记忆体系核心设计
### 1.1 核心理念
**File-first 设计原则**
- 所有记忆都以**纯Markdown文件**存储在磁盘上
- 模型只"记住"写入磁盘的内容,不存在隐藏状态
- 完全可读、可编辑、可版本控制
### 1.2 基础双层结构
| 文件 | 位置 | 用途 | 维护者 |
|------|------|------|--------|
| `MEMORY.md` | 工作区根目录 | **长期记忆**,保存持久事实、偏好、决策 | 总军师 |
| `memory/YYYY-MM-DD.md` | 工作区memory目录 | **每日笔记**,详细记录当天对话 | 系统自动 |
### 1.3 三层防失忆机制
1. **Memory Flush(记忆刷新)**
当会话上下文接近token限制时,触发**静默智能体轮次**,提醒模型在压缩前将重要信息写入持久记忆文件。
2. **Compaction(压缩)**
上下文满了之后,使用LLM对历史对话进行总结压缩,保持上下文清爽。
3. **Dreaming(梦境整理)**
可选的**后台自动化整合过程**:
- 每日深夜重新浏览每日短期记忆
- 评分提取重要信息升级到长期记忆(MEMORY.md)
- 自动归档旧记忆,保持长期记忆精简
---
## 二、OpenClaw 记忆检索核心技术
### 2.1 混合检索(Hybrid Search
默认配置:**向量检索 (0.7) + 关键词BM25检索 (0.3)**
| 检索方式 | 优势 | 适用场景 |
|---------|------|----------|
| 向量语义检索 | 找到语义相似的内容 | 概念、思路、方法回忆 |
| BM25关键词检索 | 精确匹配术语 | ID、代码符号、特定名称 |
**配置示例**
```json
{
"agents": {
"defaults": {
"memorySearch": {
"enabled": true,
"provider": "gemini",
"query": {
"hybrid": {
"enabled": true,
"vectorWeight": 0.7,
"textWeight": 0.3
},
"maxResults": 8,
"temporalDecay": {
"enabled": true,
"halfLifeDays": 30
}
}
}
}
}
}
```
### 2.2 支持的Embedding提供商
- OpenAI
- Gemini (Google)
- Voyage
- 本地模型 (via Ollama)
---
## 三、社区成熟的进阶记忆方案
### 3.1 QMD 混合检索方案(推荐进阶用户)
**项目**: https://github.com/sac3433/openclawmemory
**特性**
- 三层检索:BM25 + Vector + LLM重排序
- 100% 本地运行,无API成本
- 支持目录递归检索
- 适合需要高精度检索的场景
### 3.2 LanceDB 专业记忆(企业/专业用户)
**项目**: https://github.com/CortexReach/memory-lancedb-pro
**特性**
- LanceDB高性能向量存储
- Cross-Encoder重排序提升准确率
- 多作用域隔离
- 完整管理CLI工具
### 3.3 ClawIntelligentMemory 三层自动化架构
**项目**: https://github.com/denda188/ClawIntelligentMemory
**架构**
```
原始对话 → memory/YYYY-MM-DD.md(原始日志)
MEMORY.md(精选记忆,控制在3000字符以内)
life/archives/(归档记忆,按需检索)
```
**自动化流程**
- 任务完成 → 自动生成 ~150字摘要
- 积累20个摘要 → 生成 ~200字宏观摘要
- 每6小时 → 自动维护记忆系统
- 每日06:00 → QMD索引重建
- 每日03:00 → 夜间深度分析整理
### 3.4 12层记忆架构(顶级复杂场景)
**项目**: https://github.com/coolmanns/openclaw-memory-architecture
**特性**
- 知识图谱存储事实关系
- 多语言语义搜索 (GPU 7ms响应)
- 激活/衰减记忆权重系统
- Domain RAG 领域适配
---
## 四、ClawHub 记忆相关技能
| 技能 | 功能 |
|------|------|
| `memory-complete` | SESSION-STATE.md、RECENT_CONTEXT.md、AGENTS memory protocol、HEARTBEAT自动捕获 |
| `viking-memory` | 基于OpenViking的向量化长期记忆,提供语义检索HTTP API |
| `agent-brain` | 本地优先持久记忆,SQLite存储 |
---
## 五、与 Claude Code 记忆体系对比
### 5.1 Claude Code 记忆架构
**五层架构**
1. Managed - 系统全局规则
2. User - 用户全局规则
3. Project - 项目规则(Git提交)
4. Local - 用户私有项目规则(不提交Git)
5. AutoMem/TeamMem - 自动记忆/团队共享记忆
**核心特性**
- 从当前目录向上遍历查找,越近优先级越高
- 支持 `@include` 模块化包含其他文件(最大深度5层,防循环)
- 支持 frontmatter `paths` 字段,路径glob匹配规则,不同文件不同规则
- 单文件最大 40,000 字符限制
### 5.2 对比总结
| 维度 | Claude Code | OpenClaw |
|------|-------------|----------|
| **设计目标** | 单人软件开发,精细化规则 | 多Agent分布式团队协作 |
| **记忆存放** | 规则型记忆,层级覆盖 | 文件分层 + 向量检索 |
| **团队协作** | TeamMem支持,但原生设计偏向单人 | 原生分布式,每个Agent独立工作区,Sanguo Mail通信归档 |
| **上下文管理** | 每次会话加载所有记忆,容易膨胀 | 只加载最近两天对话,长期记忆通过检索获取,保持上下文简洁 |
| **适用场景** | 单Repo持续开发 | 长期多Agent量化研究项目 |
---
## 六、最佳实践推荐
### 6.1 新手入门配置
```
1. 使用官方标准方案
2. 配置 Gemini Embedding
3. 启用混合检索 (Vector 0.7 + BM25 0.3)
4. 开启自动记忆刷新
5. 配置每日Dreaming整理
```
### 6.2 进阶用户配置
```
1. 官方基础 + QMD混合检索
2. 启用Dreaming后台整理
3. 使用ClawIntelligentMemory自动化三层架构
```
### 6.3 企业生产配置
```
1. LanceDB专业记忆插件
2. Cross-Encoder重排序
3. 多作用域隔离
4. 定期Dreaming归档
```
## 七、常见问题排查
| 问题 | 解决方案 |
|------|----------|
| 记忆不工作 | 1. 检查Embedding API Key配置;2. `openclaw doctor` 检查;3. 检查memory目录是否有内容 |
| 压缩丢失信息 | 1. 启用预压缩memory flush2. 使用LosslessClaw插件;3. 重要信息手动保存到MEMORY.md |
| 检索不准确 | 1. 启用混合检索;2. 调整vector/text权重;3. 考虑QMD+LLM重排序;4. 优化Embedding模型选择 |
---
## 八、资源汇总
### 官方资源
- 官方文档:https://docs.openclaw.ai/zh-CN/concepts/memory
- GitHubhttps://github.com/openclaw/openclaw
- ClawHubhttps://www.clawhub.com
### 社区资源
- 中文教程合集:https://github.com/xianyu110/awesome-openclaw-tutorial
- OpenClaw 101https://github.com/mengjian-github/openclaw101
---
**调研完成**
**报告版本**: v1.0 (2026-04-06)