# 群晖NAS部署sanguo_vnpy回测服务方案 **编制人**:姜维 伯约 **日期**:2026-04-27 **状态**:调研完成,待实施 --- ## 一、问题复现与根因分析 ### 1.1 现象 从局域网任意机器访问: - `curl http://192.168.2.154:8888/` → ✅ 302(Jupyter正常) - `curl http://192.168.2.154:8088/api/backtest/health` → ❌ Connection refused ### 1.2 根因 **三重问题叠加**: | # | 问题 | 影响 | |---|------|------| | **1** | entrypoint.sh 未启动 backtest-service | 容器内8088端口根本无进程监听 | | **2** | 容器内代码与本地不同步 | `start_backtest_service.py` 仍用旧import路径 `from scripts.backtest_service.main` | | **3** | main.py 使用相对导入 `from .config` | 无法作为独立脚本直接运行,需通过包方式启动 | **证据**: ```bash # 容器内进程 — 无uvicorn/FastAPI $ docker exec sanguo_vnpy ss -tlnp LISTEN 0.0.0.0:22 (sshd) LISTEN 0.0.0.0:8888 (jupyter-lab) # 8088 无监听! # 容器内启动backtest-service报错 $ docker exec sanguo_vnpy python3 /app/scripts/start_backtest_service.py ModuleNotFoundError: No module named 'scripts' # Docker端口映射正常 $ iptables -t nat -L DOCKER -n | grep 8088 DNAT tcp 0.0.0.0/0 0.0.0.0/0 tcp dpt:8088 to:172.17.0.2:8088 ``` ### 1.3 排除项 - ❌ 端口映射问题:iptables DNAT规则正确,8088→172.17.0.2:8088 - ❌ DSM防火墙问题:Jupyter使用同模式可访问 - ❌ Docker网络问题:bridge模式正常工作 - ❌ 进程崩溃问题:根本没启动过 --- ## 二、现有资源盘点 ### 2.1 NAS硬件 | 项目 | 规格 | |------|------| | 型号 | DS216+II | | CPU | Intel Celeron N3060 @ 1.60GHz (2核) | | 内存 | 8GB (可用约6.4GB) | | 磁盘 | 3.5TB 总量, 1.6TB 可用 | | Docker | 20.10.3 (需sudo) | ### 2.2 当前容器状态 ``` 容器ID: 8fc55af3d27d 镜像: sanguo_vnpy:with-scripts 状态: Up 13 days 端口: 2222→22, 8000→8000, 8080→8080, 8088→8088, 8888→8888, 2018→2018, 4102→4102 ``` ### 2.3 代码状态 | 文件 | 容器内版本 | 本地版本 | 问题 | |------|-----------|---------|------| | `start_backtest_service.py` | `from scripts.backtest_service.main` (旧) | `from main import main` (新) | **容器内代码过旧** | | `backtest-service/main.py` | `from .config import settings` | 同 | **相对导入无法直接运行** | | `entrypoint.sh` | 不含backtest-service | 同 | **缺失启动命令** | ### 2.4 数据资源(NAS SMB共享) ``` /Volumes/stock/A股数据/日线数据/ — 日线历史行情 /Volumes/stock/A股数据/分钟线数据/ — 分钟线数据 /Volumes/stock/A股数据/财务数据/ — 财务数据 /Volumes/stock/sanguo_vnpy/data/ — 项目数据 ``` --- ## 三、部署方案 ### 3.1 方案选择 | 方案 | 描述 | 优点 | 缺点 | |------|------|------|------| | **A: 原地修复** | docker cp更新文件+修改entrypoint | 最快,无需重建镜像 | 容器重建后丢失 | | **B: 重建镜像** | 修复代码后docker build | 持久化,可复现 | 构建耗时(约10-20min) | | **C: Volume挂载** | 代码通过volume挂载 | 代码更新无需重建 | 需调整容器启动 | **推荐方案:A+B组合** - 先用方案A快速验证(5分钟内出结果) - 验证通过后用方案B持久化(下班后或闲时构建) ### 3.2 架构图 ``` ┌─────────────────────────────────────────────────────────────────┐ │ 群晖 NAS 192.168.2.154 │ │ │ │ ┌─────────────────────────────────────────────────────────┐ │ │ │ Docker Container: sanguo_vnpy │ │ │ │ │ │ │ │ entrypoint.sh │ │ │ │ ├── sshd -D (22) ──→ 2222 │ │ │ │ ├── jupyter-lab (8888) ──→ 8888 ✅ 已有 │ │ │ │ └── backtest-service (8088) ──→ 8088 🆕 新增 │ │ │ │ │ │ │ │ /app/scripts/backtest-service/ │ │ │ │ /app/backtest_jobs/ (回测结果) │ │ │ │ /app/data/ (volume→/volume1/stock/A股数据) │ │ │ └─────────────────────────────────────────────────────────┘ │ │ ↑ Docker bridge (172.17.0.0/16) │ │ ↑ iptables DNAT: 8088→172.17.0.2:8088 │ └─────────────────────────────────────────────────────────────────┘ ↑ 局域网 192.168.2.0/24 ↑ ┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐ │ Mac mini │ │ Windows Node │ │ 其他将军 │ │ 192.168.2.153 │ │ 192.168.2.33 │ │ │ │ curl :8088 │ │ 回测任务提交 │ │ curl :8088 │ └─────────────────┘ └─────────────────┘ └─────────────────┘ ``` ### 3.3 修复步骤(方案A:快速验证) #### Step 1: 修复main.py的相对导入问题 将 `backtest-service/main.py` 中的相对导入改为绝对导入,使其可直接运行: ```python # 修改前(相对导入,不能直接 python main.py) from .config import settings from .api import router from .task_queue import task_queue # 修改后(支持两种方式) import sys import os # 当作为包的子模块时,.config 正常;当直接运行时,需要添加路径 if __name__ == "__main__" or __package__ is None: _dir = os.path.dirname(os.path.abspath(__file__)) if _dir not in sys.path: sys.path.insert(0, _dir) from config import settings from api import router from task_queue import task_queue else: from .config import settings from .api import router from .task_queue import task_queue ``` #### Step 2: 更新容器内代码 ```bash # 从本地复制修复后的代码到容器 docker cp scripts/backtest-service/ sanguo_vnpy:/app/scripts/backtest-service/ docker cp scripts/start_backtest_service.py sanguo_vnpy:/app/scripts/ ``` #### Step 3: 添加backtest-service到entrypoint.sh 在entrypoint.sh中加入backtest-service启动: ```bash # 在 jupyter lab 启动之后、tail -f 之前添加: # 启动自动化回测服务 cd /app/scripts/backtest-service && python3 main.py & BACKTEST_PID=$! echo "回测服务 PID: $BACKTEST_PID (端口 8088)" ``` #### Step 4: 验证 ```bash # 1. 在容器内启动backtest-service docker exec -d sanguo_vnpy bash -c "cd /app/scripts/backtest-service && python3 main.py" # 2. 等待2秒 sleep 2 # 3. 容器内验证 docker exec sanguo_vnpy ss -tlnp | grep 8088 # 预期: LISTEN 0.0.0.0:8088 # 4. 局域网验证 curl http://192.168.2.154:8088/api/backtest/health # 预期: {"code":0,"msg":"ok","data":{...}} ``` ### 3.4 完整部署(方案B:重建镜像) #### Step 3.4.1: 修改文件清单 | 文件 | 修改内容 | |------|---------| | `scripts/backtest-service/main.py` | 兼容直接运行和包导入 | | `scripts/backtest-service/api.py` | 同上,处理相对导入 | | `scripts/backtest-service/executor.py` | 同上 | | `scripts/backtest-service/task_queue.py` | 同上 | | `scripts/backtest-service/result_storage.py` | 同上 | | `docker/entrypoint.sh` | 添加backtest-service启动 | | `docker/Dockerfile` | 添加HEALTHCHECK指令 | #### Step 3.4.2: 修改后的entrypoint.sh ```bash #!/bin/bash set -e echo "==========================================" echo " sanguo_vnpy Docker 容器启动中..." echo "==========================================" # SSH服务 sudo /usr/sbin/sshd -D & # Jupyter Lab jupyter lab --ip=0.0.0.0 --port=8888 --no-browser \ --NotebookApp.token='sanguo123' \ --NotebookApp.password='' \ --NotebookApp.allow_origin='*' & # 自动化回测服务(🆕 新增) cd /app/scripts/backtest-service python3 main.py >> /app/logs/backtest-service.log 2>&1 & echo "回测服务已启动 (PID=$!, 端口8088)" # code-server(可选,不阻塞启动) code-server || echo "code-server启动失败,跳过" & # 等待服务初始化 sleep 5 # 健康检查 if curl -s http://localhost:8088/api/backtest/health > /dev/null 2>&1; then echo "✅ 回测服务健康检查通过" else echo "⚠️ 回测服务尚未就绪,请检查日志: /app/logs/backtest-service.log" fi echo "" echo "✅ sanguo_vnpy 环境启动成功!" echo "" echo "访问地址:" echo " Jupyter Lab: http://localhost:8888 (token: sanguo123)" echo " 回测服务: http://localhost:8088/api/backtest/health" echo " SSH: ssh -p 2222 vnpy@localhost (password: sanguo123)" echo "" tail -f /dev/null ``` #### Step 3.4.3: Dockerfile增量修改 ```dockerfile # 在 USER vnpy 之前添加: RUN mkdir -p /app/logs # 在 COPY --chown=vnpy:vnpy docker/entrypoint.sh /app/ 之后添加: COPY --chown=vnpy:vnpy scripts/backtest-service /app/scripts/backtest-service # 添加健康检查(Docker自动重启判定) HEALTHCHECK --interval=30s --timeout=5s --start-period=10s --retries=3 \ CMD curl -f http://localhost:8088/api/backtest/health || exit 1 ``` #### Step 3.4.4: 构建和部署命令 ```bash # === 在Mac mini上构建镜像 === cd /Users/chufeng/.openclaw/sanguo_projects/sanguo_vnpy docker build -t sanguo_vnpy:latest -f docker/Dockerfile . # === 保存镜像为tar === docker save sanguo_vnpy:latest | gzip > /tmp/sanguo_vnpy.tar.gz # === 传输到NAS === scp /tmp/sanguo_vnpy.tar.gz admin@192.168.2.154:/tmp/ # === 在NAS上加载镜像 === ssh admin@192.168.2.154 sudo /var/packages/Docker/target/usr/bin/docker load < /tmp/sanguo_vnpy.tar.gz # === 停止旧容器、启动新容器 === sudo /var/packages/Docker/target/usr/bin/docker stop sanguo_vnpy sudo /var/packages/Docker/target/usr/bin/docker rm sanguo_vnpy sudo /var/packages/Docker/target/usr/bin/docker run -d \ --name sanguo_vnpy \ --restart unless-stopped \ -p 8888:8888 \ -p 8088:8088 \ -p 8000:8000 \ -p 2222:22 \ -v /volume1/stock/A股数据:/app/data:ro \ sanguo_vnpy:latest ``` **注意**: - 去掉了不常用的端口映射(8080 code-server, 2018/4102 RPC),减少攻击面 - 数据目录通过volume只读挂载,避免容器内意外修改 - `--restart unless-stopped` 确保异常崩溃自动恢复 ### 3.5 数据方案 | 方式 | 路径 | 说明 | |------|------|------| | Volume只读挂载 | `-v /volume1/stock/A股数据:/app/data:ro` | NAS本地路径,性能最好 | | 容器内路径 | `/app/backtest_jobs/` | 回测结果输出目录 | | Volume读写挂载 | `-v /volume1/stock/回测结果:/app/backtest_jobs` | 结果持久化到NAS | ### 3.6 运维方案 | 项目 | 方案 | |------|------| | **自动重启** | `--restart unless-stopped`(Docker原生) | | **健康检查** | Dockerfile HEALTHCHECK + `/api/backtest/health` | | **日志查看** | `docker logs sanguo_vnpy` 或容器内 `/app/logs/backtest-service.log` | | **资源限制** | `-m 4g --cpus=1.5`(8GB内存分配4GB,2核分配1.5核) | | **监控告警** | 后续接入(当前先保证基本可用) | --- ## 四、验证步骤 ### 4.1 交付标准验证 ```bash # 标准一:Health端点返回200 curl -s -o /dev/null -w "%{http_code}" http://192.168.2.154:8088/api/backtest/health # 预期: 200 # 标准二:提交回测任务并获取结果 curl -X POST http://192.168.2.154:8088/api/backtest/submit \ -H "Content-Type: application/json" \ -d '{ "strategy_name": "test_ma_cross", "parameters": {"fast_window": 5, "slow_window": 20}, "start_date": "2024-01-01", "end_date": "2024-12-31", "symbol": "000001.SZ", "interval": "d" }' # 预期: {"code":0,"msg":"任务提交成功","data":{"task_id":"...","status":"pending"}} # 查询结果(替换task_id) curl http://192.168.2.154:8088/api/backtest/result/ # 标准三:自动恢复 # 在NAS上强制杀死容器,验证自动重启 sudo /var/packages/Docker/target/usr/bin/docker kill sanguo_vnpy sleep 10 curl http://192.168.2.154:8088/api/backtest/health # 预期: 200(容器自动重启后服务恢复) ``` ### 4.2 回滚方案 | 场景 | 操作 | |------|------| | 回测服务启动失败 | 容器仍可用,只是8088端口无服务,不影响Jupyter/SSH | | 容器完全不可用 | `docker stop sanguo_vnpy && docker rm sanguo_vnpy`,用旧镜像重建 | | 代码有bug | `docker cp` 修复的文件进容器,重启容器 | | 需要完全回滚 | 用旧镜像 `sanguo_vnpy:with-scripts` 重建容器(旧镜像仍在NAS上) | **旧容器启动命令(回滚用)**: ```bash sudo /var/packages/Docker/target/usr/bin/docker run -d \ -p 8888:8888 -p 8000:8000 -p 8080:8080 -p 8088:8088 \ -p 2018:2018 -p 4102:4102 -p 2222:22 \ --name sanguo_vnpy \ sanguo_vnpy:with-scripts ``` --- ## 五、实施计划 | 步骤 | 操作 | 耗时 | 风险 | |------|------|------|------| | **Phase 1: 快速验证** | 方案A — docker cp + 容器内手动启动 | 5分钟 | 低(不影响现有服务) | | **Phase 2: 代码修复** | 修复main.py等相对导入问题 | 15分钟 | 无(只改导入方式) | | **Phase 3: 入口修改** | 修改entrypoint.sh加入backtest-service | 5分钟 | 低 | | **Phase 4: 重建镜像** | 方案B — docker build + 部署 | 20分钟 | 中(需要短暂停服) | | **Phase 5: 验证交付** | 执行4.1全部验证步骤 | 10分钟 | 无 | **建议先执行Phase 1快速验证,确认backtest-service能正常运行后再进行Phase 2-4。** --- ## 六、关键技术决策 | 决策点 | 选择 | 理由 | |--------|------|------| | 网络模式 | bridge(默认) | Jupyter已验证可用,无需改host模式 | | 进程管理 | entrypoint.sh后台启动 | 简单可靠,无需supervisor | | 导入方式 | 兼容相对/绝对导入 | 既支持 `python main.py` 直接运行,也支持包导入 | | 数据访问 | Volume只读挂载 | NAS本地路径,性能好,安全 | | 重启策略 | `unless-stopped` | 异常崩溃自动恢复,手动stop不自动重启 | | 资源限制 | 4GB内存/1.5CPU | 给NAS留足余量,避免回测吃满资源 | --- ## 附录:问题诊断日志 ``` [2026-04-27 20:00] 容器内 ps aux — 无uvicorn/FastAPI进程 [2026-04-27 20:01] 容器内 ss -tlnp — 8088端口无监听 [2026-04-27 20:02] iptables DNAT — 8088→172.17.0.2:8088 映射正常 [2026-04-27 20:03] 手动启动backtest-service — ModuleNotFoundError [2026-04-27 20:05] 确认容器内start_backtest_service.py为旧版import路径 [2026-04-27 20:06] 确认main.py使用相对导入,无法直接运行 [2026-04-27 20:10] 根因确认:三重问题叠加(entrypoint缺失+代码不同步+相对导入) ```