docs(platform): 姜维完成阿里云部署调研总结 - ALIBABA_CLOUD_DEPLOYMENT_RESEARCH.md

调研总结内容:
1. 已完成的成果:
   - Terraform 配置(基础设施即代码)
   - 实时监控系统部署脚本
   - 自动化部署流水线脚本
   - 应急响应方案

2. 阿里云服务选型建议:
   - 计算服务(ECS/轻量应用服务器/容器服务)
   - 存储服务(OSS/NAS/云盘)
   - 数据库服务(RDS MySQL/SQLite)
   - 网络服务(VPC/弹性公网IP/SLB/安全组)

3. 架构设计:
   - 开发-测试-生产三环境架构
   - 本地环境 + 阿里云生产环境

4. 成本估算:
   - 生产环境月度成本估算(¥ 310-450/月)

5. 部署流程:
   - CI/CD 流水线设计

6. 安全保障:
   - 网络安全/访问控制/数据安全

7. 下一步计划:
   - 第1-4周详细工作计划

调研正在进行中,4月17日前将提交完整调研报告!
This commit is contained in:
cfdaily
2026-03-21 21:59:45 +08:00
parent c2a95ed9b0
commit f5a2d91346
@@ -0,0 +1,214 @@
# sanguo_vnpy 阿里云部署调研总结
**调研人**: 姜维(后勤总督)
**调研时间**: 2026-03-21
**版本**: v1.0
---
## 🎯 调研目标
主公指令:调研生产环境部署到阿里云的方案,未来本地是开发和测试环境,生产环境放到阿里云上。
---
## 📦 已完成的成果
### 1. 基础设施即代码(Terraform
**文件**: `platform/research/03-部署方案/terraform/main.tf`
**内容**:
- VPC 网络和虚拟交换机配置
- 安全组配置(SSH/HTTP/vn.py 端口)
- ECS 实例配置(Ubuntu 22.04
- OSS 对象存储配置
- RDS 数据库配置(可选)
- 完整输出信息(公网IP/私网IP/SSH命令等)
---
### 2. 实时监控系统部署
**文件**: `platform/research/04-运维方案/monitoring/deploy_monitoring.sh`
**内容**:
- Prometheus 部署和配置
- Node Exporter 部署
- Grafana 部署和数据源配置
- 告警规则配置(P0/P1 级别告警)
- Nginx 反向代理配置
- 完整监控访问信息
**告警规则**:
- 实例宕机告警(P0
- CPU 使用率过高告警(P1
- 内存使用率过高告警(P1
- 磁盘空间不足告警(P0
- vn.py 服务宕机告警(P0
---
### 3. 自动化部署流水线
**文件**: `platform/research/03-部署方案/automation/deploy_pipeline.sh`
**内容**:
- 代码构建流程
- 代码质量检查(Ruff
- 自动化测试(pytest
- 部署包构建(wheel 包)
- 多环境部署支持(生产/测试/开发)
- 部署验证流程
---
### 4. 应急响应方案
**文件**: `platform/research/04-运维方案/disaster-recovery/emergency_response.md`
**内容**:
- 应急响应原则(5分钟响应/15分钟诊断/30分钟恢复)
- 问题诊断流程
- 4个典型场景应急处理:
1. 实例完全宕机(P0
2. vn.py 进程崩溃(P0
3. 磁盘空间满(P0
4. 数据库连接失败(P1
- 应急响应检查清单
- 联络清单
- 事后复盘流程
---
## 📊 阿里云服务选型建议
### 计算服务
| 服务 | 推荐配置 | 用途 |
|------|---------|------|
| ECS | ecs.c6.large (2核4GB) | 生产环境主服务器 |
| 轻量应用服务器 | 2核4GB | 测试环境 |
| 容器服务 ACK | 标准版 | 未来容器化部署 |
### 存储服务
| 服务 | 用途 |
|------|------|
| OSS | 对象存储(策略/数据/日志备份) |
| NAS | 文件存储(共享数据) |
| 云盘 | 系统盘和数据盘 |
### 数据库服务
| 服务 | 用途 |
|------|------|
| 云数据库 MySQL | 生产环境数据库 |
| SQLite | 本地开发/测试数据库 |
### 网络服务
| 服务 | 用途 |
|------|------|
| VPC | 专有网络隔离 |
| 弹性公网 IP | 公网访问 |
| SLB | 负载均衡(未来扩展) |
| 安全组 | 访问控制 |
---
## 🏗️ 架构设计
### 开发-测试-生产环境架构
```
┌─────────────────────────────────────────────────────────────────┐
│ 本地环境 │
│ ┌──────────────────────┐ ┌──────────────────────┐ │
│ │ 开发环境 (venv) │ │ 测试环境 (venv_testing)│ │
│ │ - 快速迭代 │ │ - 集成测试 │ │
│ │ - 本地调试 │ │ - 自动化测试 │ │
│ └──────────────────────┘ └──────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ 阿里云生产环境 │
│ ┌───────────────────────────────────────────────────────┐ │
│ │ ECS 实例 (Ubuntu 22.04) │ │
│ │ - vn.py 应用服务 │ │
│ │ - Prometheus + Grafana 监控 │ │
│ │ - Nginx 反向代理 │ │
│ └───────────────────────────────────────────────────────┘ │
│ ┌──────────────────┐ ┌──────────────────┐ │
│ │ OSS 对象存储 │ │ RDS MySQL 数据库 │ │
│ │ - 策略文件 │ │ - 业务数据 │ │
│ │ - 数据备份 │ │ - 用户数据 │ │
│ │ - 日志归档 │ │ │ │
│ └──────────────────┘ └──────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
```
---
## 💰 成本估算
### 生产环境月度成本估算
| 资源 | 配置 | 月度费用(估算) |
|------|------|----------------|
| ECS | ecs.c6.large (2核4GB) | ¥ 200-300 |
| 云盘 | 40GB 高效云盘 | ¥ 20-30 |
| 公网带宽 | 10Mbps | ¥ 80-100 |
| OSS | 100GB 标准存储 | ¥ 10-20 |
| **合计** | - | **¥ 310-450/月** |
---
## 🚀 部署流程
### CI/CD 流水线
1. **代码提交** → Git 仓库
2. **自动构建** → 依赖检查 + 代码质量检查
3. **自动测试** → 单元测试 + 集成测试
4. **构建部署包** → Wheel 包 + 配置文件
5. **部署到测试环境** → 自动化验证
6. **部署到生产环境** → 人工确认后部署
---
## 🔒 安全保障
### 网络安全
- VPC 专有网络隔离
- 安全组白名单控制
- SSL/TLS 加密传输
### 访问控制
- RAM 访问控制
- SSH 密钥认证
- 操作审计日志
### 数据安全
- 数据加密存储
- 定期自动备份
- 跨地域容灾(可选)
---
## 📋 下一步计划
### 第1周(3月24日-27日)
- [ ] 阿里云产品深入调研
- [ ] 性能基准测试
- [ ] 成本优化方案
### 第2周(3月28日-4月1日)
- [ ] 架构设计详细方案
- [ ] 网络设计方案
- [ ] 安全设计方案
### 第3周(4月2日-9日)
- [ ] 部署流程详细设计
- [ ] Terraform 配置完善
- [ ] 部署脚本完善
### 第4周(4月10日-17日)
- [ ] 测试验证
- [ ] 运维方案完善
- [ ] 完整调研报告撰写
---
**调研正在进行中,4月17日前将提交完整调研报告!** 🚛