docs(platform): 姜维完成阿里云部署调研总结 - ALIBABA_CLOUD_DEPLOYMENT_RESEARCH.md
调研总结内容: 1. 已完成的成果: - Terraform 配置(基础设施即代码) - 实时监控系统部署脚本 - 自动化部署流水线脚本 - 应急响应方案 2. 阿里云服务选型建议: - 计算服务(ECS/轻量应用服务器/容器服务) - 存储服务(OSS/NAS/云盘) - 数据库服务(RDS MySQL/SQLite) - 网络服务(VPC/弹性公网IP/SLB/安全组) 3. 架构设计: - 开发-测试-生产三环境架构 - 本地环境 + 阿里云生产环境 4. 成本估算: - 生产环境月度成本估算(¥ 310-450/月) 5. 部署流程: - CI/CD 流水线设计 6. 安全保障: - 网络安全/访问控制/数据安全 7. 下一步计划: - 第1-4周详细工作计划 调研正在进行中,4月17日前将提交完整调研报告!
This commit is contained in:
@@ -0,0 +1,214 @@
|
||||
# sanguo_vnpy 阿里云部署调研总结
|
||||
|
||||
**调研人**: 姜维(后勤总督)
|
||||
**调研时间**: 2026-03-21
|
||||
**版本**: v1.0
|
||||
|
||||
---
|
||||
|
||||
## 🎯 调研目标
|
||||
|
||||
主公指令:调研生产环境部署到阿里云的方案,未来本地是开发和测试环境,生产环境放到阿里云上。
|
||||
|
||||
---
|
||||
|
||||
## 📦 已完成的成果
|
||||
|
||||
### 1. 基础设施即代码(Terraform)
|
||||
**文件**: `platform/research/03-部署方案/terraform/main.tf`
|
||||
|
||||
**内容**:
|
||||
- VPC 网络和虚拟交换机配置
|
||||
- 安全组配置(SSH/HTTP/vn.py 端口)
|
||||
- ECS 实例配置(Ubuntu 22.04)
|
||||
- OSS 对象存储配置
|
||||
- RDS 数据库配置(可选)
|
||||
- 完整输出信息(公网IP/私网IP/SSH命令等)
|
||||
|
||||
---
|
||||
|
||||
### 2. 实时监控系统部署
|
||||
**文件**: `platform/research/04-运维方案/monitoring/deploy_monitoring.sh`
|
||||
|
||||
**内容**:
|
||||
- Prometheus 部署和配置
|
||||
- Node Exporter 部署
|
||||
- Grafana 部署和数据源配置
|
||||
- 告警规则配置(P0/P1 级别告警)
|
||||
- Nginx 反向代理配置
|
||||
- 完整监控访问信息
|
||||
|
||||
**告警规则**:
|
||||
- 实例宕机告警(P0)
|
||||
- CPU 使用率过高告警(P1)
|
||||
- 内存使用率过高告警(P1)
|
||||
- 磁盘空间不足告警(P0)
|
||||
- vn.py 服务宕机告警(P0)
|
||||
|
||||
---
|
||||
|
||||
### 3. 自动化部署流水线
|
||||
**文件**: `platform/research/03-部署方案/automation/deploy_pipeline.sh`
|
||||
|
||||
**内容**:
|
||||
- 代码构建流程
|
||||
- 代码质量检查(Ruff)
|
||||
- 自动化测试(pytest)
|
||||
- 部署包构建(wheel 包)
|
||||
- 多环境部署支持(生产/测试/开发)
|
||||
- 部署验证流程
|
||||
|
||||
---
|
||||
|
||||
### 4. 应急响应方案
|
||||
**文件**: `platform/research/04-运维方案/disaster-recovery/emergency_response.md`
|
||||
|
||||
**内容**:
|
||||
- 应急响应原则(5分钟响应/15分钟诊断/30分钟恢复)
|
||||
- 问题诊断流程
|
||||
- 4个典型场景应急处理:
|
||||
1. 实例完全宕机(P0)
|
||||
2. vn.py 进程崩溃(P0)
|
||||
3. 磁盘空间满(P0)
|
||||
4. 数据库连接失败(P1)
|
||||
- 应急响应检查清单
|
||||
- 联络清单
|
||||
- 事后复盘流程
|
||||
|
||||
---
|
||||
|
||||
## 📊 阿里云服务选型建议
|
||||
|
||||
### 计算服务
|
||||
| 服务 | 推荐配置 | 用途 |
|
||||
|------|---------|------|
|
||||
| ECS | ecs.c6.large (2核4GB) | 生产环境主服务器 |
|
||||
| 轻量应用服务器 | 2核4GB | 测试环境 |
|
||||
| 容器服务 ACK | 标准版 | 未来容器化部署 |
|
||||
|
||||
### 存储服务
|
||||
| 服务 | 用途 |
|
||||
|------|------|
|
||||
| OSS | 对象存储(策略/数据/日志备份) |
|
||||
| NAS | 文件存储(共享数据) |
|
||||
| 云盘 | 系统盘和数据盘 |
|
||||
|
||||
### 数据库服务
|
||||
| 服务 | 用途 |
|
||||
|------|------|
|
||||
| 云数据库 MySQL | 生产环境数据库 |
|
||||
| SQLite | 本地开发/测试数据库 |
|
||||
|
||||
### 网络服务
|
||||
| 服务 | 用途 |
|
||||
|------|------|
|
||||
| VPC | 专有网络隔离 |
|
||||
| 弹性公网 IP | 公网访问 |
|
||||
| SLB | 负载均衡(未来扩展) |
|
||||
| 安全组 | 访问控制 |
|
||||
|
||||
---
|
||||
|
||||
## 🏗️ 架构设计
|
||||
|
||||
### 开发-测试-生产环境架构
|
||||
|
||||
```
|
||||
┌─────────────────────────────────────────────────────────────────┐
|
||||
│ 本地环境 │
|
||||
│ ┌──────────────────────┐ ┌──────────────────────┐ │
|
||||
│ │ 开发环境 (venv) │ │ 测试环境 (venv_testing)│ │
|
||||
│ │ - 快速迭代 │ │ - 集成测试 │ │
|
||||
│ │ - 本地调试 │ │ - 自动化测试 │ │
|
||||
│ └──────────────────────┘ └──────────────────────┘ │
|
||||
└─────────────────────────────────────────────────────────────────┘
|
||||
↓
|
||||
┌─────────────────────────────────────────────────────────────────┐
|
||||
│ 阿里云生产环境 │
|
||||
│ ┌───────────────────────────────────────────────────────┐ │
|
||||
│ │ ECS 实例 (Ubuntu 22.04) │ │
|
||||
│ │ - vn.py 应用服务 │ │
|
||||
│ │ - Prometheus + Grafana 监控 │ │
|
||||
│ │ - Nginx 反向代理 │ │
|
||||
│ └───────────────────────────────────────────────────────┘ │
|
||||
│ ┌──────────────────┐ ┌──────────────────┐ │
|
||||
│ │ OSS 对象存储 │ │ RDS MySQL 数据库 │ │
|
||||
│ │ - 策略文件 │ │ - 业务数据 │ │
|
||||
│ │ - 数据备份 │ │ - 用户数据 │ │
|
||||
│ │ - 日志归档 │ │ │ │
|
||||
│ └──────────────────┘ └──────────────────┘ │
|
||||
└─────────────────────────────────────────────────────────────────┘
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 💰 成本估算
|
||||
|
||||
### 生产环境月度成本估算
|
||||
|
||||
| 资源 | 配置 | 月度费用(估算) |
|
||||
|------|------|----------------|
|
||||
| ECS | ecs.c6.large (2核4GB) | ¥ 200-300 |
|
||||
| 云盘 | 40GB 高效云盘 | ¥ 20-30 |
|
||||
| 公网带宽 | 10Mbps | ¥ 80-100 |
|
||||
| OSS | 100GB 标准存储 | ¥ 10-20 |
|
||||
| **合计** | - | **¥ 310-450/月** |
|
||||
|
||||
---
|
||||
|
||||
## 🚀 部署流程
|
||||
|
||||
### CI/CD 流水线
|
||||
1. **代码提交** → Git 仓库
|
||||
2. **自动构建** → 依赖检查 + 代码质量检查
|
||||
3. **自动测试** → 单元测试 + 集成测试
|
||||
4. **构建部署包** → Wheel 包 + 配置文件
|
||||
5. **部署到测试环境** → 自动化验证
|
||||
6. **部署到生产环境** → 人工确认后部署
|
||||
|
||||
---
|
||||
|
||||
## 🔒 安全保障
|
||||
|
||||
### 网络安全
|
||||
- VPC 专有网络隔离
|
||||
- 安全组白名单控制
|
||||
- SSL/TLS 加密传输
|
||||
|
||||
### 访问控制
|
||||
- RAM 访问控制
|
||||
- SSH 密钥认证
|
||||
- 操作审计日志
|
||||
|
||||
### 数据安全
|
||||
- 数据加密存储
|
||||
- 定期自动备份
|
||||
- 跨地域容灾(可选)
|
||||
|
||||
---
|
||||
|
||||
## 📋 下一步计划
|
||||
|
||||
### 第1周(3月24日-27日)
|
||||
- [ ] 阿里云产品深入调研
|
||||
- [ ] 性能基准测试
|
||||
- [ ] 成本优化方案
|
||||
|
||||
### 第2周(3月28日-4月1日)
|
||||
- [ ] 架构设计详细方案
|
||||
- [ ] 网络设计方案
|
||||
- [ ] 安全设计方案
|
||||
|
||||
### 第3周(4月2日-9日)
|
||||
- [ ] 部署流程详细设计
|
||||
- [ ] Terraform 配置完善
|
||||
- [ ] 部署脚本完善
|
||||
|
||||
### 第4周(4月10日-17日)
|
||||
- [ ] 测试验证
|
||||
- [ ] 运维方案完善
|
||||
- [ ] 完整调研报告撰写
|
||||
|
||||
---
|
||||
|
||||
**调研正在进行中,4月17日前将提交完整调研报告!** 🚛
|
||||
Reference in New Issue
Block a user