2.4 KiB
2.4 KiB
📊 A股本地数据仓库
📋 数据概况
基础信息数据
- 数据来源: AKShare (免费开源)
- 股票数量: 5,493只A股
- 时间范围: 2010年至今
- 创建时间: 2026-03-26 20:02:10
存储结构
data/
├── raw/ # 原始数据
│ ├── a_stock_daily/ # A股日线行情数据(待下载)
│ │ ├── 2010/ # 按年分区
│ │ ├── 2011/
│ │ └── ...
│ ├── financial_reports/ # 财报数据(待下载)
│ ├── stock_info/ # 股票基础信息
│ └── data_sources/ # 数据源配置
├── processed/ # 处理后数据
│ ├── a_stock_daily/ # 清洗后的日线数据
│ ├── financial_indicators/ # 财务指标计算数据
│ ├── stock_info/ # 标准化股票信息
│ └── quality_reports/ # 数据质量报告
└── running_data/ # 运行数据
├── update_logs/ # 更新日志
└── config/ # 运行配置
数据结构
基础信息数据字段
- symbol: 股票代码
- name: 股票名称
- industry: 所属行业
- market: 市场类型
- list_date: 上市日期
- total_market_cap: 总市值
- circulating_market_cap: 流通市值
日线数据字段
- date: 交易日期
- open/high/low/close: 开高低收价格
- volume: 成交量
- amount: 成交额
- adj_factor: 复权因子
🚀 使用说明
1. 数据访问
import pandas as pd
# 读取基础信息
basic_info = pd.read_csv("raw/stock_info/stock_basic_info_raw_*.csv")
# 读取日线数据(按年分区)
daily_2024 = pd.read_parquet("raw/a_stock_daily/2024/*.parquet")
2. 数据更新
# 运行日线数据下载
python3 scripts/data_acquisition/a_stock_daily_data.py
📊 数据质量
完整性检查
- 交易日连续性
- 价格数据完整性
- 成交量一致性
准确性验证
- 价格逻辑检查
- 数据格式统一
- 异常值检测
🔧 技术架构
数据采集
- 使用AKShare开源库
- 批量并行下载
- 自动错误重试
数据处理
- Parquet列式存储
- Snappy压缩
- 时间分区索引
数据维护: 赵云(数据工程将军) 最后更新: 2026-03-26 20:02:10