SDWPF(百度 KDD Cup 2022 完整版)
2022
风电智能电网
数据集介绍
SDWPF(Spatial Dynamic Wind Power Forecasting)数据集由百度研究院于 2022 年发布,用于支持 KDD Cup 2022 竞赛。数据集包含来自龙源电力集团(亚洲最大风电运营商)某大型风电场 134 台风机约 245 天的 SCADA 时序数据,采样间隔 10 分钟,共超过 470 万条记录。其核心特色在于同时提供:①每台风机精确的二维空间坐标,②多种外部气象变量(风速、风向、外部温度),③多种内部状态变量(机舱温度、偏航角、桨距角),支持对风机群在时空两个维度上的联合建模。SDWPF 是迄今最具代表性的大规模空时风电预测基准数据集,在 2023–2025 年间被大量图神经网络、时空 Transformer 以及大模型微调研究引用,Semantic Scholar 显示引用超过 200 篇。KDD Cup 2022 共吸引超过 2400 支国际参赛队伍,各竞赛方案论文大量涌现。
基本信息
| 行业 | 风电,智能电网 |
|---|
| 任务 | forecasting,regression |
|---|
| 模态 | scada,engineering_parameters |
|---|
| 频率档 | low |
|---|
| 采样率 | — |
|---|
| 真实度 | real_production |
|---|
| 访问门槛 | open |
|---|
| 质量评分 | ★★★★★ |
|---|
| 采用度 | high |
|---|
| 数据形态 | continuous_process |
|---|
| 是否多模态 | 否 |
|---|
| 规模 | 134 台风机 × 24 个月,10 min 粒度,1,140 万 + 记录 |
|---|
| License | open |
|---|
推荐理由
公开规模最大的风电时空预测集,适合时空 GNN。
数据集自身论文
Scientific Data, 2024
arXiv, 2022
使用该数据集的代表论文
Energies (MDPI), 19(1):254, 2025 — Various authors
图引导时空 Autoformer,在 SDWPF 上 24 h MSE=0.7480、MAE=0.6362
Engineering Applications of Artificial Intelligence, 2025 — Various authors
元学习 + 时空建模,研究 SDWPF 小样本场景下的迁移能力
Renewable Energy, 236:121280, 2024 — Peng Xinghao, Li Yanting, Tsung Fugee
将风传播图引入 GAT,专注于 SDWPF 上的风电爬坡事件预测
arXiv 2024, 2024 — Various authors
将 Timer 等大时序预训练模型在 SDWPF SCADA 数据上进行微调,代表 LLM for SDWPF 方向
IJCAI 2023, 2023 — Yang Zhang, Lingbo Liu, Xinyu Xiong, Guanbin Li, Guoli Wang, Liang Lin
提出 HSTTN,沙漏形编解码器+跳跃连接,在 SDWPF 上达到 SOTA 长期预测性能
KDD Workshop (Baidu KDD Cup 2022), 2023 — Jiawei Jiang, Chengkai Han, Jingyuan Wang
以 AGCRN + MTGNN 时空图网络为基础模型,5 折交叉验证训练,竞赛 3 名方案代表性工作
arXiv (KDD Cup 2022 竞赛方案), 2022 — Fangquan Lin, Wei Jiang, Hanwei Zhang, Cheng Yang
梯度提升+RNN 集成方案,特征工程完整,代表竞赛期工程实践类最佳方案之一