CARE to Compare 是一个面向风电机组早期故障检测的真实世界基准数据集,由 Fraunhofer 研究所于 2024 年发布。数据集包含来自 3 个不同风电场的 36 台风机,累计约 89 机-年的实际运营 SCADA 数据,标注了 44 个导致故障的异常时间段(共含早期故障警告期)以及 51 条正常运行时间序列。该数据集最大的特色在于故障信息的详细程度超过了当时所有公开风机数据集:包含故障类型、故障严重程度、维修记录等元数据。与此同时,论文提出了 CARE 综合评分(Coverage × Accuracy × Reliability × Earliness),可同时衡量异常检测模型在覆盖率、准确性、可靠性和预警提前量四个维度的综合表现,特别适合对早期预警能力提出要求的工业场景。数据集已发布于 Zenodo(DOI: 10.5281/zenodo.14006163)并被数个 2025 年风机健康监测论文引用。由于数据集在 2024 年底才正式发布,下游应用论文数量目前仍较少,但已出现若干以 CARE-score 为评测指标的异常检测基准研究。
| 行业 | 风电,可再生能源 |
|---|---|
| 任务 | fault_detection,anomaly_detection,domain_adaptation |
| 模态 | scada |
| 频率档 | low |
| 采样率 | — |
| 真实度 | real_production |
| 访问门槛 | open |
| 质量评分 | ★★★★★ |
| 采用度 | medium |
| 数据形态 | continuous_process |
| 是否多模态 | 否 |
| 规模 | 3 风场,36 台风机,累计 89 机组年,95 段序列,10 min 粒度 |
| License | CC BY-SA 4.0 |
现有公开风电 SCADA 集中标注最规范,跨风场异质特征天然支持域适应。