Timeseries-PILE(Time Series Pre-training Integrated Large-scale Ensemble)由卡内基梅隆大学 Auton Lab 研究团队构建,作为 MOMENT 基础模型(ICML 2024)的预训练语料库发布(Hugging Face: AutonLab/Timeseries-PILE)。该语料系统整合了来自4个主流公开时序任务库(异常检测、分类、预测、插补)的大规模多领域时序数据,覆盖医疗、工业、交通、能源、气象等多个领域,旨在解决时序预训练面临的两大瓶颈:缺乏大型统一公开数据库,以及缺乏多任务评测基准。MOMENT 预训练模型(AutonLab/MOMENT-1-large)在有限监督设置下展现出跨任务迁移能力,是开源时序基础模型的重要里程碑。
| 行业 | 综合基准,基础模型语料 |
|---|---|
| 任务 | foundation_pretraining,anomaly_detection,forecasting |
| 模态 | engineering_parameters |
| 频率档 | mixed |
| 采样率 | — |
| 真实度 | hybrid |
| 访问门槛 | open |
| 质量评分 | ★★★★☆ |
| 采用度 | medium |
| 数据形态 | continuous_process |
| 是否多模态 | 否 |
| 规模 | 1,300 万时序,12.3 亿步,20 GB,13 领域 |
| License | open |
工业时序基础模型预训练/微调标准起点。