AutonLab Timeseries-PILE(MOMENT 预训练语料,ICML 2024)

2024 综合基准基础模型语料
数据集介绍

Timeseries-PILE(Time Series Pre-training Integrated Large-scale Ensemble)由卡内基梅隆大学 Auton Lab 研究团队构建,作为 MOMENT 基础模型(ICML 2024)的预训练语料库发布(Hugging Face: AutonLab/Timeseries-PILE)。该语料系统整合了来自4个主流公开时序任务库(异常检测、分类、预测、插补)的大规模多领域时序数据,覆盖医疗、工业、交通、能源、气象等多个领域,旨在解决时序预训练面临的两大瓶颈:缺乏大型统一公开数据库,以及缺乏多任务评测基准。MOMENT 预训练模型(AutonLab/MOMENT-1-large)在有限监督设置下展现出跨任务迁移能力,是开源时序基础模型的重要里程碑。

基本信息
行业综合基准,基础模型语料
任务foundation_pretraining,anomaly_detection,forecasting
模态engineering_parameters
频率档mixed
采样率
真实度hybrid
访问门槛open
质量评分★★★★☆
采用度medium
数据形态continuous_process
是否多模态
规模1,300 万时序,12.3 亿步,20 GB,13 领域
Licenseopen
推荐理由

工业时序基础模型预训练/微调标准起点。

数据集自身论文
使用该数据集的代表论文
下载链接
官方主页
https://huggingface.co/datasets/AutonLab/Timeseries-PILE