Industrial Time Series Datasets — Community Curated
Petrobras 首个含稀有真实事件的公开油气井集,覆盖钻井/完井/生产,8 类不期望事件(hydrate、scaling、slugging 等),来源 = 真实 + 模拟器 + 手工。Parquet + Apache 协议。油气稀有事件...
油气稀有事件检测唯一权威公开基准;Petrobras 持续维护。
Bosch + Chemnitz 工大 2024 发布。OES 3,648 通道(185–884 nm,25 Hz)+ 31 路机台参数(5 Hz)+ 9/89 点晶圆量测(蚀刻前后氧化层厚度、台阶高度)。10 实验日,CC-BY-4.0。...
2024 年最新高分辨率 OES 公开集,模态丰富,适合 VM / endpoint detection / 腔室状态监控。
港科大等整合 16 个公开集,990 块电池、99,000 个含寿命标签样本,规模为 BatteryML 的 2.5×;覆盖 59 种化学体系(首次纳入钠/锌离子电池)、8 种规格、9 工作温度、421 充放电协议。系统 benchmark...
迄今最大、化学体系最多样的公开电池寿命 benchmark;NASA PCoE 现代替代品。
Bosch Research 发布,4 轴卧式 CNC 加工中心真实产线、Bosch CISS 三轴加速度计连续 2 年采集,每次操作 good/bad 标注。任务:过程监控异常检测、刀具/工件异常分类。工业级真实采集,长跨度,完整代码,迁...
3 风场、36 台风机 SCADA 数据,累计 89 机组年,95 段序列(44 故障导向异常 + 51 正常),10 min 粒度;3 风场特征维度分别 86/257/957。论文同步提出 CARE 评分(Coverage/Accurac...
现有公开风电 SCADA 集中标注最规范,跨风场异质特征天然支持域适应。
TU Darmstadt PTW 发布,首个覆盖完整多工序加工流程的开源离散制造数据集。847 件气动气缸真实产线记录,含各工序机床传感器时序(主轴电流、进给力、振动等)+ 工序级质检数据 + 全流程可追溯索引,把每件工件的工序信号与质检结...
罕见的工序信号与质检结果端到端可追溯设计。
847 件对深度学习偏少;单一产品族泛化未验证。
汽车产线 4,000+ 焊接样本,每样本 = 30 FPS AVI 视频 + 16 kHz FLAC 音频 + 电流/电压/机器人速度时序 CSV + 5 张定格图,236 会话。12 种缺陷无监督检测 baseline AUC 0.92。...
唯一同时含视频 + 声 + 时序 + 静态图的真实汽车焊接公开数据。
KIT 对 228 颗 NMC/C-SiO 商用电芯 × 76 工况测试 > 1 年,0–40°C 四温度,2 s 分辨率原始日志,> 30 亿数据点,含 EIS 阻抗。超大规模 + 双维度退化(容量 + 阻抗),跨温度/工况 SOH/RU...
超大规模 + 双维度退化(容量 + 阻抗),跨温度/工况 SOH/RUL 训练首选。
Zivid One+ Medium 结构光,10 物体类别 4,000+ 扫描,RGB 与点云配准,像素级 GT mask。VISAPP 2022 Best Industrial Paper。唯一公开 RGB + 3D 点云工业异常基准,C...
唯一公开 RGB + 3D 点云工业异常基准,CVPR 23/24 后续论文事实标准。
2022-01 至 2022-06,1 Hz、约 1,100 万条、20 变量(8 模拟 + 8 数字 + GPS),零缺失,FMEA/FMECA 真实故障 timestamp 标注。真实运营 + FMEA 标注 + 千万级规模,交通设备 ...
真实运营 + FMEA 标注 + 千万级规模,交通设备 PdM 标杆。
279 颗 Samsung INR21700-50E × 71 工况,两阶段 DoE + 模型驱动 pi-OED 实验设计,含容量/直流内阻/EIS + 2 s 原始日志,30 亿 + 数据点。实验设计最规范的商用电芯老化集,DoE + p...
实验设计最规范的商用电芯老化集,DoE + pi-OED 双路径。
国家级金属增材基准(LPBF / DED):X 射线荧光与吸收 + 同轴热像 + 工艺参数日志 + 微 CT 后验证;in-situ + ex-situ 配对,仿真 + 实验同条件。政府公认基准,physics-informed ML 最佳...
RPTU + BASF SE 等联合,首个覆盖真实化工过程的标注异常检测数据集集合。含 BASF 大型工业生产装置真实传感时序 + 实验室 + 中试,详细异常事件标注与装置配置;并系统分析 TSAD benchmark 的 triviali...
'Tennessee Eastman 替代品'最强候选——含真实 BASF 工业数据。
真实在役直升机涡轮 7 台,8 路工程参数(大气温度、MGT、可用功率、空速、净功率、压气机转速、目标/实测扭矩)按飞行快照组织。健康指标:扭矩裕度。任务:健康二分类 + 置信度;扭矩裕度概率密度回归。真实运营数据,无人工注入故障,标签源于...
基于 NASA DASHlink 的商用喷气发动机气路数据,8 台发动机,每台最多 15,000 数据点 / 2,001 次飞行。每飞行最多 8 个状态快照、最多 14 路传感器(含 2 路振动)。3 类维护事件剩余周期:HPT 送修、HP...
2019–2022 真实纸浆厂自然故障 11 案例,月级连续振动监测。真实生产线自然退化(非实验室植入),生态效度高。
百度 + 国家能源集团真实风电场,134 台风机 × 24 个月、10 min 粒度、1,140 万 + 记录。含风速/风向/温湿度/桨距角/偏航角/实测功率 + 机组空间坐标。公开规模最大的风电时空预测集,适合时空 GNN。
公开规模最大的风电时空预测集,适合时空 GNN。
8 寸晶圆产线真实数据。D1:5,105 批、602,108 行 × 20 列;D2:1,157 批、126,795 行 × 25 列。气体流量/压力/温度等按 StepID 组织,二分类标签。真实量产 fab 公开数据极稀缺,60 万行带...
真实量产 fab 公开数据极稀缺,60 万行带标注。
SWaT 六级工艺、51 传感/执行器、11 天正常 + 4 天 36 攻击;WADI 配水 127 传感器、14 天正常 + 2 天 15 攻击。1 s 粒度,PLC + SCADA 真实采集。USAD/GDN/MAD-GAN/OmniA...
汇聚 40 公开集,1,070 条高质量时序(200 条多变量),9 领域;统一清洗 + 标注核查;推荐 VUS-PR;对比 40 算法(含基础模型)。异常检测最权威综合基准。
异常检测最权威综合基准。
整合 Monash + Informer + UCR/UEA + TSB-UAD:1,300 万时序、12.3 亿步、20 GB,13 领域;工业子集含 ETT/Electricity/Traffic 等。工业时序基础模型预训练/微调标准起...
工业时序基础模型预训练/微调标准起点。
Ti-6Al-4V LPBF,麦克风(声发射)+ 光二极管(热)+ 高速光学影像毫秒级同步;用音 + 热信号推断熔池形态 R² ≥ 0.8 并定位 LOF 缺陷。CT 缺陷位置作为 GT。证明低成本传感替代高速摄像可行。
证明低成本传感替代高速摄像可行;CT 缺陷位置作为 GT。
7–9 类机器(风机/齿轮箱/轴承/滑轨/阀门等),10 s 单声道;2024 引入 first-shot 设定。工业声学监测年度标准竞赛集,领域泛化设定贴近现实。
工业声学监测年度标准竞赛集,领域泛化设定贴近现实。
锅炉 P1 + 汽轮机 P2 + 水处理泵 P3 + 抽水蓄能 HIL P4,秒级 86 数据点,52 攻击模式,CC BY-SA 4.0。版本 20.07→23.05 难度递增,HAICon 2020/21 排行榜。唯一锅炉-汽轮机-水处...
唯一锅炉-汽轮机-水处理多系统物理耦合 ICS 集。
99 段振动信号,6 类故障(含三种两两组合),5 种轴承型号 × 3 负载 × 稳定/时变转速。跨型号 + 跨负载 + 双转速制度的国产现代轴承基准。
跨型号 + 跨负载 + 双转速制度的国产现代轴承基准。
4 加速度 + 1 麦克风 + 2 热电偶 + 3 电流互感器(10 通道),5 状态、3 负载 + 时变转速子集。振动 + 声 + 热 + 电四模态高规格配置。
两级平行齿轮箱 + 三轴加速度阵列,5 类故障及组合 + 变速/变载/未知工况,240 段 12.8 kHz/24 bit。国内首个复合故障 + 变工况 + 高精度开源齿轮箱基准。
国内首个复合故障 + 变工况 + 高精度开源齿轮箱基准。
Solution Seeker(挪威)发布,对 2,000 口油气井用稳态漂移通量模型仿真多相流,每集 100 万数据点,三套大型集;与 300+ 真实井对比验证。HuggingFace 一键加载。油气仿真时序数据稀缺,规模与物理精度领先。
油气仿真时序数据稀缺,规模与物理精度领先。
38,015 张 52×52 晶圆图,1 正常 + 8 单缺陷 + 29 混合缺陷,8 维 one-hot 多标签。填补 WM-811K 单缺陷局限,IEEE TCPMT 2023 发表。
30+ 类别 58 版本,含澳大利亚 339 风电场分钟级(7.4 亿 + 步)、伦敦家庭能耗、太阳能 4 s 采样等;统一 .tsf 格式。工业能源预测最权威公开子集汇总。
工业能源预测最权威公开子集汇总。
2 台变频驱动离心泵,11 类故障(轴承/松脚/叶轮/绕组短路/断转子条/软脚/对中/不平衡/联轴器/空化/弯轴),多严重度 × 多转速,振动 + 电流/电压。机械 + 电气故障同时覆盖,舰船/流程工业泵站 PHM 优质。
机械 + 电气故障同时覆盖,舰船/流程工业泵站 PHM 优质。
1,981 训 / 424 验 / 424 测晶圆,25 路变量(含 19 路 CMP 过程量),目标 MRR(材料去除率)。任务:虚拟量测(VM)、Run-to-Run 控制。IJPHM 2020 论文对其做了增强 VM 研究。
晶圆制造离子铣蚀刻工具,60 个 CSV,24 路传感器(电压/电流/压力/流量),4 s 采样,3 类故障,逐点标记 + TTF。任务涵盖 FDC、多类故障诊断、RUL。
少数同时覆盖故障分类 + RUL 的半导体设备时序集。
岩石钻机在多种配置工况下的压力传感器时序,11 类状态(1 健康 + 10 故障),训练集 5 配置、验证集 2 配置共 16,396 行;测试集标签盲评。CSV 直接下载。PHM 学会官方赛事,获奖方案发表于 IJPHM。多配置天然构成域...
矿采钻机数据公开极少,多配置天然构成域适应基准。
单级直齿圆柱齿轮箱真实试验台振动数据。三轴加速度计 + 转速计,采样率 20,480 Hz。训练集 2,016 个文件覆盖 15 转速 × 6 扭矩共 78 工况、7 个人工刻痕退化等级;测试/验证集扩展到 18 转速、11 个等级,并含训...
JAXA 提供,基于高精度数值仿真器生成。工质 2 MPa 加压水,4 个电磁阀模拟推力器,8 路压力传感器 1,000 Hz 采样,每条 1,200 ms。训练集 177 条,测试集 46 条;异常含气泡混入(8 种位置)、电磁阀开度故障...
航天领域稀有公开数据;多任务分层结构对复合故障与少样本研究价值高。
DMG Mori NTX2500 上对不锈钢圆柱车削,每套数据集同一刀片连续 26 次切削。三轴加速度计(X/Y/Z)+ 声发射 RMS 同步 25,600 Hz 采样,外加 23 路机床控制器通道。6 套训练集(全部 26 次磨损标签)+...
工业级三相(水/油/气)测试设施,异构多模态:过程测量 + 高频超声 + 报警记录 + 操作日志 + 视频,6 类故障部分渐进引入。炼油/油气分离方向少见的过程数据 + 报警 + 高频信号 + 视频 + 日志全模态基准。
炼油/油气分离方向少见的过程数据 + 报警 + 高频信号 + 视频 + 日志全模态基准。
外径最大 420 mm 的中大型轴承(SKF 22240 CCK/W33)加速疲劳试验,多通道:加速度 + 温度 + 转速 + 摩擦力。补充 CWRU/Paderborn 无法覆盖的重工业大型轴承场景。
316L 不锈钢 LPBF,逐 scanline 独立采样激光功率/速度,含 baseline 与公开 leaderboard。连续参数标签 + live benchmark,回归/异常/强化学习皆可用。
DTU 发布,迄今最完整 TEP 扩展版:28 故障 × 6 模式 × 500 种子,3 min 采样、单次 100 h,52 变量;含设定值变化与模式切换。任务:FD / FI / 多操作点域泛化。跨操作点泛化首选基准。
SCANIA 提供,重型卡车车队某匿名部件 ECU 数据,33,641 辆卡车,14 个操作特征(6 个直方图 + 8 个累计计数器)+ 8 个匿名规格类别变量。时间戳替换为相对 time_step,采样不规则。缺失率 < 1%;正样本极少...
少数车队级公开真实故障数据,同时支持分类/回归/生存分析。
深度脱敏,物理可解释性受限;扰动幅度未公开。
真实水泵循环测试台,8 传感器(2 轴加速度 + 电流/压力/温度/热电偶/电压/流量),35 CSV,1 s 采样,双标注(anomaly + changepoint),稀有事件 < 5%。体积小、标注严,新算法快速验证首选。
Ben-Gurion 大学,4 仿真模型覆盖 HVLM/HMLV,HMLV 含 10 产品、最长 583 步路线、105 工具组/913 设备。HMLV 调度方向最详尽公开测试床,适合 RL 调度与数字孪生。
HMLV 调度方向最详尽公开测试床,适合 RL 调度与数字孪生。
大规模分布式系统真实监控曲线(数万条)+ 168+ 评估配置;考察'单模型跨序列泛化'与'未见新序列适应'。弥合学术 TSAD 与工业大规模部署评测鸿沟。
弥合学术 TSAD 与工业大规模部署评测鸿沟。
4 类故障全过程 run-to-failure,42 kHz、10 s/段。振动 + 声学 + 转速 + 负载 + 温度 5 模态,附 STFT 频谱图版本。振动 + 声学双模态轴承集稀缺,原始 + 频谱图双格式。
15 颗滚动轴承 × 3 工况 run-to-failure,振动 25.6 kHz,每 1 min 采 1.28 s。RUL 引用最多的真实轴承全寿命公开集。
落雷冲击实验:光纤加速度计(振动)+ 光纤载荷 + 应变 + 温度 + 运行状态,单平台同步。极端载荷条件下多通道公开数据稀有,适合极端事件异常检测。
极端载荷条件下多通道公开数据稀有,适合极端事件异常检测。
一年正常 + 7 类攻击的 EPANET 仿真 SCADA 数据,1 h 采样。竞赛级设计,结果发表于 ASCE JWRPM。大型配水管网仿真 + 长时间跨度,与 SWaT 互补。
与 SWaT 互补——大型配水管网仿真 + 长时间跨度。
129 片晶圆(108 正常 + 21 注入故障),含 OES + 射频监控 + 工程变量三路 .mat。Eigenvector Research 维护,附 Zenodo Python 解析器。射频监控公开数据稀缺;至今仍是等离子蚀刻 FD...
射频监控公开数据稀缺;至今仍是等离子蚀刻 FDC 基准。
真实饮料灌装线 IIoT 监控,2022-07 至 2023-02,日/小时双分辨率,含产量、运行时间、停机时间、OEE 等关键指标。配套 IEEE IoT Journal 论文验证 LSTM/GRU/SCINet。
经典 500-run 增强 TEP,哈佛 Dataverse 发布。社区生态最成熟,统计显著性检验首选。Kaggle 镜像方便获取。
社区生态最成熟,统计显著性检验首选。
单操作点,较旧版本,推荐优先使用 Reinartz 2021 Extended TEP。
基于 Intel 晶圆厂模型 PDEVS 仿真,覆盖扩散/注入/光刻 8 阶段 MiniFab 372 种场景,1 min 粒度,TsFresh 可提 6,995 特征;CC BY-NC-SA 4.0。适合调度/吞吐预测代理模型。
少数为半导体 fab 设计的公开仿真基准;适合调度/吞吐预测代理模型。
纯仿真,无真实噪声与 FDC 标注。
1770–1780 RPM 恒速、振动 + 温度全寿命,2022-06 采集。相比 FEMTO/PRONOSTIA,双模态采样更密。