TimeSeriesBench（清华 NetMan，ISSRE 2024）

2024 综合基准分布式系统监控

数据集介绍

TimeSeriesBench 由清华大学 NetMan 实验室（AIOps 团队）研究团队开发，于2024年发表于 ISSRE 2024（软件可靠性工程顶会），arXiv 编号 2402.10802。该基准专门面向大规模工业微服务/分布式系统的时序异常检测实际需求，针对两大工业痛点：（1）统一模型挑战——评测一个模型同时覆盖数万条时序时的检测性能；（2）未见序列泛化——评测模型对频繁更新系统中全新未见时序的检测能力。基准覆盖超过168种评测设置，配套工业真实数据集与排行榜。研究结论表明没有单一最优算法，不同场景下最优方法存在显著差异，为工业 AIOps 场景的算法设计提供指引。

基本信息

行业	综合基准，分布式系统监控
任务	anomaly_detection，foundation_pretraining
模态	engineering_parameters
频率档	mixed
采样率	—
真实度	real_production
访问门槛	open
质量评分	★★★★☆
采用度	medium
数据形态	continuous_process
是否多模态	否
规模	数万条真实监控曲线，168+ 评估配置
License	open

推荐理由

弥合学术 TSAD 与工业大规模部署评测鸿沟。

数据集自身论文

TimeSeriesBench
ISSRE, 2024

使用该数据集的代表论文

Open Challenges in Time Series Anomaly Detection: An Industry Perspective
arXiv preprint, 2025 — Various
工业视角审视 TSAD 开放挑战，引用 TimeSeriesBench 作为工业场景评测的代表性工作
TimeSeriesBench: An Industrial-Grade Benchmark for Time Series Anomaly Detection Models
ISSRE 2024, 2024 — Haotian Si, Jianhui Li, Changhua Pei, Hang Cui, et al.
基准发布论文，提出统一模型与未见序列两大工业测评维度，含168+评测设置
The Elephant in the Room: Towards A Reliable Time-Series Anomaly Detection Benchmark
NeurIPS 2024, 2024 — John Paparrizos et al.
TSB-AD 与 TimeSeriesBench 同年发布，两者互为参照，共同推动 TSAD 基准可靠性研究

官方主页

https://arxiv.org/abs/2402.10802