TimeSeriesBench 由清华大学 NetMan 实验室(AIOps 团队)研究团队开发,于2024年发表于 ISSRE 2024(软件可靠性工程顶会),arXiv 编号 2402.10802。该基准专门面向大规模工业微服务/分布式系统的时序异常检测实际需求,针对两大工业痛点:(1)统一模型挑战——评测一个模型同时覆盖数万条时序时的检测性能;(2)未见序列泛化——评测模型对频繁更新系统中全新未见时序的检测能力。基准覆盖超过168种评测设置,配套工业真实数据集与排行榜。研究结论表明没有单一最优算法,不同场景下最优方法存在显著差异,为工业 AIOps 场景的算法设计提供指引。
| 行业 | 综合基准,分布式系统监控 |
|---|---|
| 任务 | anomaly_detection,foundation_pretraining |
| 模态 | engineering_parameters |
| 频率档 | mixed |
| 采样率 | — |
| 真实度 | real_production |
| 访问门槛 | open |
| 质量评分 | ★★★★☆ |
| 采用度 | medium |
| 数据形态 | continuous_process |
| 是否多模态 | 否 |
| 规模 | 数万条真实监控曲线,168+ 评估配置 |
| License | open |
弥合学术 TSAD 与工业大规模部署评测鸿沟。