PHM 2016 数据挑战赛聚焦于半导体化学机械平坦化(CMP)工艺的虚拟量测(Virtual Metrology)。数据集包含 1,981 训练 / 424 验证 / 424 测试晶圆,25 路过程变量(其中 19 路为 CMP 工艺量,含研磨压力、转速、浆料流量、摩擦力等),回归目标为材料去除率(MRR)。该数据集是 CMP 虚拟量测领域的事实标准基准,被大量半导体制造 ML 论文引用。采集来源为真实产线量产数据。典型预处理建议:晶圆级归一化 + 时序特征工程(均值、标准差、斜率);可尝试基于物理模型的软传感器融合(浆料温度、磨粒平均粒径估计)提升可解释性。可与 Bosch CNC 数据集组合用于离散制造质量预测的跨场景迁移研究。社区使用情况:CMP 虚拟量测引用最频繁的公开基准,近年来物理-数据融合混合建模方向持续活跃。
| 行业 | 半导体,CMP 工艺 |
|---|---|
| 任务 | virtual_metrology,regression |
| 模态 | engineering_parameters |
| 频率档 | — |
| 采样率 | — |
| 真实度 | real_production |
| 访问门槛 | open |
| 质量评分 | ★★★★☆ |
| 采用度 | high |
| 数据形态 | batch_run |
| 是否多模态 | 否 |
| 规模 | 1,981 训 / 424 验 / 424 测晶圆,25 路变量 |
| License | — |
CMP 虚拟量测事实标准基准。