百度百科版本

机器学习中,一般将样本分成独立的三部分训练集(train set),验证集(validation set)和测试集(test set)。其中,测试集用来检验最终选择最优的模型的性能如何。

查看详情

 

维基百科版本

测试数据集是独立于训练数据集的数据集,但其遵循与训练数据集相同的概率分布。如果适合训练数据集的模型也很好地适合测试数据集,则发生最小的过度拟合(见下图)。与测试数据集相比,更好地拟合训练数据集通常指向过度拟合。因此,测试集是一组仅用于评估完全指定的分类器的性能(即泛化)的示例。

查看详情

 

【资源】免费公开的数据集

训练集、验证集、测试集以及交验验证的理解

似乎没区别,但你混淆过验证集和测试集吗?

AI 数据集最常见的6大问题(附解决方案)

当训练数据和测试数据不同时怎么办?