欠拟合(Underfitting)& 过拟合(Overfitting)
发布网友
发布时间:2024-09-06 17:51
我来回答
共1个回答
热心网友
时间:2024-10-25 15:36
重点关注交通运输的原始需求,构建一条安全之路。
过拟合:指的是模型对训练数据拟合得过于完美。换句话说,模型仍在学习模式,但这些模式并没有超出训练集的范畴。实际上,训练集只是整个数据集的一部分,它包含两个部分特征,一部分是整个数据集共有的特征,另一部分是训练集自身特有的特征(如噪声等)。当出现过拟合时,模型学到了这两部分的特征,但测试集并不包含训练集自身特有的特征;如图中的绿线。
过拟合发生在模型将训练数据中的细节和噪声学到一定程度,以至于对模型在新数据上的性能产生负面影响。这意味着噪声或训练数据中的随机波动被模型捕捉并作为概念学习。问题是,这些概念并不适用于新数据,并负面影响模型泛化的能力。
过拟合在具有大量参数的模型中尤为典型,如深度神经网络。
欠拟合:指的是模型既无法对训练数据进行建模,也无法泛化到新数据。对于训练好的模型,如果在训练集上表现差,在测试集上表现同样会很差,这可能是欠拟合导致的,也就是性能不足,如图中黑实线所示。
欠拟合的机器学习模型不是一个合适的模型,它将在训练数据上表现出明显的低性能。