Overfitting(过拟合):在机器学习/统计建模中,模型把训练数据中的“噪声”和偶然模式也当成规律学了进去,导致训练集表现很好,但在新数据(测试集/真实场景)上泛化能力变差。常见于模型过于复杂、数据量偏少或正则化不足等情况。(也可引申为“过度迎合某一组数据/情境”。)
/ˌoʊvərˈfɪtɪŋ/
Overfitting happens when a model is too complex for the amount of data.
当模型相对于数据量过于复杂时,就容易发生过拟合。
The neural network achieved near-perfect accuracy on the training set, but its performance collapsed on the test set due to overfitting to small patterns and noise.
这个神经网络在训练集上几乎完美,但由于对细小模式和噪声过拟合,在测试集上的表现却大幅下滑。
over- 表示“过度”,fit 表示“拟合/贴合”,再加 -ing 构成名词/动名词,字面意思是“过度拟合”。该术语在统计学与机器学习语境中广泛使用,用来描述模型对训练数据“贴得太紧”而失去泛化能力的现象。