数据预处理:在建模或分析之前,对原始数据进行清洗、整理、转换与构造的一系列步骤,以提高数据质量与可用性。常见操作包括缺失值处理、去噪/去重、标准化/归一化、编码类别变量、特征选择与特征工程等。(在不同领域也可指“信号预处理、文本预处理”等更具体流程。)
/ˈdeɪtə ˌpriːˈprɑːsesɪŋ/(也常见 /ˈdætə ˌpriːˈprɑːsesɪŋ/)
We need data preprocessing before training the model.
在训练模型之前,我们需要进行数据预处理。
After data preprocessing, the dataset became consistent across sources, and the model’s accuracy improved noticeably.
完成数据预处理后,数据集在不同来源之间变得更一致,模型准确率也明显提升。
**pre-**(“在……之前”)+ process(“处理、加工”)+ -ing(名词化/动名词后缀),字面意思是“在处理/建模之前的处理”。在统计学与机器学习语境中,逐渐固定为指代“建模前的数据准备流程”。