探索性数据分析:在正式建模或假设检验之前,通过可视化、汇总统计、分组比较、异常值检查等方式,先“摸清”数据的结构、分布、模式与潜在问题(如缺失、偏差、离群点),以帮助提出更合理的问题与后续分析方向。常简称 EDA。
/ɪkˈsplɔːrətɔːri ˈdeɪtə əˈnæləsɪs/
I did exploratory data analysis to understand the dataset.
我做了探索性数据分析来理解这个数据集。
Before building the model, the team used exploratory data analysis to check the distribution, missing values, and potential outliers, then adjusted the data-cleaning plan.
在建立模型之前,团队用探索性数据分析检查分布、缺失值和潜在离群点,然后调整了数据清洗方案。
exploratory 来自 explore(探索),表示“用于探索的”;data analysis 指“数据分析”。作为一个统计与数据科学中的常用术语,EDA 在现代意义上常与统计学家 John W. Tukey(约翰·图基)在 20 世纪对“先探索、后建模”的方法论倡导密切相关。