“数据管道”:指把数据从来源(如应用、传感器、数据库)经过采集、传输、清洗、转换、存储与加载等步骤,按既定流程自动化地送到目标系统(如数据仓库、数据湖、分析平台)的一整套处理链路。常用于数据工程、BI 报表、机器学习与实时监控等场景。(也可泛指任何“分阶段处理并传递数据”的流程。)
/ˈdeɪtə/ 或 /ˈdætə/ + /ˈpaɪpˌlaɪn/
A data pipeline moves data from our app to the dashboard.
数据管道把我们应用里的数据传到仪表板上。
To ensure reliable analytics, the team built a data pipeline that validates incoming events, removes duplicates, and loads the cleaned records into a warehouse every hour.
为保证分析可靠,团队搭建了数据管道:对进入的事件做校验、去重,并每小时把清洗后的记录加载到数据仓库中。
“Pipeline”原意是“管道”,来自“pipe(管子)+ line(线路/管线)”,常用来比喻“连续输送的通道”。在计算机与工程语境中,“pipeline(流水线/管线)”引申为把工作拆成多个阶段、依次传递处理的机制;与“data(数据)”结合后,“data pipeline”就特指数据在各处理环节之间“像在管道里流动”一样被自动传输与加工的流程。