V2EX  ›  英汉词典

Data Lake

释义 Definition

“数据湖”:一种集中式的数据存储与管理方式,可保存大量原始数据(结构化、半结构化与非结构化),通常以较低成本存放,供后续分析、机器学习、报表等不同用途按需处理。常与“数据仓库(data warehouse)”对比:数据湖更强调“先存后用”,数据仓库更强调“先建模再用”。

发音 Pronunciation (IPA)

/ˈdeɪtə leɪk/(也常见 /ˈdætə leɪk/)

例句 Examples

A data lake stores raw data in its original format.
数据湖以原始格式存储原始数据。

After migrating logs, images, and customer events into a data lake, the team built real-time dashboards and trained anomaly-detection models without redesigning the schema each time.
将日志、图像与客户事件迁移到数据湖后,团队无需每次重做数据架构就能搭建实时仪表盘并训练异常检测模型。

词源 Etymology

“data lake”是现代数据工程领域的比喻性合成词:把海量、多类型、未加工的数据比作“湖”,强调容量大、数据汇聚与“原样保存”。该说法在大数据与云计算兴起后(尤其是Hadoop/云对象存储普及)广泛流行,用来区别于更“规整”的“data warehouse”。

相关词 Related Words

文学作品 Literary Works

该术语主要属于当代信息技术与商业写作语域,较少出现在传统文学作品中;更常见于技术书籍与行业著作,例如:

  • Designing Data-Intensive Applications(Martin Kleppmann)
  • Data Management for Researchers(Kristin Briney)
  • The Data Warehouse Toolkit(Ralph Kimball & Margy Ross,常用于与数据湖概念对照讨论)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   672 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 21:07 · PVG 05:07 · LAX 13:07 · JFK 16:07
♥ Do have faith in what you're doing.