datalake专题

DataLake — 批流一体化的追风者(2) -- Delta Lake核心原理解析

一、Delta Lake 1.Delta Lake基础概述   接上文,我们全面地讲解了Data Lake相关的概念、对比区别以及实际发展历程等。那么这篇首章开篇我们来讲历史最为悠久的Delta Lake。它的定位是流批一体的存储中间层,支持 update/delete/merge。由于出自Databricks,spark的所有数据写入方式,包括基于dataframe的批、流,以及