data-lake共0篇
data-lake
Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics-五八三

Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics

在Delta Lake官网上提到的一篇新一代湖仓架构的论文. 这篇论文由Databricks团队2021年发表于CIDR会议. 这个会议是对sigmod和vldb会议的补充. 可以看到这篇论文和前一篇Delta Lake: High-Perform...
admin的头像-五八三admin2年前
0110
Delta Lake_ High-Performance ACID Table Storage over Cloud Object Stores-五八三

Delta Lake_ High-Performance ACID Table Storage over Cloud Object Stores

论文发表于 2020年, 研究数据湖产品的很好的学习资料. 概要 开篇很明确的表明了为什么要做Delta lake这样一个产品. Databricks尝试将数据仓库直接架在云上对象存储之上, 这种尝试的过程中遇到了...
admin的头像-五八三admin2年前
080