本文主要是介绍Delete Formats,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本节详细介绍Iceberg如何进行行级删除。v1中不支持行级删除。
行级删除文件是有效的Iceberg数据文件:文件必须使用有效的Iceberg格式、schema和column projecttion。建议使用表的默认文件格式写入删除文件。
行级删除文件由manifest文件(清单)跟踪。删除文件使用一组相互独立的清单,但清单的schema是相同的。
position delete(位置删除)和equality delete(相等删除)都允许用delete对已删除的行值进行编码。这可用于重建表的更改流。
row delete files(基于位置的delete files)
注意理解这里的delete files定义:delete files是记录被删除的行的文件,而不是指被删除的文件,delete files类似于一种字典,用于记录被删除的行
delete files通过文件和位置(这两个坐标)标识被删除的行。
基于位置的delete files存储file_position_delete这种结构体,该结构体包含以下字段:
Field id, name | Type | Description |
---|---|---|
2147483546 file_path | string | Full URI of a data file with FS scheme. This must match the file_path of the target data file in a manifest entry |
214 |
这篇关于Delete Formats的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!