RLE
-
RLE 编码在 Apache ORC 中的实现
这篇文章系统梳理了 Apache ORC 中 RLE 编码的两套实现,重点介绍它们如何结合 varint、zigzag 和不同的分组规则压缩整数序列。正文先从最基础的 Run Length Encoding、无符号和有符号 varint 讲起,再解释 RLE version 1 如何用 header、delta 和 varint 编码重复或等差序列,随后继续拆解 RLE version 2 中 Short Repeat、Direct、Patched Base 和 Delta 四种编码模式的结构和适用场景,并用具体数字示例说明各类 header、bit width 和数据段的含义。