沧海月明 | Smith 的技术网站

LakeHouse

Apache Paimon PK 表的 data distribution

本人初次接触 Paimon，以下内容仅是自己的理解，如有错误，欢迎评论。下面所有讨论的内容仅限 PK 表。 Paimon 通过 bucket 提升数据的读写并行度，每一个 buc…

2026年3月29日
110
LakeHouse

Arrow-rs Parquet Reader 浅析

在千篇一律 arrow-cpp 系的 Parquet Reader 实现中，arrow-rs 上面的实现着实让人眼前一亮，这里简单记录下。 Parquet C++ Reader 早…

2026年1月11日
2222
LakeHouse

Apache Iceberg Delete File 解析

Iceberg 默认使用 Copy On Write 技术，也就是当你删除一行数据时，它会读取原有的文件，删除目标行，然后再重新写一遍，这样开销显然很大。后面 Iceberg 引入…

2025年6月22日
1.1K1
LakeHouse

Apache Iceberg 概念梳理

在学习 Iceberg 源码前，我们需要搞清楚 Iceberg 中的各种概念，这样源码看起来才能更有层次感。所以这篇文章只做一件很纯粹的事情，就是理清 Iceberg 中的名称概…

2025年5月1日
1.1K2
OceanBase

OceanBase Mac/Win Clion 开发环境搭建

这篇文章介绍了如何通过 Clion 配置 OceanBase（OB）开发环境，核心目标是实现在 Mac 或 Windows 上使用 Clion 指哪打哪且无报错红线，同时代码和编译都同步到远端的 Ubuntu 环境中完成。文章详细讲解了工具链配置、CMake 调整、代码同步设置，以及修复 Clion 在识别 OB 三方库和代码时的各种问题，最终实现远程高效开发。附带一些 tips，让整个流程更简单快捷。

2025年1月29日
1.5K4
Others

假如我还有三天假期

n 年不遇的 gap，即将迎来了尾声，写下这篇日记的时候，假期余额已不足3天。要我评价这 15 天的 gap，我只能说一个字，爽，两个字，真爽。自打毕业后，就没这么爽过了。前几…

2025年1月4日
1.1K2
Others

从 StarRocks 离开，再出发

雄关漫道真如铁，而今迈步从头越写于 2024 年 12 月 20 日礼拜五 last day，StarRocks 杭州办公室的会议室中。用流水账记录一下这两年发生的事情以及最近…

2024年12月25日
2.7K18
LakeHouse

Apache Parquet Bloom Filter

Bloom Filter 只能处理 =，IN 谓词。什么是 Bloom Filter? Bloom Filter 是用于判断某个元素是否在一个集合中的数据结构，优点是空间效率和查…

2024年11月23日
1.5K1
LakeHouse

Apache Parquet ZoneMap 过滤支持小记

前置背景 ZoneMap Min-max 过滤也叫 ZoneMap 过滤。一个 ZoneMap 一般包含如下信息： Parquet 的 ZoneMap 含有： ORC 的 Zon…

2024年11月23日
9540
Others

最近日子过的是一团“浆糊”

写在假期的尾巴，即礼拜天的晚上：自从工作后，自己貌似逐渐失去了学生时代对代码的激情。不过也不是说就不喜欢代码，只是纯粹到了周六日，啥事不想干，就想爽玩！这一年不知道是不是因为 …

2024年11月17日
9055

点击查看更多

2021 CMU 15-445 实验笔记 | 沧海月明 2026年3月29日

[…] Extendible Hash Table 的算法实现，可以看我的另一篇文章：https://www.inlighting.org/archives/extendible-hash-table-algorithm […]

评论于 Extendible Hash Table 算法实现
Eric 2026年3月9日

感謝站長

评论于留言板
Smith 2026年3月9日

我把你的邮箱删了

评论于留言板
Eric 2026年3月9日

你好，我是 Eric，之前的留言因個人隱私原因想刪除，再麻煩站長協助，謝謝！

评论于留言板
2021 CMU 15-445 实验笔记 | 沧海月明 2026年1月15日

[…] 这里可以看看我自己总结的事务并发控制：https://www.inlighting.org/archives/database-concurrency-control/ 。 […]

评论于数据库并发控制原理

友情链接