我是个菜鸡,有事可以发我邮件:chendingchao1@126.com。
GitHub 账号:Smith-Cruise
工作经历:
2024 年 12 月 -> 至今,在 OceanBase 负责数据湖相关内容开发。
工作内容:
- Catalog 外表框架搭建。
- 支持 Iceberg/Paimon format,其中 Iceberg 是手写 C++ 元信息解析,Paimon 使用 Paimon-CPP 库集成。
- 优化 Parquet 读取性能,实现基于 Page 级别的预取和缓存。
2022 年 6 月毕业 -> 2024 年 12 月,在 StarRocks 负责数据湖相关内容开发。
工作内容:
- 复杂类型系统支持。
- AWS/Azure/GCP IAM 系统对接。
- 维护并优化 Text/ORC/Parquet reader。
- 数据湖 + Cache 的优化。
- 各类数据湖格式在执行层的对接。
- 各种生态了解,包括不限于 ES,Kerberos,Iceberg,Hudi,Paimon,DeltaLake,Hive…
个人经历
Top Secret。