-
Apache ORC 加密解析
Apache ORC 支持对列进行加密,且会对该列的统计信息一起加密。同时加密后的文件,即使 reader 没有正确的 master key 也能够正常的查看,只不过看到的都是错误的,被 mask 后的数据。 但是 ORC 的加密只能支持到列,无法精确到复杂类型的子列。如果一个 struct 列是加密列,那么它所有的子列也都会被用相同的密钥加密。 ORC 的密钥分为两个层级,分别是 LocalKe…... Smith- 0
- 29
-
浅谈 Apache ORC 之 Decimal 存储
Decimal 在 Apache ORC 存储主要是依赖 zigzag 编码,zigzag 编码能有效的压缩绝对值小的数字。... Smith- 1
- 174
-
C++ 函数虚表 Virtual Table
之前老是搞不明白这个八股,后面有幸看到 The virtual table 这篇文章,终于搞明白了,特此记录一下。 C++ 标准从来没有规定过如何实现虚函数,都是由编译器自行实现。 Virtual Table 实现 C++ 实现虚函数都是通过 virtual table 的方式,virtual table 是一个维护函数映射的表。虽然虚函数表的具体实现是编译器决定的(即不同的编译器可能有不同的实现…... Smith- 0
- 196
-
自适应 Cache 之 Starburst Warp Speed
Starburst 的 Warp Speed 技术利用机器学习算法,为 Trino 查询自动预热数据,显著提升性能。本文通过对 Warp Speed 架构的解析,来说明如何在 Lakehouse 中做好 cache 这个特性。... Smith- 0
- 140
-
Spark-SQL 有用的SQL
我发现自己每次用 Spark 造Iceberg表都要耗费老大的劲,官方文档总是没有一个现成的Demo,网上也搜索不到,全靠自己琢磨。故在这里记录一下,顺带帮助一下可能需要的人。 Iceberg Spark-SQL 启动 Iceberg: ./bin/spark-sql --packages org.apache.iceberg:iceberg-spark-runtime-3.5_2.12:1.4.…... Smith- 3
- 827
❯
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!
最新评论