Trino

  • 2023年10月1日数据湖测试

    这篇文章记录了一次针对数据湖查询能力的初步摸底测试,比较了 Trino 427、StarRocks 3.1.3 和 Apache Doris 2.0.1.1 在 TPCH 100G 场景下访问 ORC、Parquet 与 Iceberg+Parquet 数据集的表现。正文先说明测试环境、数据格式、软件版本和结果仅供参考的前提,再逐条列出三种格式上 22 条查询的耗时与失败情况,最后总结了 StarRocks 在完整性上能跑通全部 SQL、Doris 在 Iceberg 上仍不成熟,以及当前测试机器规格过高导致部分结果差异不够稳定等观察。

    2023年10月1日
    1.9K0
  • Trino / StarRocks 阿里云 EMR Kerberos 认证指南

    这篇文章记录了如何在非 EMR 节点上让 Trino 和 StarRocks 正常连接阿里云 EMR 的 Kerberos 环境。正文先从创建带 Kerberos 的 EMR 和测试 ECS 开始,说明如何准备 principal、keytab 和 krb5 配置,再分别给出 Trino Hive catalog 与 StarRocks FE/BE 所需的 core-site.xml、hdfs-site.xml、hive-site.xml 和 JVM 参数设置,最后汇总了 Kerberos 超时、Hive Metastore 连接失败和 HDFS BlockMissingException 等典型报错的定位与修复方法。

    2023年8月21日
    1.9K0