7.2.4 Paimon Catalog¶
1 使用须知¶
-
数据放在
hdfs时,需要将core-site.xml,hdfs-site.xml和hive-site.xml放到FE和BE的conf目录下。优先读取conf目录下的hadoop配置文件,再读取环境变量HADOOP_CONF_DIR的相关配置文件。 -
当前适配的
Paimon版本为0.8。
2 创建 Catalog¶
Paimon Catalog 当前支持两种类型的 Metastore 创建 Catalog :
-
filesystem(默认),同时存储元数据和数据在filesystem。 -
hive metastore,它还将元数据存储在Hive metastore中。用户可以直接从Hive访问这些表。
2.1 基于 FileSystem 创建 Catalog¶
2.1.1 HDFS¶
| SQL | |
|---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | |
2.1.2 MINIO¶
| SQL | |
|---|---|
1 2 3 4 5 6 7 | |
2.1.3 OBS¶
| SQL | |
|---|---|
1 2 3 4 5 6 7 | |
2.1.4 COS¶
| SQL | |
|---|---|
1 2 3 4 5 6 7 | |
2.1.5 OSS¶
| SQL | |
|---|---|
1 2 3 4 5 6 7 | |
2.2 基于 Hive Metastore 创建 Catalog¶
| SQL | |
|---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 | |
2.3 基于 Aliyun DLF 创建 Catalog¶
该功能自 2.1.7 和 3.0.3 版本支持。
| SQL | |
|---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 | |
3 列类型映射¶
| Paimon Data Type | Doris Data Type | Comment |
|---|---|---|
| BooleanType | Boolean | |
| TinyIntType | TinyInt | |
| SmallIntType | SmallInt | |
| IntType | Int | |
| FloatType | Float | |
| BigIntType | BigInt | |
| DoubleType | Double | |
| VarCharType | VarChar | |
| CharType | Char | |
| VarBinaryType, BinaryType | String | |
| DecimalType(precision, scale) | Decimal(precision, scale) | |
| TimestampType,LocalZonedTimestampType | DateTime | |
| DateType | Date | |
| ArrayType | Array | 支持Array嵌套 |
| MapType | Map | 支持Map嵌套 |
| RowType | Struct | 支持Struct嵌套(2.0.10 和 2.1.3 版本开始支持) |
4 常见问题¶
-
Kerberos问题-
确保
principal和keytab配置正确。 -
需在
BE节点启动定时任务(如crontab),每隔一定时间(如12小时),执行一次kinit -kt your_principal your_keytab命令。
-
-
Unknown type value:UNSUPPORTED这是
Doris 2.0.2版本和Paimon 0.5版本的一个兼容性问题,需要升级到2.0.3或更高版本解决,或自行patch -
访问对象存储(
OSS、S3等)报错文件系统不支持在
2.0.5(含)之前的版本,用户需手动下载以下jar包并放置在${DORIS_HOME}/be/lib/java_extensions/preload-extensions目录下,重启BE。-
访问
OSS:paimon-oss-0.6.0-incubating.jar -
访问其他对象存储:
paimon-s3-0.6.0-incubating.jar
2.0.6之后的版本不再需要用户手动放置。 -