搜索_华为云

DLI Delta常见问题 - 数据湖探索 DLI

predicate on partitioned table `777dd`.`test_delta_parts1` 解决方案：在console页面设置中添加参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled值为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
Elasticsearch结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与云搜索服务建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项当前只支持CSS集群7

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
SparkSQL建表参数规范 - 数据湖探索 DLI

建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Flink Jar作业开发基础样例 - 数据湖探索 DLI

管理单元设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数作业中每个算子的最大并行数。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数最好大于用户作业里设置的并发数，否则有可能提交失败。 TaskManager配置用于设置TaskManager资源参数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建Flink Jar作业 - 数据湖探索 DLI

CPU核数共同决定。管理单元设置管理单元的CU数。并行数作业的并行数是指作业中各个算子的并行执行的子任务的数量，即算子子任务数就是其对应算子的并行度。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数应大于用户作业里设置的并发数，否则有可能提交失败。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 快速入门
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
日期、时间函数及运算符 - 数据湖探索 DLI

- interval '3' year - interval '5' month 2-7 时区转换运算符：AT TIME ZONE，用于设置一个时间戳的时区。 SELECT timestamp '2012-10-31 01:00 UTC';-- 2012-10-31 01:00:00

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建Bucket索引表调优 - 数据湖探索 DLI

024 分区表桶数 = 单分区数据量大小(G)/2G，再后向上取整，最小设置1个桶需要使用的是表的总数据大小，而不是压缩以后的文件大小桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi Clean操作说明 - 数据湖探索 DLI

SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 Flink（with属性里设置如下参数，写数据时触发） clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查询Flink作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

annotation 支持在SQL中设置set spark参数。 PowerBI、FineBI、SuperSet、DBT需要设置为true。否 true kyuubi.engine.dli.set.conf.sql.suffix 支持在SQL中尾端设置set spark参数。 PowerBI、DBT需要设置为true。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta Lake 具有一

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。解决方案在SQL语句中添加如下参数： connector.properties.flink.partition-discovery

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
查询SQL作业日志 - 数据湖探索 DLI

避免出现作业结果混乱等问题。 DLI作业要由用户主账户统一设置及修改，子用户无权限。不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
ClickHouse结果表 - 数据湖探索 DLI

前提条件该场景需要与ClickHouse建立增强型跨源连接，并根据实际情况设置ClickHouse集群所在安全组规则中的端口。建立增强型跨源连接，请参考《数据湖探索用户指南》中的“增强型跨源连接”章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 489

上一页
1
...
5
6
7
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Delta常见问题 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

日期、时间函数及运算符 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线