搜索_华为云

Confluent Avro Format - 数据湖探索 DLI

etc/schema-registry/schema-registry.properties 创建flink opensource sql作业，选择版本flink 1.12，并选择保存日志，然后提交运行： CREATE TABLE kafkaSource ( order_id string, order_channel

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Hudi数据表Compaction规范 - 数据湖探索 DLI

时或每4个小时去调度执行一次异步Compaction作业，这是一个基本的维护MOR表的方案。采用Spark异步执行Compaction，不采用Flink进行Compaction。 Flink写hudi建议的方案是Flink只负责写数据和生成Compaction计划。由单独的队列提交Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

getQueueName()); } 默认队列允许所有用户使用，DLI会限制用户使用默认队列的次数。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 private static void listAllQueues(DLIClient

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Flink作业模板相关 - 数据湖探索 DLI

println(result); } 查询作业模板列表 DLI提供查询Flink作业模板的接口。您可以使用该接口查询作业模板列表。本示例排序方式选择降序desc，将会列出作业模板ID小于cursor的作业模板列表信息。示例代码如下： 1 2 3 4 5 6 7 public static

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
续费概述 - 数据湖探索 DLI
续费概述 - 数据湖探索 DLI

开通自动续费后，DLI资源会在每次到期前自动续费，避免因忘记手动续费而导致资源被自动删除。在DLI资源生命周期的不同阶段，您可以根据需要选择一种方式进行续费，具体如图1所示。图1 DLI资源生命周期 DLI资源从购买到到期前，处于正常运行阶段，资源状态为“运行中”。到期后，资源状态变为“已过期”。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
CREATE TABLE AS SELECT - 数据湖探索 DLI

由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应 Table创建成功，创建的Hudi表可以进入DLI控制台，在左侧菜单栏选择”数据管理”->”库表管理”，随后筛选数据库并点击名称，进入表列表查询。父主题： Hudi DML语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

exclusive_cluster：独享。 edge_node：边缘节点。默认值为“shared_cluster”。 cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。 checkpoint_enabled

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi Clustering操作说明 - 数据湖探索 DLI

hoodie.clustering.plan.strategy.partition.regex.pattern=${正则表达式} // 无默认值，不指定该参数的时候Clustering会对所有分区下的数据进行重组。 hoodie.clustering.plan.strategy.small

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
配置多版本过期数据回收站 - 数据湖探索 DLI

建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。图1 创建生命周期规则示例

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

的ip地址和端口号获取方式如下：在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper > 实例”，获取ZooKeeper角色实例的IP地址。在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

的ip地址和端口号获取方式如下：在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper > 实例”，获取ZooKeeper角色实例的IP地址。在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。若未在创建Redis结果表的语句中定义Redis

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hudi常见配置参数 - 数据湖探索 DLI

compaction.lazy.block.read 当CompactedLogScanner合并所有日志文件时，此配置有助于选择是否应延迟读取日志块。选择true以使用I/O密集型延迟块读取（低内存使用），或者为false来使用内存密集型立即块读取（高内存使用）。 true hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

的中的示例。默认情况下空的input split不创建partition 说明： Spark2.4.x：默认情况下空的input split将创建partition。 Spark3.3.x：默认情况下空的input split不创建partition。 Spark3.3.x时spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

的ip地址和端口号获取方式如下：在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper > 实例”，获取ZooKeeper角色实例的IP地址。在MRS Manager上，选择“集群 > 待操作的集群名称 > 服务 > ZooKeeper

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

自定义委托及配置请参考自定义DLI委托权限。使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Spark Jar作业编辑界面，选择配置优化参数，配置信息如下: 不同的OBS桶，使用不同的AKSK认证信息。可以使用如下配置方式，根据桶指定不同的AKSK信息，参数说明详见表1。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

redisSource; 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hudi Compaction操作说明 - 数据湖探索 DLI

更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发）

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

com/jarname.jar" group_name：资源包所属分组名称。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 def list_resources(dli_client):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

ELSE 0 END ) a GROUP BY a.Key; JOIN数据倾斜解决方案登录数据湖探索管理控制台，选择“SQL作业”，在要修改的作业所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类

总条数： 521

上一页
1
...
22
23
24
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Confluent Avro Format - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

Flink作业模板相关 - 数据湖探索 DLI

续费概述 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线