搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过SQL API访问未开启Kerberos完整代码示例 1 2 3 4

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

r/datasource/dws/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码 Maven依赖 1 2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
DLI对接LakeFormation - 数据湖探索 DLI

streaming.api.CheckpointingMode; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
SDK的获取与安装 - 数据湖探索 DLI

Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ IDEA 开发工具。点击File - New - project... 在New Pro

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
使用CES监控DLI服务 - 数据湖探索 DLI

使用CES监控DLI服务功能说明本章节定义了数据湖探索服务上报云监控的监控指标的命名空间，监控指标列表和维度定义，用户可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。命名空间 SYS.DLI 监控指标表1 数据湖探索服务支持的监控指标指标ID 指标名称

 帮助中心 > 数据湖探索 DLI > 用户指南
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

print(sql_job) 该SDK接口不支持sql_pattern，即通过指定sql片段作为作业过滤条件进行查询。如果需要则可以通过查询所有作业API接口指定该参数进行查询。查询SQL类型作业您可以使用该接口查询当前工程下的所有SQL类型作业的信息并获取查询结果。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
监控安全风险 - 数据湖探索 DLI

网络流入速率、网络流出速率、CPU使用率、内存使用率、磁盘利用率、失败作业率、等待作业数等信息。还可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。关于DLI支持的监控指标请参见数据湖探索监控指标说明及查看指导。父主题：安全

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

'obs://bucket/path/h1'; run compaction on 'obs://bucket/path/h1'; 注意事项使用API方式对SQL创建的Hudi表触发Compaction时需要添加参数hoodie.payload.ordering.field为preCombineField的值。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

datasource/hbase/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码 Maven依赖 1 2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。在Redis客户端中执行如下命令，向不同的key中插入数据，以hash形式存储：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如l：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

型跨源，并绑定所要使用的Flink弹性资源池。设置MySQL的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据MySQL的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。在MySQL中创建用户test，并授权，SQL语句参考如下：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
创建弹性资源池并添加队列 - 数据湖探索 DLI

率。本章节介绍创建弹性资源池并添加队列的操作步骤。 DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。建议您对测试业务场景和生产业务场景分别创建弹性资源池，通过资源物理隔离的方式，保障资源管理的独立性和安全性。弹性资源池约束与限制表1 弹性资源池约束限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

快速响应的场景，支持与多种云服务跨源连通，形成丰富的流生态圈。适用于实时监控、在线分析等场景。 · Flink OpenSource作业：DLI提供了标准的连接器（connectors）和丰富的API，便于快速与其他数据系统的集成。 · Flink Jar作业：允许用户提交编译为

 帮助中心 > 数据湖探索 DLI > 功能总览
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

弹性资源池CU时套餐包按照“CU时”收取计算费用，用户在弹性资源池添加的队列上运行作业时按照弹性资源池CU时计费。适用于可预估队列使用量的场景、或测试项目等资源消耗不高的场景。弹性资源池CU时套餐包的额度按订购周期重置。按订购周期重置：重置周期为月，例如1月5日订购套餐包，之后每月5日同一时间重置免费资源。

帮助中心 > 数据湖探索 DLI > 计费说明
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

型跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。在Redis客户端中执行如下命令，向不同的key中插入数据，以hash形式存储：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

为“-1”，会导致查询失败。该SDK接口不支持sql_pattern，即通过指定sql片段作为作业过滤条件进行查询。如果需要则可以通过查询所有作业API接口指定该参数进行查询。查询作业结果 DLI提供查询作业结果的接口。您可以使用该接口通过JobId查询该作业信息。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关

总条数： 688

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线