搜索_华为云

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

法说明和样例指导。使用Spark作业访问DLI元数据提供SQL作业开发的操作指引和样例代码参考。 Spark SQL 相关API 提供SQL相关API的使用说明。父主题：创建并管理SQL作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
pyspark样例代码 - 数据湖探索 DLI

通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过SQL API访问MRS HBase 未开启kerberos认证样例代码 #

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
DLI作业开发流程 - 数据湖探索 DLI

15及以上版本在创建Jar作业时支持直接配置OBS中的程序包，不支持读取DLI程序包。使用CES监控DLI服务您可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。例如监控DLI队列资源使用量和作业的运行情况。了解更多DLI支持的监控指标请参考使用CES监控DLI服务。

帮助中心 > 数据湖探索 DLI > 用户指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过SQL API访问未开启Kerberos完整代码示例 1 2 3 4

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

r/datasource/dws/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码 Maven依赖 1 2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

对于Flink Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。图2 开启Checkpoint

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

'obs://bucket/path/h1'; run compaction on 'obs://bucket/path/h1'; 注意事项使用API方式对SQL创建的Hudi表触发Compaction时需要添加参数hoodie.payload.ordering.field为preCombineField的值。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

datasource/hbase/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码 Maven依赖 1 2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

单击右上角的“创建作业”，在Spark作业编辑窗口，可以选择使用“表单模式”或者“API模式”进行参数设置。以下以“表单模式”页面进行说明，“API模式”即采用API接口模式设置参数及参数值，具体请参考《数据湖探索API参考》。选择运行队列。队列：在下拉列表中选择要使用的队列。选择S

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

r/datasource/rds/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码 Maven依赖 1 2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

创建DLI表的语法请参考创建DLI表，创建OBS表的语法请参考创建OBS表。如果是通过API接口调用提交该作业请参考以下操作说明：调用创建批处理作业接口，参考以下请求参数说明。详细的API参数说明请参考《数据湖探索API参考》>《创建批处理作业》。将请求参数中的“catalog_name”参数设置为“dli”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
SDK获取与安装 - 数据湖探索 DLI

目录结构名称说明 dli python环境的DLI SDK基础模块。 examples python样例代码。 pyDLI pyHive的实现接口。 setup.py Python SDK安装脚本。安装DLI Python SDK 下载并解压SDK安装包。将"dli-sdk-python-<version>

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

4.x的V1表修改为V2表。升级Spark 2.4.x的V2表升级为Spark 3.3.1的V2表。同时还需考虑Spark jar作业API语法的兼容性。表3 DLI各Spark版本对V1、V2表兼容列表表类型 Spark2.4 通用队列 Spark3.3 通用队列 V1表

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

aS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思路与措

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

Jar使用DEW获取访问凭证读写OBS的操作指导。用户获取Flink作业委托临时凭证 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

相关链接《IAM产品介绍》《创建用户组、用户并授予DLI权限》《策略语法》《如何修改用户策略》《队列赋权》（API赋权）《数据赋权》（API赋权）《设置队列权限》（Console赋权）《数据库权限管理》（Console赋权）《表权限管理》（Console赋权）

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 560

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线