搜索_华为云

Hudi Clustering操作说明 - 数据湖探索 DLI

什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
pyspark样例代码 - 数据湖探索 DLI

台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过SQL API访问未开启Kerberos完整代码示例 1 2 3 4

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
数据保护技术 - 数据湖探索 DLI

truststore的password，-表示需要用户输入自定义设置的密码值。是 - security.ssl.rest.enabled REST API接口是否启用SSL/TLS加密。是 false security.ssl.verify-hostname 用于控制在建立SSL/TLS连接

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。 API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择Spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
pyspark样例代码 - 数据湖探索 DLI

通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过SQL API访问MRS HBase 未开启kerberos认证样例代码 #

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
DLI对接LakeFormation - 数据湖探索 DLI

streaming.api.CheckpointingMode; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。通过管理控制台创建跨源连接请参考《数据湖探索用户指南》。通过API创建跨源连接请参考《数据湖探索API参考》。父主题： Spark作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

show() 返回结果：提交Spark作业将写好的代码生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。完整示例代码

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

法说明和样例指导。使用Spark作业访问DLI元数据提供SQL作业开发的操作指引和样例代码参考。 Spark SQL 相关API 提供SQL相关API的使用说明。父主题：创建并管理SQL作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

单击右上角的“创建作业”，在Spark作业编辑窗口，可以选择使用“表单模式”或者“API模式”进行参数设置。以下以“表单模式”页面进行说明，“API模式”即采用API接口模式设置参数及参数值，具体请参考《数据湖探索API参考》。选择运行队列。在下拉列表中选择要使用的队列。选择Spar

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DLI作业开发流程 - 数据湖探索 DLI

15及以上版本在创建Jar作业时支持直接配置OBS中的程序包，不支持读取DLI程序包。使用CES监控DLI服务您可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。例如监控DLI队列资源使用量和作业的运行情况。了解更多DLI支持的监控指标请参考使用CES监控DLI服务。

帮助中心 > 数据湖探索 DLI > 用户指南
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

'obs://bucket/path/h1'; run compaction on 'obs://bucket/path/h1'; 注意事项使用API方式对SQL创建的Hudi表触发Compaction时需要添加参数hoodie.payload.ordering.field为preCombineField的值。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明

总条数： 595

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用SQL作业模板开发并提交SQL作业 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线