搜索_华为云

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

在Spark作业编辑页面配置作业参数信息：队列：选择步骤2：创建弹性资源池并添加队列中创建的队列。 Spark版本：选择Spark引擎版本。本例选择3.3.1版本。应用程序：选择步骤1：上传数据至OBS创建的程序包。委托：请选择步骤4：创建自定义委托允许DLI访问DEW读

 帮助中心 > 数据湖探索 DLI > 快速入门
使用CTS审计DLI服务 - 数据湖探索 DLI

使用CTS审计DLI服务通过云审计服务，您可以记录与DLI服务相关的操作事件，便于日后的查询、审计和回溯。表1 云审计服务支持的DLI操作列表操作名称资源类型事件名称创建数据库 database createDatabase 删除数据库 database deleteDatabase

帮助中心 > 数据湖探索 DLI > 用户指南
SDK的获取与安装 - 数据湖探索 DLI

location,点击Finish。在Maven 项目的 pom.xml文件加入相应的依赖项即可。以引入最新版本SDK为例，请在获取最新的sdk包版本，替换代码中版本。 1 2 3 4 5 <dependency> <groupId>com.huawei.dli</groupId>

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

已创建DLI访问DEW的委托并完成委托授权。该委托需具备以下权限： DEW中的查询凭据的版本与凭据值ShowSecretVersion接口权限，csms:secretVersion:get。 DEW中的查询凭据的版本列表ListSecretVersions接口权限，csms:secretVersion:list。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
创建批处理作业 - 数据湖探索 DLI

spark_version 否 String 作业使用Spark组件的版本号。如果当前Spark组件版本为2.3.2，则不填写该参数。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
Confluent Avro Format - 数据湖探索 DLI

serializers.KafkaAvroDeserializer反序列化的记录。当以这种格式读取（反序列化）记录时，将根据记录中编码的 schema 版本 id 从配置的 Confluent Schema Registry 中获取 Avro writer schema ，而从 table schema

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。建表时数据类型的使用请参考Format章节。语法格式 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

已创建DLI访问DEW的委托并完成委托授权。该委托需具备以下权限： DEW中的查询凭据的版本与凭据值ShowSecretVersion接口权限，csms:secretVersion:get。 DEW中的查询凭据的版本列表ListSecretVersions接口权限，csms:secretVersion:list。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.dws。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 'Spark参数（--conf)'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

KafkaMessageStreaming Flink版本是选择作业运行时所使用的Flink的版本。本例选择使用Flink1.15版本时请在作业中配置允许DLI访问的云服务的委托信息。委托否选择Flink1.15版本时需要用户自行配置委托，否则可能影响作业运行。 Flink

帮助中心 > 数据湖探索 DLI > 快速入门
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。创建HBase源表的列簇必须定义为ROW类型，字段名对应列簇名（column fam

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
pyspark样例代码 - 数据湖探索 DLI

e，type为table，但绝不等同）。 ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7.X版本中，单个Index将使用“_doc”作为type名，不再支持自定义。若访问ES 7.X版本时，该参数只需要填写index即可。构造schema，并添加数据

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie // 元数据文件夹

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.opentsdb。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 'Spark参数（--conf)'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

计算节点处理的数据量远大于其他节点，从而影响整个计算过程的处理效率。例如观察到SQL执行时间较长，进入SparkUI查看对应SQL的执行状态，如图1所示，查看到一个stage运行时间超过20分钟且只剩余一个task在运行，即为数据倾斜的情况。图1 数据倾斜样例常见数据倾斜场景

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Python SDK环境配置 - 数据湖探索 DLI

SDK依赖第三方库包括：urllib3 1.15以上版本，six 1.10以上版本，certifi，python-dateutil。操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。检验是否配置成功，运行cmd ，输入 pyt

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如果JDBC结果表定义了主键，则连接器以upsert模式运行，否则，连接器以Append模式运行。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

connector类型，对于kafka，需配置为'kafka'。 connector.version 是 Kafka版本，支持：'0.10'、 '0.11'。0.10或0.11版本号对应kafka版本号2.11-2.4.0及其他历史版本。 format.type 是数据反序列化格式，支持：'csv', 'json'及'avro'等。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

可以实时查看监控指标及审计日志，以便及时了解DLI的健康状态。管理控制台 DLI作业开发流程 SQL作业编辑器作业管理数据管理作业模板跨源连接常用语法 Spark SQL语法参考 Flink OpenSource SQL语法参考运维与监控查看审计日志查看监控指标

 帮助中心 > 数据湖探索 DLI > 成长地图

总条数： 788

上一页
1
...
10
11
12
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线