搜索_华为云

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

什么区别？ DLI和MRS都支持Spark组件，但在服务模式、接口方式、应用场景和性能特性上存在一些差异。 DLI服务的Spark组件是全托管式服务，用户对Spark组件不感知，仅仅可以使用该服务，且接口为封装式接口。 DLI的这种模式减轻了运维负担，可以更专注于数据处理和分析任务本身。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

创建DLI表的语法请参考创建DLI表，创建OBS表的语法请参考创建OBS表。如果是通过API接口调用提交该作业请参考以下操作说明：调用创建批处理作业接口，参考以下请求参数说明。详细的API参数说明请参考《数据湖探索API参考》>《创建批处理作业》。将请求参数中的“catalog_name”参数设置为“dli”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

例如，当前Livy工具安装路径为“/opt/livy”，则当前需要上传的jar包名称如下： /opt/livy/rsc-jars/livy-api-0.7.2.0107.jar /opt/livy/rsc-jars/livy-rsc-0.7.2.0107.jar /opt/livy/repl_2

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关约束限制当前使用SDK创建的作业不支持在default队列上运行。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_queues(dli_client):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。创建队列 DLI提供创建队列的接口，您可以使用该接口创建队列。示例代码如下： 1 2 3 4 5 6 7 8 9 private static void createQueue(DLIClient

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

'properties.security.protocol' = 'SASL_SSL'、 'properties.sasl.mechanism' = 'GSSAPI或者PLAIN'、 'properties.sasl.jaas.config' = 'org.apache.kafka.common.security

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建Kerberos跨源认证 - 数据湖探索 DLI

如果使用SASL_PLAINTEXT类型，且使用Kerberos认证，则需要同时配置以下参数： 'properties.sasl.mechanism' = 'GSSAPI' 'properties.security.protocol' = 'SASL_PLAINTEXT' 具体的建表操作指导请参考DLI 语法参考。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表的写任务要开启Hive元数据同步功能。 SparkSQL天然与Hive集成，无需考虑元数据问题。该条建议针对的是通过Spark Datasource API或者Flin写Hudi表的场景，通过这两种方式写Hudi时需要增加向Hive同步元数据的配置项；该配置的目的是将Hudi表的元数据统一托管

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Upsert Kafka源表 - 数据湖探索 DLI

s.security.protocol' = 'SASL_SSL'、'properties.sasl.mechanism' = 'GSSAPI或者PLAIN'、'properties.sasl.jaas.config' = 'org.apache.kafka.common.security

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Upsert Kafka结果表 - 数据湖探索 DLI

s.security.protocol' = 'SASL_SSL'、'properties.sasl.mechanism' = 'GSSAPI或者PLAIN'、'properties.sasl.jaas.config' = 'org.apache.kafka.common.security

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Spark作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

扫描量计费按扫描量计费按扫描量计费即：按运行查询作业扫描的数据量付费，如果扫描字节数量少于10M，按10M计算。且数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。对于取消的查询，按取消查询时扫描的总数据量计费。

帮助中心 > 数据湖探索 DLI > 计费说明
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

推断而来的。显式地定义 CSV schema 暂不支持。 Flink 的 CSV Format 数据使用 jackson databind API 去解析 CSV 字符串。表2 数据类型映射 Flink SQL 类型 CSV 类型 CHAR / VARCHAR / STRING string

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
下载并安装JDBC驱动包 - 数据湖探索 DLI

AM的Endpoint及消息体中的区域名称。请求内容示例如下。下面示例代码中的斜体字需要替换为实际内容，详情请参考《统一身份认证服务API参考》。 { "auth": { "identity": { "methods": [ "password"

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
创建DLI表关联HBase - 数据湖探索 DLI

ZK_IP2:ZK_PORT2"。说明：访问MRS集群，只支持创建增强型跨源连接并且需要配置主机信息，管理控制台操作请参考增强型跨源连接，相关API信息请参考创建增强型跨源连接。 TableName 指定在HBase集群中已创建的表名。 RowKey 指定作为rowkey的dli关联表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

之中自动推导得到。不支持显式地定义 JSON schema。在 Flink 中，JSON Format 使用 jackson databind API 去解析和生成 JSON。下表列出了 Flink 中的数据类型与 JSON 中的数据类型的映射关系。表2 数据类型映射 Flink SQL类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Spark作业编辑页面，选择自定义镜像图3 Spark作业镜像授权操作图4 在DLI Flink jar作业编辑页面，选择自定义镜像在使用API时，在作业参数中指定image参数，即可使用自定义镜像运行作业。Spark作业请参考《创建批处理作业》，Flink jar作业请参考《创建Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Jar之前需要将对应的jar包上传至OBS桶中，并在“数据管理>程序包管理”中创建程序包，具体操作请参考创建程序包。用户可以在SQL中调用插入Jar包中的自定义函数。说明：当子用户在创建作业时，子用户只能选择已经被分配的队列。当所选择队列的剩余容量不能满足作业需求时，系统会自动扩容，将按照增加的

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

提供跨源访问CSS、DWS、HBase、OpenTSDB、RDS、Redis、Mongo等样例代码和开发指导。增强型跨源API参考提供增强型跨源相关API接口指导。

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 825

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线