搜索_华为云

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

已在作业中配置允许DLI访问DEW的委托信息。spark.dli.job.agency.name=自定义委托名称。自定义委托请参考自定义DLI委托权限。请注意配置参数不需要用"" 或 '' 包裹。 Spark3.3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

如果手动配置TaskManager资源，请依据上述公式计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.rds。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

2或更早版本中，x为double类型。 Spark3.3.x：x类型等于函数输入值的类型。升级引擎版本后是否对作业有影响：有影响，涉及相关用法需要适配。示例代码：准备数据： create table test_histogram_numeric(val int); INSERT INTO

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

VARCHAR VARCHAR java.lang.String DATE DATE java.sql.Date 前提条件在使用JDBC前，需要进行如下操作：授权。 DLI使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的企

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
创建弹性资源池 - 数据湖探索 DLI

Objects 队列的标签，使用标签标识云资源。包括“标签键”和“标签值”，具体请参考表3。 label 否 map 弹性资源池属性字段。如果需要购买基础版，配置该参数值为{"spec":"basic"}。不配置该参数时默认为标准版弹性资源池。表3 tags参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
Hudi表分区设计规范 - 数据湖探索 DLI

维度表：总量相对小，增量小，多以更新操作为主，数据读取会是全表读取，或者按照对应业务ID过滤。基于以上考虑，维度表采用天分区会导致文件数过多，而且是全表读取，会导致所需要的文件读取Task过多，采用大颗粒度的日期分区，例如年分区，可以有效降低分区个数和文件数量；对于增量不是很大的维度表，也可以采用非分区表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。quantile digest是一个分位数的集合，当需要查询的数据落在某个分位数附近时，就可以用这个分位数做为要查询数据的近似值。它的精度可以调节，但更高精度的结果会带来空间的昂贵开销。 STRUCT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

'driver'='com.mysql.jdbc.Driver')") 表1 创建表参数参数说明 url RDS的连接地址，需要先创建跨源连接，管理控制台操作请参考《数据湖探索用户指南》。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

单数据等结构化、半结构化的KeyValue数据存储。利用DLI，用户可方便地将海量数据高速、低时延写入HBase。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
数据权限列表 - 数据湖探索 DLI

database.db1的CREATE_VIEW权限 - EXPLAIN query database.db1的EXPLAIN权限 query需要其相应的权限。 Table SHOW CREATE TABLE tb1 database.db1.tables.tb1的SHOW_CREATE_TABLE权限

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

规则匹配表达式首尾的空格，不会参与匹配计算。 partition_spec 一个可选参数，使用键值对来指定分区列表，键值对之间通过逗号分隔。需要注意，指定分区时，表名不支持模糊匹配。示例 -- 演示数据准备 create schema show_schema; create table

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.redis。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(?!_)(?![0-9]+$)[A-Za-z0-9_$]*$。如果特殊字符需要使用单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
SQL作业运行慢如何定位 - 数据湖探索 DLI

在OBS目录下，获取归档日志文件夹，详细如下。 Spark SQL作业：查看带有“driver”或者为“container_xxx_000001”的日志文件夹则为需要查看的Driver日志目录。图2 带有driver的归档日志文件夹名示例图3 container_xxx_000001归档日志文件夹示例

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

VPC安全策略，有利于资源有序集中管理。企业业务账号使用共享的VPC和子网创建资源，并想要使用DLI提交作业访问共享VPC中的资源。此时需要建立DLI与共享VPC中资源的网络连接。例如：账号A为企业IT管理账号，是VPC资源的所有者，创建VPC、子网。并将VPC、子网共享给企业业务账号B。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

要操作。表1 使用DLI提交SQL作业查询RDS MySQL数据的操作流程操作步骤说明步骤1：创建RDS MySQL实例样例场景需要创建RDS MySQL实例。步骤2：创建RDS数据库表登录RDS实例创建数据库和表。步骤3：创建弹性资源池并添加队列创建提交作业所需的计算资源。

帮助中心 > 数据湖探索 DLI > 快速入门
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

单数据等结构化、半结构化的KeyValue数据存储。利用DLI，用户可方便地将海量数据高速、低时延写入HBase。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

print(sql_job) 该SDK接口不支持sql_pattern，即通过指定sql片段作为作业过滤条件进行查询。如果需要则可以通过查询所有作业API接口指定该参数进行查询。查询SQL类型作业您可以使用该接口查询当前工程下的所有SQL类型作业的信息并获取查询结果。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

Spark、Apache Flink、HetuEngine生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格式。数据无需复杂的抽取

 帮助中心 > 数据湖探索 DLI > 成长地图

总条数： 596

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

数据权限列表 - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线