搜索_华为云

创建弹性资源池并添加队列 - 数据湖探索 DLI

创建弹性资源池并添加队列弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

错误码调用API出错后，将不会返回结果数据。调用方可根据每个API对应的错误码来定位错误原因。当调用出错时，HTTP 请求返回一个 4xx 或 5xx 的 HTTP 状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系企业技术人员，并提供错误码，以便我们尽快帮您解决问题。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

DataGen 功能描述 DataGen主要用于生成随机数据，可用于调试以及测试等场景。表1 支持类别类别详情支持表类型源表注意事项创建DataGen表时，表字段类型不支持Array，Map和Row复杂类型，可以通过CREATE TABLE语句中的“COMPUTED

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
永洪BI对接准备工作 - 数据湖探索 DLI

永洪BI对接准备工作操作场景永洪BI与DLI对接之前的准备工作。操作步骤（可选）在公有云管理控制台上方的“服务列表”中选择“大数据”中的“数据湖探索”，单击右上角的“常用链接”下载DLI JDBC驱动（例如：dli-jdbc-1.1.0-jar-with-dependencies-jdk1

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
数据湖探索 DLI - 数据湖探索 DLI

None 服务介绍数据湖探索 DLI 介绍什么是数据湖探索 02:47 数据湖探索DLI产品介绍功能介绍数据湖探索 DLI 熟悉数据湖探索控制台 03:10 数据湖探索控制台介绍操作指导数据湖探索 DLI 介绍怎样创建提交SQL作业 07:36 数据湖探索SQL作业入门指导

 帮助中心 > 数据湖探索 DLI > 视频帮助
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

套餐包计费套餐包 DLI提供优惠的资源套餐包，购买套餐包后，资源按照套餐包类型计费。套餐包是用户预先购买的资源使用量配额，超出当前套餐包的额度，将自动转为按需收费。套餐包类型及适用场景表1 套餐包类型及适用场景类型说明适用场景重置规则扫描数据量套餐包按照用户每

 帮助中心 > 数据湖探索 DLI > 计费说明
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码操作场景本例提供使用Spark作业访问DWS数据源的pyspark样例代码。在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查询Flink作业日志 - 数据湖探索 DLI

查询Flink作业日志操作场景 DLI作业桶用于存储DLI作业运行过程中产生的临时数据，例如：作业日志、作业结果。本节操作指导您在DLI管理控制台配置DLI作业桶，并查看Flink作业日志的操作方法。使用须知请勿将该DLI作业桶绑定的OBS桶用作其它用途，避免出现作业结果混乱等问题。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
认证鉴权 - 数据湖探索 DLI
认证鉴权 - 数据湖探索 DLI

认证鉴权调用API有如下两种认证方式，您可以任选其中一种进行认证鉴权。 Token认证：通过Token认证调用请求。 AK/SK认证：通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证，其安全性比Token认证更高。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

插入数据功能描述将SELECT查询结果或某条数据插入到表中。约束限制 insert overwrite语法不适用于“自读自写”场景，该场景因涉及数据的连续处理和更新，如果使用insert overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入数据功能描述 LOAD DATA可用于导入CSV、Parquet、ORC、JSON、Avro格式的数据，内部将转换成Parquet数据格式进行存储。语法格式 1 2 LOAD DATA INPATH 'folder_path' INTO TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

插入数据功能描述将SELECT查询结果或某条数据插入到表中。约束限制 insert overwrite语法不适用于“自读自写”场景，该场景因涉及数据的连续处理和更新，如果使用insert overwrite语法可能存在数据丢失风险。 "自读自写"是指在处理数据时能够读取数据

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

导入数据功能描述 LOAD DATA可用于导入CSV、Parquet、ORC、JSON、Avro格式的数据，内部将转换成Parquet数据格式进行存储。语法格式 1 2 LOAD DATA INPATH 'folder_path' INTO TABLE [db_name.]table_name

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
修改全局变量 - 数据湖探索 DLI

修改全局变量功能介绍该API用于修改全局变量。调试您可以在API Explorer中调试该接口。 URI URI格式 PUT /v1.0/{project_id}/variables/{var_name} 参数说明表1 URI参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 全局变量相关API
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 DLI Flink作业提交或运行失败时，对应生成的作业日志保存方式，包含以下三种情况：提交失败，只会在submit-client下生成提交日志。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF 操作场景 DLI支持用户使用Hive UDAF（User Defined Aggregation Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF 操作场景 DLI支持用户使用Hive UDTF（User-Defined Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 974

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建弹性资源池并添加队列 - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

永洪BI对接准备工作 - 数据湖探索 DLI

数据湖探索 DLI - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

认证鉴权 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

修改全局变量 - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线