搜索_华为云

Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK概述操作场景 DLI SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 DLI Livy简介 DLI Livy是基于开源的Apache Livy用于提交Spark作业到DLI的客户端工具。准备工作创建DLI队列。在“队列类型”中选择“通用队列”，即Spark作业的计算资源。具体请参考创建队列。准备一个li

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

否 String 队列计算资源的cpu架构。 x86_64 aarch64 默认值为x86_64。说明： aarch64架构计算资源使用华为鲲鹏系列服务器。 resource_mode 否 Integer 队列资源模式。支持以下两种类型： 0：共享资源模式 1：专属资源模式 labels

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

Java SDK概述操作场景 DLI Java SDK 让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何获取并使用Java SDK 。使用须知要使用DLI Java SDK 访问指定服务的 API ，您需要确认已在DLI控制台开通当前服务并完成服务授权。 Java

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在Spark SQL作业中使用UDF 操作场景 DLI支持用户使用Hive UDF（User Defined Function，用户定义函数）进行数据查询等操作，UDF只对单行数据产生作用，适用于一进一出的场景。约束限制在DLI Console上执行UDF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDAF 操作场景 DLI支持用户使用Hive UDAF（User Defined Aggregation Function，用户定义聚合函数）可对多行数据产生作用，通常与groupBy联合使用；等同于SQL中常用的SUM()，AVG()，也是聚合函数。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF 操作场景 DLI支持用户使用Hive UDTF（User-Defined Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据问题现象客户创建Flink SQL作业，消费Kafka后sink到es集群，作业执行成功，但无数据。原因分析查看客户作业脚本内容，排查无问题，作业执行成功，出现该问题可能的原因如下：数据不准确。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关约束限制当前使用SDK创建的作业不支持在default队列上运行。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_queues(dli_client):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用标准SQL语句进行数据的查询和分析。准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 DBT（Data Build Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据保护技术 - 数据湖探索 DLI

知功能后，数据库中会同步删除用户的手机号、邮箱信息。数据传输安全用户个人敏感数据将通过TLS 1.2、TLS1.3进行传输中加密，所有华为云DLI服务的API调用都支持 HTTPS 来对传输中的数据进行加密。 Spark作业传输通信加密 Spark作业支持通过配置表1中的参数开启通信加密。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统问题现象客户执行Flink Jar作业，通过设置checkpoint存储在OBS桶中，作业一直提交失败，并伴有报错提交日志，提示OBS桶名不合法。原因分析确认OBS桶名是否正确。确认所用AKSK是否有权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

SQL作业分析数据。准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置

总条数： 453

上一页
1
...
17
18
19
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK概述 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线