搜索_华为云

Python SDK - 数据湖探索 DLI
Python SDK - 数据湖探索 DLI

Python SDK Python SDK概述 Python SDK环境配置队列相关资源相关 SQL作业相关 Spark作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK概述操作场景 DLI SDK让您无需关心请求细节即可快速使用数据湖探索服务。本节操作介绍如何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Python开发环境配置 - 数据湖探索 DLI

Studio。操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。检验是否配置成功，运行cmd ，输入 python。运行结果，请参见图1，显示版本信息，则说明安装和配置成功。图1 检验配置是否成功 python安装应用包时出现错误类似错误“error:

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Python SDK环境配置 - 数据湖探索 DLI

Studio。安装Python依赖库 DLI Python SDK依赖第三方库包括：urllib3 1.15以上版本，six 1.10以上版本，certifi，python-dateutil。操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
API接口返回的中文字符为乱码，如何解决？ - 数据湖探索 DLI

API接口返回的中文字符为乱码，如何解决？当API接口返回的中文字符出现乱码时，通常是因为字符编码格式不匹配。 DLI接口返回的结果编码格式为“UTF-8”，在调用接口获取返回结果时需要对返回的信息编码转换为“UTF-8”。例如，参考如下实现对返回的response.cont

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
SDK获取与安装 - 数据湖探索 DLI

dli python环境的DLI SDK基础模块。 examples python样例代码。 pyDLI pyHive的实现接口。 setup.py Python SDK安装脚本。安装DLI Python SDK 下载并解压SDK安装包。将"dli-sdk-python-<version>

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端使用DLI Python SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Token两种认证方式初始化客户端，示例代码如下。完整样例代码和依赖包说明请参考：Python SDK概述。 AK/SK认证方式样例代码

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
SQL作业相关 - 数据湖探索 DLI
SQL作业相关 - 数据湖探索 DLI

SQL作业相关数据库相关表相关作业相关父主题： Python SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

print(e) return print(table) 完整样例代码和依赖包说明请参考：Python SDK概述。创建OBS表 DLI提供创建OBS表的接口。您可以使用该接口创建数据存储在OBS的表。示例代码如下： 1 2 3

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

资源相关前提条件已参考Python SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。上传资源包您可以使用DLI提供的接口上传资源包，示例代码如下。完整样例代码和依赖包说明请参考：Python SDK概述。 1 2 3 4

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

作业相关完整样例代码和依赖包说明请参考：Python SDK概述。导入数据 DLI提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表中。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

queue in queues: print(queue.name) 完整样例代码和依赖包说明请参考：Python SDK概述。父主题： Python SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

Spark jar 作业一直处于“提交中”可能是队列剩余的CU量不足导致作业无法提交。查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
查看SQL执行计划 - 数据湖探索 DLI

询所需的各个步骤，例如表扫描、索引查找、连接操作（如内连接、外连接）、排序和聚合等。执行计划可以帮助分析查询的性能，识别可能的性能瓶颈，通过了解查询的执行逻辑，并根据这些信息调整查询或数据库结构，以提高SQL查询效率。本节操作介绍怎样在DLI管理控制台查看SQL执行计划。约束限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据： {"user_id":"0001"

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发

总条数： 209

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python SDK - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

API接口返回的中文字符为乱码，如何解决？ - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

SQL作业相关 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

查看SQL执行计划 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线