搜索_华为云

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Python SDK - 数据湖探索 DLI
Python SDK - 数据湖探索 DLI

Python SDK Python SDK概述 Python SDK环境配置队列相关资源相关 SQL作业相关 Spark作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考
API接口返回的中文字符为乱码，如何解决？ - 数据湖探索 DLI

API接口返回的中文字符为乱码，如何解决？当API接口返回的中文字符出现乱码时，通常是因为字符编码格式不匹配。 DLI接口返回的结果编码格式为“UTF-8”，在调用接口获取返回结果时需要对返回的信息编码转换为“UTF-8”。例如，参考如下实现对返回的response.cont

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
Python开发环境配置 - 数据湖探索 DLI

Studio。操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。检验是否配置成功，运行cmd ，输入 python。运行结果，请参见图1，显示版本信息，则说明安装和配置成功。图1 检验配置是否成功 python安装应用包时出现错误类似错误“error:

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

具体操作请参考初始化DLI客户端 Python SDK列表表1 Python SDK列表类型说明队列相关介绍查询所有队列的Python SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询制定资源包、删除资源包的Python SDK使用说明。 SQL作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
Python SDK环境配置 - 数据湖探索 DLI

Studio。安装Python依赖库 DLI Python SDK依赖第三方库包括：urllib3 1.15以上版本，six 1.10以上版本，certifi，python-dateutil。操作步骤从Python官网下载并安装Python版本。根据Python官方指导安装Python版本。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
SDK获取与安装 - 数据湖探索 DLI

dli python环境的DLI SDK基础模块。 examples python样例代码。 pyDLI pyHive的实现接口。 setup.py Python SDK安装脚本。安装DLI Python SDK 下载并解压SDK安装包。将"dli-sdk-python-<version>

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
表相关 - 数据湖探索 DLI
表相关 - 数据湖探索 DLI

return print(table) 完整样例代码和依赖包说明请参考：Python SDK概述。创建OBS表 DLI提供创建OBS表的接口。您可以使用该接口创建数据存储在OBS的表。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
SQL作业相关 - 数据湖探索 DLI
SQL作业相关 - 数据湖探索 DLI

SQL作业相关数据库相关表相关作业相关父主题： Python SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

Spark作业相关完整样例代码和依赖包说明请参考：Python SDK概述。提交批处理作业 DLI提供执行批处理作业的接口。您可以使用该接口执行批处理作业。示例代码如下： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

置导入数据的类型，例如将data_type设置为csv。csv数据的具体格式通可过options参数设置，例如：csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

return 含表的数据库不能直接删除，请先删除数据库的表再删除数据库。数据库删除后，将不可恢复，请谨慎操作。完整样例代码和依赖包说明请参考：Python SDK概述。查询所有数据库 DLI提供查询数据库列表接口。您可以使用该接口查询当前已创建的数据库列表。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
初始化DLI客户端 - 数据湖探索 DLI

通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

资源相关前提条件已参考Python SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。上传资源包您可以使用DLI提供的接口上传资源包，示例代码如下。完整样例代码和依赖包说明请参考：Python SDK概述。 1 2 3 4

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关约束限制当前使用SDK创建的作业不支持在default队列上运行。查询所有队列 DLI提供查询队列列表接口，您可以使用该接口并选择相应的队列来执行作业。示例代码如下： 1 2 3 4 5 6 7 8 9 def list_all_queues(dli_client):

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

请求参数说明如下，详细参数使用可以参考Python SDK概述下载样例代码。 kind：资源包类型，当前支持包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK

总条数： 343

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

Python SDK - 数据湖探索 DLI

API接口返回的中文字符为乱码，如何解决？ - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

表相关 - 数据湖探索 DLI

SQL作业相关 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线