搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

该镜像运行作业。准备容器环境。请参考安装容器引擎文档中的“安装容器引擎”章节。使用root用户登录1容器镜像环境，执行以下命令获取DLI的基础镜像。本示例使用Spark基础镜像为例，使用docker pull方式下载基础镜像到1中的容器镜像环境。 docker pull 基础镜像下载地址

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Python开发环境配置 - 数据湖探索 DLI

Python开发环境配置操作场景在安装和使用Python SDK前，确保您已经完成开发环境的基本配置。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Java开发环境配置 - 数据湖探索 DLI

Java开发环境配置操作场景在安装和使用Java SDK前，确保您已经完成开发环境的基本配置。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新建集群环境均已默认为Python3环境。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Java SDK环境配置 - 数据湖探索 DLI

Java SDK环境配置 Java开发环境配置 SDK的获取与安装初始化DLI客户端父主题： Java SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SDK的获取与安装 - 数据湖探索 DLI

导入Maven依赖，适用于使用Maven管理的Java项目。具体操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
SDK获取与安装 - 数据湖探索 DLI

装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：表1 目录结构名称说明 dli python环境的DLI SDK基础模块。 examples python样例代码。 pyDLI pyHive的实现接口。 setup.py Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
使用Livy提交Spark Jar作业 - 数据湖探索 DLI

具体请参考创建队列。准备一个linux弹性云服务器ECS，用于安装DLI Livy。 ECS需要放通30000至32767端口、8998端口。具体操作请参考添加安全组规则。 ECS需安装Java JDK，JDK版本建议为1.8。配置Java环境变量JAVA_HOME。查询弹

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量System.getenv("AK")和System.getenv("SK")。

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。本节操作介绍DBT连接DLI的操作步骤。操作前准备环境要求确保您的系统环境满足以下要求。操作系统：Windows

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Notebook灵活的进行数据分析

 帮助中心 > 数据湖探索 DLI > 用户指南
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

sion>-bin.tar.gz”，支持在Linux环境中使用，且依赖JDK 1.8及以上版本。配置DLI Spark-submit 使用spark-submit的机器安装JDK 1.8或以上版本并配置环境变量，当前仅在Linux环境下使用spark-submit工具。下载并

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

SQL作业的操作步骤。开发流程图1 在DataArts Studio开发DLI SQL作业的流程图环境准备：准备执行作业所需的DLI资源和DataArts Studio资源。请参考环境准备。创建数据库和表：提交SQL脚本创建数据库和表。请参考步骤1：创建数据库和表。导入业务数据

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

将jdk上传到linux服务器对应的目录下并执行解压命令，此处上传到/usr/local目录下。 sudo tar -xzf jdk-8u261-linux-x64.tar.gz -C /usr/local/ 配置环境变量。编辑.bashrc或.profile文件，添加以下行： export

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述

总条数： 148

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

Java开发环境配置 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

Java SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

配置Beeline通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线