搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

行作业。准备容器环境。请参考安装容器引擎文档中的“安装容器引擎”章节。使用root用户登录1容器镜像环境，执行以下命令获取DLI的基础镜像。本示例使用Spark基础镜像为例，使用docker pull方式下载基础镜像到1中的容器镜像环境。 docker pull 基础镜像下载地址

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Java开发环境配置 - 数据湖探索 DLI

Java开发环境配置操作场景在安装和使用Java SDK前，确保您已经完成开发环境的基本配置。 Java SDK要求使用JDK1.8或更高版本。考虑到后续版本的兼容性，推荐使用1.8版本。在Java运行环境配置好的情况下，打开windows的命令行，执行命令Java -version，可以检查版本信息。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
Python开发环境配置 - 数据湖探索 DLI

Python开发环境配置操作场景在安装和使用Python SDK前，确保您已经完成开发环境的基本配置。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新建集群环境均已默认为Python3环境。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Java SDK环境配置 - 数据湖探索 DLI

Java SDK环境配置 Java开发环境配置 SDK的获取与安装初始化DLI客户端父主题： Java SDK

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SDK的获取与安装 - 数据湖探索 DLI

导入Maven依赖，适用于使用Maven管理的Java项目。具体操作请参考方法一：通过Maven安装DLI SDK依赖。在集成开发环境中导入JAR文件，适用于使用Eclipse作为集成开发环境的项目。具体操作请参考方法二：通过在Eclipse中导入JAR文件安装SDK。获取DLI SDK 在“DLI

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
SDK获取与安装 - 数据湖探索 DLI

装包。 “dli-sdk-python-x.x.x.zip”压缩包，解压后目录结构如下：表1 目录结构名称说明 dli python环境的DLI SDK基础模块。 examples python样例代码。 pyDLI pyHive的实现接口。 setup.py Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

何在Python环境获取并使用SDK。使用须知要使用DLI Python SDK访问指定服务的 API ，您需要确认已在DLI管理控制台开通当前服务并完成服务授权。 Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
初始化DLI客户端 - 数据湖探索 DLI

ak：账号 Access Key sk：账号 Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

ak：账号 Access Key sk：账号 Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

及其以上版本。关于Java开发环境的配置请参考Java SDK环境配置。关于Java SDK的获取与安装请参考SDK的获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Toke

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。本节操作介绍DBT连接DLI的操作步骤。操作前准备环境要求确保您的系统环境满足以下要求。操作系统：Windows

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
DLI SDK功能矩阵 - 数据湖探索 DLI

DLI SDK功能矩阵 SDK开发指南指导您如何安装和配置开发环境、如何通过调用DLI SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
CLUSTER BY - 数据湖探索 DLI
CLUSTER BY - 数据湖探索 DLI

CLUSTER BY 功能描述按字段实现表的分桶及桶内排序。语法格式 1 2 SELECT attr_expr_list FROM table_reference CLUSTER BY col_name [,col_name ,...]; 关键字 CLUSTER BY：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 排序
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1 DLI获取访问凭据相关开发指南类型操作指导说明 Flink作业场景 Flink Opensource

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

详细安装操作指导请参考安装SuperSet 以Docker安装Superset为例：安装Docker：确保当前主机系统上安装了Docker。拉取Superset Docker镜像： docker pull apache/superset 启动Superset容器： docker run -p 8088:8088

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
队列相关 - 数据湖探索 DLI
队列相关 - 数据湖探索 DLI

队列相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化。创建队列 DLI提供创建队列的接口，您可以使用该接口创建队列。示例代码如下： 1 2 3 4 5 6 7 8 9 private static

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

15 16 17 18 19 20 21 22 23 24 private static void runBatchJob(Cluster cluster) throws DLIException { SparkJobInfo jobInfo = new SparkJobInfo();

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

SQL作业的操作步骤。开发流程图1 在DataArts Studio开发DLI SQL作业的流程图环境准备：准备执行作业所需的DLI资源和DataArts Studio资源。请参考环境准备。创建数据库和表：提交SQL脚本创建数据库和表。请参考步骤1：创建数据库和表。导入业务数据

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 920

上一页
1
2
3
4
5
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Java开发环境配置 - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

Java SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

CLUSTER BY - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

队列相关 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线