搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。填写组织名称，单击“确定”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99.95%可用性。图1 DLI Serverless架构与传统自建Hadoop集群相比，Serverless架构的DLI还具有以下优势：

帮助中心 > 数据湖探索 DLI > 产品介绍
使用CTS审计DLI服务 - 数据湖探索 DLI

variable updateGlobalVariable 关于如何开通云审计服务以及如何查看追踪事件，请参考《云审计服务快速入门》中的相关章节。关于云审计服务事件结构的关键字段详解，请参见《云审计服务用户指南》中的事件结构和事件样例。

帮助中心 > 数据湖探索 DLI > 用户指南
数据赋权（用户或项目） - 数据湖探索 DLI

该API用于将数据库或数据表的数据权限赋给指定的其他用户或项目。被赋权用户所在用户组的所属区域需具有Tenant Guest权限。赋权给项目时，只可以赋权给相同租户下的相同区域的项目。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代码的编写与作业的开发，使用Notebook灵活的进行数据分析与探索，本

 帮助中心 > 数据湖探索 DLI > 用户指南
什么是用户配额？ - 数据湖探索 DLI

配额是指云平台预先设定的资源使用限制，包括资源数量和容量等。设置配额是为了确保资源合理的分配和使用，避免资源过度集中和资源浪费。如果资源配额限制满足不了用户的使用需求，可以通过工单系统来提交您的申请，并告知您申请提高配额的理由。在通过审理之后，系统会更新您的配额并进行通知。关于配额的具体操作说明，请参见关于配额。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
对象存储OBS结果表 - 数据湖探索 DLI

桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
跨源认证权限管理 - 数据湖探索 DLI

赋权：当前用户可将跨源认证的权限赋予其他用户。回收：当前用户可回收其他用户具备的该跨源认证的权限，但不能回收该跨源认证所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该跨源认证的权限。修改当前用户的权限登录DLI管理控制台。单击“跨源管理 > 跨源认证”。选择

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

SDK 访问指定服务的 API ，您需要确认已在DLI控制台开通当前服务并完成服务授权。 Java SDK 支持 Java JDK 1.8 及其以上版本。关于Java开发环境的配置请参考Java SDK环境配置。关于Java SDK的获取与安装请参考SDK的获取与安装。使用S

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CREATE DATABASE语句 - 数据湖探索 DLI

NOT EXISTS 如果数据库已经存在，则不会进行任何操作。 WITH OPTIONS 数据库属性一般用于存储关于这个数据库额外的信息。表达式 key1=val1中的键和值都是字符串文本常量。父主题： DDL语法定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
数据赋权（用户）（废弃） - 数据湖探索 DLI

功能介绍该API用于将数据库或数据表的数据权限赋给指定的其他用户。被赋权用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
FileSytem结果表 - 数据湖探索 DLI

type' = '' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string, boolean, tinyint

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
队列赋权（废弃） - 数据湖探索 DLI

该API用于与其他用户共享指定的队列，可以给用户赋使用指定的队列的权限或者收回使用权限。用户所属的用户组需要在所属区域内具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
FileSystem结果表 - 数据湖探索 DLI

桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subtask，每个桶将至少包含一个Part文件。将根据配置的滚动策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
CREATE CATALOG语句 - 数据湖探索 DLI

OPTIONS catalog属性一般用于存储关于这个catalog额外的信息。表达式 key1=val1 中的键和值都是字符串文本常量。父主题： DDL语法定义

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义

总条数： 107

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

使用CTS审计DLI服务 - 数据湖探索 DLI

数据赋权（用户或项目） - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

什么是用户配额？ - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

跨源认证权限管理 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

CREATE DATABASE语句 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

队列赋权（废弃） - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

CREATE CATALOG语句 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线