搜索_华为云

产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

I SQL 2003。存算分离 DLI解耦计算和存储负载，存算分离架构，存储资源和计算资源按需灵活配置，提高了资源利用率，降低了成本。企业级多租户支持计算资源按租户隔离，数据权限控制到队列、作业，帮助企业实现部门间的数据共享和权限管理。 Serverless DLI DLI完全兼容Apache

帮助中心 > 数据湖探索 DLI > 产品介绍
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

初步认识华为云数据湖探索，了解数据湖探索的基本功能、应用场景、基本概念和使用限制，有助于您更准确地匹配实际业务。产品介绍什么是DLI 应用场景使用限制与其他云服务的关系 03 入门购买DLI队列后，您可以运行SQL作业和Spark作业，开启您的数据湖探索使用之旅。使用前须知准备工作

 帮助中心 > 数据湖探索 DLI > 成长地图
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

机发送消息通知，方便客户及时感知异常。图4 作业异常告警勾选“开启Checkpoint”，依据自身业务情况调整Checkpoint间隔和模式。Flink Checkpoint机制可以保证Flink任务突然失败时，能够从最近的Checkpoint进行状态恢复重启。图5 checkpoint参数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

启。作业模板内置多个常见Flink SQL通用场景模板，帮助您快速了解和构建作业代码暂无企业安全访问控制与华为云IAM权限打通，支持多角色的访问控制暂无空间隔离支持租户级和项目级的资源和代码隔离，满足多团队协作需求暂无父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
对象存储OBS结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，以此改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
FileSytem结果表 - 数据湖探索 DLI

type 是输出数据编码格式，当前支持“parquet”格式和“csv”格式。当schema为obs时，输出数据编码格式仅支持“parquet”格式。当schema为hdfs时，输出数据编码格式支持“parquet”格式和“csv”格式。 format.field-delimiter

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
资产识别与管理 - 数据湖探索 DLI

的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。对DLI来说，标签用于标识购买的队列和创建数据库，对购买的DLI队列和数据库进行分类。为队列或数据库添加标签时，该队列或数据库上所有请求产生的计费话单里

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
FileSystem结果表 - 数据湖探索 DLI

FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Spark作业，Jar包中包含了Jar作业执行所需的代码和依赖信息，用于在数据查询、数据分析、机器学习等特定的数据处理任务中使用。在提交Spark Jar作业前，将程序包上传至OBS，并将程序包与数据和作业参数一起提交以运行作业。本例介绍通过DLI控制台提交Jar作业

 帮助中心 > 数据湖探索 DLI > 快速入门
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DLI服务在其计算资源中已经内置了一些常用的机器学习的算法库（具体可以参考”数据湖探索

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
监控安全风险 - 数据湖探索 DLI

队列，执行自动实时监控、告警和通知操作。用户可以实时掌握队列中的运行作业网络流入速率、网络流出速率、CPU使用率、内存使用率、磁盘利用率、失败作业率、等待作业数等信息。还可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。关于DLI支持的

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

数据库：数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库通常用于存储、检索和管理结构化数据，由多个数据表组成，这些数据表通过键和索引相互关联。 · 表：表是数据库最重要的组成部分之一，它由行和列组成。每一行代表一个数据项，每一列代表数据的一个属性或特征。表用于组织和存储特定类型

 帮助中心 > 数据湖探索 DLI > 功能总览
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 Notebook是基于开源JupyterLab进行了深度优化的交互式数据分析挖掘模块，提供在线的开发和调试能力，用于编写和调测模型训练代码。完成DLI对接Notebook实例后，您可以基于Notebook提供的Web交互的开发环境同时完成代

 帮助中心 > 数据湖探索 DLI > 用户指南
添加Flink作业标签 - 数据湖探索 DLI

添加Flink作业标签标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。 DLI支持对Flink作业添加标签。如果想对Flink作业添加如项目名称、业务类别、背景信息等相关信息的标识，用户可以通过添加标签来实现。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

r的支持，新增了Redis、DWS作为数据源类型。为用户提供了更多的数据源选择，使得数据集成更加灵活和方便。 Flink OpenSource SQL作业适合通过SQL语句来定义和执行流处理逻辑的场景，简化了流处理的复杂性，使得开发者可以更加专注于业务逻辑的实现。创建Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
DLI常用跨源分析开发方式 - 数据湖探索 DLI

开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DLI作业开发流程 - 数据湖探索 DLI

可通过交互式会话（session）和批处理（batch）方式提交计算任务。通过在DLI提供的弹性资源池队列上提交作业，简化了资源管理和作业调度。支持多种数据源和格式，提供了丰富的数据处理能力，包括但不限于SQL查询、机器学习等。详细操作请参考创建Spark作业。适用于大规模数据处理和分析，如机器学

 帮助中心 > 数据湖探索 DLI > 用户指南
DLI对接LakeFormation - 数据湖探索 DLI

元数据的队列和引擎类型。查看队列的引擎类型和版本请参考查看队列的基本信息。表1 LakeFormation获取元数据的队列和引擎类型队列类型引擎类型和支持的版本 default队列 Spark 3.3.x：支持对接LakeFormation获取元数据的队列和引擎。 HetuEngine

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 创建并使用LakeFormation元数据
怎样查看我的配额 - 数据湖探索 DLI

怎样查看我的配额登录管理控制台。单击管理控制台左上角的，选择区域和项目。在页面右上角，选择“资源 > 我的配额”。系统进入“服务配额”页面。图1 我的配额您可以在“服务配额”页面，查看各项资源的总配额及使用情况。如果当前配额不能满足业务要求，请参考后续操作，申请扩大配额。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类

总条数： 111

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品优势 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

监控安全风险 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

DLI对接LakeFormation - 数据湖探索 DLI

怎样查看我的配额 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线