搜索_华为云

了解数据目录、数据库和表 - 数据湖探索 DLI

DLI表的数据存储在DLI服务内部，查询性能更好，适用于对时延敏感类的业务，如交互类的查询等。库表管理中表的列表页面，表类型为Managed的即代表DLI表。 OBS表 OBS表的数据存储在OBS上，适用于对时延不敏感的业务，如历史数据统计分析等。 OBS表通常以对象的形式存储数据，每个对象包含数据和相关的元数据。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
资产识别与管理 - 数据湖探索 DLI

资产识别与管理 DLI 可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

BI连接DLI进行数据查询和分析 YongHong BI是一款企业级数据分析工具。支持数据可视化、报表制作、数据分析和决策支持的功能，帮助企业洞察业务数据，提升决策效率。本节操作介绍YongHong BI连接DLI的操作步骤。操作前准备环境要求：已安装YongHong BI。 DLI的JDBC驱动：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

DLI支持用户使用Hive UDTF（User-Defined Table-Generating Functions）自定义表值函数，UDTF用于解决一进多出业务场景，即其输入与输出是一对多的关系，读入一行数据，输出多个值。约束限制在DLI Console上执行UDTF相关操作时，需要使用自建的SQL队列。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
迁移数据场景概述 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI DWS CDM 典型场景示例：迁移DWS数据至DLI 数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

Flink OpenSource SQL作业适合通过SQL语句来定义和执行流处理逻辑的场景，简化了流处理的复杂性，使得开发者可以更加专注于业务逻辑的实现。创建Flink OpenSource SQL请参考创建Flink OpenSource SQL作业。 Flink Jar作业：

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

提交以运行作业。本例介绍通过DLI控制台提交Flink Jar作业程序包的基本流程。由于不同的业务需求，Jar包的具体编写会有所差异。建议您参考DLI提供的示例代码，并根据实际业务场景进行相应的编辑和定制。获取DLI样例代码。操作流程使用DLI提交Flink Jar作业的操作流程请参考表1。

帮助中心 > 数据湖探索 DLI > 快速入门
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

源（CPU和内存），弹性资源池具备强大的计算能力、高可用性、及灵活的资源管理能力，适用于大规模计算任务场景和有长期资源规划需求的业务场景，灵活应对业务对计算资源变化的需求。发布区域：全部创建弹性资源池 OBS 2.0支持弹性资源池队列创建弹性资源池后，您可以在弹性资源池中

 帮助中心 > 数据湖探索 DLI > 功能总览
弹性资源池计费 - 数据湖探索 DLI

使用体验更佳，价格比按需计费模式更优惠。适用于可预估资源使用周期的场景，例如已完成开发进入生产阶段的项目，推荐使用包年包月计费模式预留业务所需资源。包年包月的弹性资源池在使用过程中规格内按包周期计费，超出规格部分按需计费。按需计费：按需计费是一种后付费模式，默认勾选专属资源模式，空闲时资源不被释放。

帮助中心 > 数据湖探索 DLI > 计费说明
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

DLI委托概述什么是委托？各云服务之间存在业务交互关系，一些云服务需要与其他云服务协同工作，需要您创建云服务委托，将操作权限委托给DLI服务，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。例如：在DLI新建Flink作业所需的AKSK存储在数据加密服务D

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Hudi Clustering操作说明 - 数据湖探索 DLI

默认值是300M，根据业务场景指定。每个分区下，小于300M的文件会被筛选出来做Clustering。 hoodie.clustering.plan.strategy.sort.columns=${排序列1,......,排序列n} // 无默认值，根据业务场景指定。指定为查询业务经常使用且不包含null的列。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
终端节点 - 数据湖探索 DLI
终端节点 - 数据湖探索 DLI

终端节点（Endpoint）即调用API的请求地址，不同服务不同区域的终端节点不同，您可以从地区和终端节点中查询所有服务的终端节点。数据湖探索的终端节点如下表所示，请您根据业务需要选择对应区域的终端节点。表1 数据湖探索的终端节点区域名称区域终端节点（Endpoint）华北-北京四 cn-north-4

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

Hudi表作为Source表时，为防止数据上限超过流量峰值导致作业出现异常，建议设置限流（read.rate.limit），限流上限应该为业务上线压测的峰值。及时对Hudi表进行Compaction，防止Hudi source算子checkpoint完成时间过长当Hudi S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略场景介绍一个企业有多个部门，多个部门不同业务数据分析的时间段可能有所差异，具体场景如下： A部门：在00:00-09:00时间段内资源请求量大，其他时间段有短时间的资源请求量不大的任务运行。 B部门：在10:00-22:00时间段内资

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

影响实时计算性能，配置间隔时间需权衡对业务的性能影响及恢复时长，最好大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。勾选“异常自动恢复”和“从

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Flink作业推荐配置指导 - 数据湖探索 DLI

影响实时计算性能，配置间隔时间需权衡对业务的性能影响及恢复时长，建议大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。勾选“异常自动恢复”和“从

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
队列标签管理 - 数据湖探索 DLI

标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。预定义标签：在标签管

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
增强型跨源连接标签管理 - 数据湖探索 DLI

标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略，则需按照标签策略规则为资源添加标签。标签如果不符

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
弹性资源池标签管理 - 数据湖探索 DLI

标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。预定义标签：在标签管

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池

总条数： 127

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

了解数据目录、数据库和表 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

Flink作业概述 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

弹性资源池计费 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

终端节点 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

队列标签管理 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

弹性资源池标签管理 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线