搜索_华为云

欠费说明 - 数据湖探索 DLI
欠费说明 - 数据湖探索 DLI

用，同时账户中的余额不足以抵扣产生的按需费用。请参考已购买套餐包，为什么仍然产生按需计费？识别产生按需计费的原因，并重新选择正确的套餐包或保证账户中的余额充足。未购买套餐包，在按需计费模式下账户的余额不足。欠费影响包年/包月对于包年/包月DLI资源。如队列或弹性资源池，用

 帮助中心 > 数据湖探索 DLI > 计费说明
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

主键缓存到内存中，保证目标表的数据唯一，因此需要配置该值，否则会导致数据重复，默认值：true。 write.index_bootstrap.tasks 否环境默认并行度 Integer “index.bootstrap.enabled”开启后有效，增加任务数提升启动速度，默认值为环境默认并行度。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
普通队列弹性扩缩容 - 数据湖探索 DLI

队列资源扩容时，可能会由于物理资源不足导致队列资源无法扩容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
续费概述 - 数据湖探索 DLI
续费概述 - 数据湖探索 DLI

定的时间内续费，否则队列、弹性资源池等资源会自动释放，数据丢失且不可恢复。续费操作仅适用于包年/包月资源，按需计费资源不需要续费，只需要保证账户余额充足即可。DLI的包周期资源包括：队列、弹性资源池。在到期前续费成功，所有资源得以保留，且作业的运行不受影响。资源到期后的状态说

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

指定的列的行为决定：如果指定的列不存在更新操作，此时可以保证 Exactly once 语义。如果指定的列存在更新操作，此时只能保证 At least once 语义。但可以结合下游，通过指定下游主键，结合幂等性操作来保证数据的正确性。 MySQL CDC源表暂不支持定义Wat

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。前提条件 MySQL CDC要求MySQL版本为5.7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨源连接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

理能力，适用于大规模计算任务场景和有长期资源规划需求的业务场景，灵活应对业务对计算资源变化的需求。发布区域：全部创建弹性资源池 OBS 2.0支持弹性资源池队列创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用

 帮助中心 > 数据湖探索 DLI > 功能总览
全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

存量敏感变量只有创建用户才能使用，其余普通全局变量同账号同项目下的用户共用。如果同账号同项目下存在多个相同名称的全局变量时，需要将多余相同名称的全局变量删除，保证同账号同项目下唯一，此时具备该全局变量修改权限的用户均可以修改对应的变量值。如果同账号同项目下存在多个相同名称的全局变量，优先删除用户自

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
数据保护技术 - 数据湖探索 DLI

为了确保您的个人敏感数据（例如用户名、密码、手机号码等）不被未经过认证、授权的实体或者个人获取，DLI对用户数据的存储和传输进行加密保护，以防止个人数据泄露，保证您的个人数据安全。数据销毁机制用户删除DLI队列后，存储在集群上的用户个人敏感数据会随之删除。用户在控制台上删除填写的手机号、邮箱，

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

弹性资源池CU的变化，部分情况下系统无法保证按计划扩容/缩容至目标CUs：弹性资源池扩容时，可能会由于物理资源不足导致弹性资源池无法扩容到设定的目标大小。弹性资源池缩容时，系统不保证将队列资源完全缩容到设定的目标大小。在执行缩容任务时，系统会先检查资源使用情况，判断是否存在

 帮助中心 > 数据湖探索 DLI > 产品介绍
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

求量不大的任务运行。 B部门：在10:00-22:00时间段内资源请求量大，其他时间段内也有固定周期的作业请求也需要保障。针对上述场景，弹性资源池上可以添加两个队列，队列test_a用于运行A部门的作业任务，队列test_b运行B部门的作业任务。两个部门请求量大的任务时间段固定

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
BI工具连接DLI方案概述 - 数据湖探索 DLI

PowerBI、Fine BI、SuperSet、Tableau和Beeline，它们可以通过Kyuubi建立与DLI的连接。Kyuubi是一个分布式SQL查询引擎，提供了标准的SQL接口，使得BI工具能够通过Kyuubi与DLI进行交互，执行数据查询和分析。 BI工具连接DLI的方案中使用了DLI

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

x支持自定义k8s的调度器说明： Spark2.4.x：不支持使用指定Kubernetes调度器来管理Spark作业的资源分配和调度。 Spark3.3.x：Spark3.3.x支持自定义k8s的调度器。升级引擎版本后是否对作业有影响：功能增强，支持自定义调度器管理资源的分配和调度。 S

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建Flink Jar作业 - 数据湖探索 DLI

和Executor CPU核数共同决定。管理单元设置管理单元的CU数。并行数作业的并行数是指作业中各个算子的并行执行的子任务的数量，即算子子任务数就是其对应算子的并行度。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数应大于用户作业里设置的并发数，否则有可能提交失败。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
SHOW TABLE - 数据湖探索 DLI
SHOW TABLE - 数据湖探索 DLI

由LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应可以直接在提交任务界面查看任务结果，或者在SQL作业界面，点击对应任务右侧的”更多”->”查看结果”检查任务结果。父主题： Hudi DDL语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用BI工具连接DLI分析数据 BI工具连接DLI方案概述配置DBeaver连接DLI进行数据查询和分析配置DBT连接DLI进行数据调度和分析配置YongHong BI连接DLI进行数据查询和分析配置PowerBI通过Kyuubi连接DLI进行数据查询和分析配置Fine

帮助中心 > 数据湖探索 DLI > 最佳实践
使用DLI分析账单消费数据 - 数据湖探索 DLI

使用DLI分析账单消费数据应用场景本文主要介绍如何使用华为云DLI上的实际消费数据（文中涉及账户的信息已脱敏），在DLI的大数据分析平台上进行分析，找出费用优化的空间，并给出使用DLI过程中降低成本的一些优化措施。流程介绍使用DLI进行账单分析与优化的操作过程主要包括以下步骤：

帮助中心 > 数据湖探索 DLI > 最佳实践
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

or CPU核数共同决定。任务可并行执行的最大Task数量=Executor个数 * Executor CPU核数。您可以根据购买的队列资源合理规划计算资源规格。需要注意的是，Spark任务执行需要driver、executor等多个角色共同调度完成，因此“Executor个数*Executor

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。并行数是指同时运行Flink SQL作业的最大任务数。适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销。最大并行数不能大于计算单元（CU数量-管理单元）的4倍。管理单元

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 218

上一页
1
...
4
5
6
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

欠费说明 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

续费概述 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

全局变量的使用中，一个子账号是否可以使用其他子账号创建的全局变量 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

SHOW TABLE - 数据湖探索 DLI

使用BI工具连接DLI分析数据 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线