搜索_华为云

Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

使用前必读使用须知 DLI HetuEngine功能为白名单功能，如需使用，请在管理控制台右上角，选择“工单 > 新建工单”，提交申请。使用前您需要先创建一个HetuEngine类型的SQL队列，具体操作请参考创建弹性资源池并添加队列。 HetuEngine SQL需搭配la

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
导出SQL作业结果 - 数据湖探索 DLI

导出SQL作业结果导出作业结果是将SQL作业分析后的数据结果按指定格式存储到指定位置。 DLI默认将SQL作业结果存储在DLI作业桶中。同时也支持下载作业结果到本地或导出作业结果到指定的OBS桶。导出作业结果到DLI作业桶 DLI在指定了一个默认的OBS桶作为作业结果的存储位置，请在DLI管理控制台的“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI程序包标签管理 - 数据湖探索 DLI

DLI程序包标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。 DLI支持对程序包组或程序包添加标签。在DLI管理控制台单击“数据管理 > 程序包管理”。选择程序包，单击操作列的“更多 > 标签”，显示当前程序包组或程序包的标签信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

DLI委托概述什么是委托？各云服务之间存在业务交互关系，一些云服务需要与其他云服务协同工作，需要您创建云服务委托，将操作权限委托给DLI服务，让DLI服务以您的身份使用其他云服务，代替您进行一些资源运维工作。例如：在DLI新建Flink作业所需的AKSK存储在数据加密服务D

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
队列引擎版本升级后，在创建表时，提示权限不足怎么办？ - 数据湖探索 DLI

队列引擎版本升级后，在创建表时，提示权限不足怎么办？问题描述队列版本从Spark 2.x版本切换至Spark 3.3.x版本时，或切换使用HetuEngine后，如果已经赋予IAM用户的建表权限，但是在创建表时候仍然提示权限不足。根因分析 DLI队列的引擎版本不同，校验的权限范围不同：

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
计费样例 - 数据湖探索 DLI
计费样例 - 数据湖探索 DLI

计费样例计费场景某公司用户A申请了256CUs的弹性资源池，并将1TB数据存放在DLI表中。该公司想要了解采用哪种计费模式才是性价比最优的方式。数据湖探索服务目前支持三种作业：SQL作业，Flink作业和Spark作业。SQL作业的计费包括存储计费和计算计费，Flink作业和Spark作业的计费只有计算计费。

帮助中心 > 数据湖探索 DLI > 计费说明
区域和可用区 - 数据湖探索 DLI

区域和可用区什么是区域、可用区？区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Re

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Hudi开发规范概述 - 数据湖探索 DLI

Hudi开发规范概述范围本节内容介绍DLI-Hudi组件进行湖仓一体、流批一体方案的设计与开发方面的规则，适用于Hudi开发场景的表的设计、管理与作业开发。主要包括以下方面的规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据操作场景 DLI Flink作业支持使用其他服务作为数据源和数据输出通道进行数据实时计算操作。本例采用Kafka服务作为数据源通道，以RDS作为数据输出通道，介绍创建并提交Flink OpenSource

帮助中心 > 数据湖探索 DLI > 快速入门
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
与其他云服务的关系 - 数据湖探索 DLI

与其他云服务的关系与对象存储服务（OBS）的关系对象存储服务（Object Storage Service）作为DLI的数据来源及数据存储，与DLI配合一起使用，关系有如下四种。数据来源：使用DLI服务提供API，将OBS对应路径的数据导入到DLI。具体API请参考《导入数据》。

帮助中心 > 数据湖探索 DLI > 产品介绍
Flink作业性能调优 - 数据湖探索 DLI

Flink作业性能调优性能调优相关基本概念消费组积压消费组积压可通过topic最新数据offset减去该消费组已提交最大offset计算得出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
DLI Delta常见问题 - 数据湖探索 DLI

DLI Delta常见问题执行insert into/overwrite table_name partition(part_key='part_value') select ...报错DLI.0005: DeltaAnalysisException: Partition column

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 TPC-H样例数据简介 TPC-H（商业智能计算测试）是交易处理效能委员会（TPC,Transaction Processing Performance Council) 组织制定的用来模拟决策支持类应用的一个测试集。目前，在学术

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

创建Flink OpenSource SQL作业本章节介绍如何新建Flink OpenSource SQL作业。 DLI Flink OpenSource SQL类型作业完全兼容社区Flink版本，并在社区connector基础之上，新增了Redis、DWS(GaussDB)数据源类型。社区Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
SQL作业开发指南 - 数据湖探索 DLI

SQL作业开发指南使用Spark SQL作业分析OBS数据在DataArts Studio开发DLI SQL作业在Spark SQL作业中使用UDF 在Spark SQL作业中使用UDTF 在Spark SQL作业中使用UDAF

帮助中心 > 数据湖探索 DLI > 开发指南
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类

总条数： 442

上一页
1
...
12
13
14
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表初始化 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

队列引擎版本升级后，在创建表时，提示权限不足怎么办？ - 数据湖探索 DLI

计费样例 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

与其他云服务的关系 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

SQL作业开发指南 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线