搜索_华为云

使用DLI提交Spark作业 - 数据湖探索 DLI

使用DLI提交Spark作业创建Spark作业设置Spark作业优先级查询Spark作业日志管理Spark作业管理Spark作业模板

 帮助中心 > 数据湖探索 DLI > 用户指南
创建数据库和表 - 数据湖探索 DLI

创建数据库和表了解数据目录、数据库和表在DLI控制台创建数据库和表查看表元数据在DLI控制台管理数据库资源在DLI控制台管理表资源创建并使用LakeFormation元数据

 帮助中心 > 数据湖探索 DLI > 用户指南
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

修改表分区位置（只支持OBS表）功能描述修改表分区的位置。语法格式 1 2 3 ALTER TABLE table_name PARTITION partition_specs SET LOCATION obs_path; 关键字 PARTITION：分区。 LOCATION：分区路径。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
查询分组资源列表（废弃） - 数据湖探索 DLI

查询分组资源列表（废弃）功能介绍该API用于查询某个project下的所有资源，其中包含Group。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2.0/{project_id}/resources 参数说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建Hive Catalog - 数据湖探索 DLI

数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive Metastore中的元数据。Catalog 提供了一个统一的API，用于管理元数据，并使其可以从Table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
上传分组资源（废弃） - 数据湖探索 DLI

上传分组资源（废弃）功能介绍该API用于上传分组资源到某个project下。该API对应控制台的创建程序包功能。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{project_id}/resources

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Hudi表分区设计规范 - 数据湖探索 DLI

Hudi表分区设计规范规则分区键不可以被更新： Hudi具有主键唯一性机制，但在分区表的场景下通常只能保证分区内主键唯一，因此如果分区键的值发生变更后，会导致相同主键的行记录出现多条的情况。在以日期分区的场景，可采用数据的创建时间为分区字段，切记不要采用数据更新时间做分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

Orc Format 功能描述 Apache Orc Format允许读写ORC数据。更多具体使用可参考开源社区文档：Orc Format。支持的Connector FileSystem 参数说明表1 参数说明参数是否必选默认值类型描述 format 是无 String

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI分析账单消费数据 - 数据湖探索 DLI

包，来降低使用成本。企业中的业务模式较多且经常变化，成本管理员通常并不能全面及时了解花销较大的业务在哪里，哪些是合理的，哪些是不合理的，通过在DLI中对费用明细进行分析，可以及时发现企业花销不合理的地方，及时进行成本管理，进一步降低企业使用华为云的成本。

帮助中心 > 数据湖探索 DLI > 最佳实践
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

数据目录：数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。您可以在DLI中创建并管理多个Catalog，用于不同的元数据隔离。 · 数据库：数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库通常用于存储、检索和管理结构化数据，由多个数据表组成，这些数据表通过键和索引相互关联。

帮助中心 > 数据湖探索 DLI > 功能总览
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

Flink作业列表“操作”列中的“更多 > 导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。登录DLI管理控制台，选择“作业管理 > Flink作业”。在对应Flink作业所在行，选择“操作 > 导入保存点”。在导入保存点界面选择Checkpoint的

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

上传pyfile类型分组资源（废弃）功能介绍该API用于在project下的上传pyfile类型模块。上传同名pyfile类型模块时，新模块将会覆盖旧模块。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

CREATE TABLE 语法 ① CREATE TABLE [ IF NOT EXISTS ] [catalog_name.][db_name.]table_name ( { column_name data_type [ NOT NULL ] [ COMMENT col_comment]

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Flink作业提交错误，如何定位 - 数据湖探索 DLI

Flink作业提交错误，如何定位在Flink作业管理页面，将鼠标悬停到提交失败的作业状态上，查看失败的简要信息。常见的失败原因可能包括： CU资源不足：需扩容队列。生成jar包失败：检查SQL语法及UDF等。如果信息不足以定位或者是调用栈错误，可以进一步单击作业名称，进入

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
上传file类型分组资源（废弃） - 数据湖探索 DLI

上传file类型分组资源（废弃）功能介绍该API用于在project下上传file类型模块。上传同名file模块时，新模块将会覆盖旧模块。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{pro

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
DLI数据库和表类 - 数据湖探索 DLI

DLI数据库和表类为什么在DLI控制台中查询不到表？ OBS表压缩率较高怎么办？字符码不一致导致数据乱码怎么办？删除表后再重新创建同名的表，需要对操作该表的用户和项目重新赋权吗？ DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？创建OB

帮助中心 > 数据湖探索 DLI > 常见问题
查看表的使用者（废弃） - 数据湖探索 DLI

表3 privileges参数参数名称是否必选参数类型说明 is_admin 否 Boolean 判断是否为管理用户，false表示不是管理用户，true表示是管理用户。 object 否 String 该用户有权限的对象： “databases.数据库名.tables.表名”，用户在当前表上的权限。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？队列空闲状态是指在DLI 作业管理中，该队列下均无SQL 作业运行，或者 Flink 作业运行、Spark 作业运行。即一个自然小时内无作业运行，该自然小时为空闲状态。不会进行计费。通常按需计费的队列，在空闲1h后计算资源会被释放，再次使用时

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

根据资源ID在云服务的控制台查找资源并删除。在控制台中选择“大数据 > 数据湖探索 DLI”，并切换选择资源所在区域。选择“资源管理 > 队列管理”或“资源管理 > 弹性资源池”。在搜索框中输入资源名称，单击图标即可查找到该资源。图2 查找资源查看弹性资源池详细信息，根据计算资源的类型选择结束计费需要执行的操作。

帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 709

上一页
1
...
27
28
29
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交Spark作业 - 数据湖探索 DLI

创建数据库和表 - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

Flink作业提交错误，如何定位 - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

DLI数据库和表类 - 数据湖探索 DLI

查看表的使用者（废弃） - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

数据湖队列什么情况下是空闲状态？ - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线