搜索_华为云

VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

Delta 管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
分配弹性资源池至项目 - 数据湖探索 DLI

将分布在不同区域的资源按照企业项目进行统一管理，同时可以为每个企业项目设置拥有不同权限的用户组和用户。 DLI支持在创建弹性资源池时选择企业项目，本节操作为您介绍DLI弹性资源池如何绑定、修改企业项目。修改弹性资源池的企业项目，会同时修改弹性资源池下的队列资源的企业项目。即弹

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
什么是用户配额？ - 数据湖探索 DLI

配额是指云平台预先设定的资源使用限制，包括资源数量和容量等。设置配额是为了确保资源合理的分配和使用，避免资源过度集中和资源浪费。如果资源配额限制满足不了用户的使用需求，可以通过工单系统来提交您的申请，并告知您申请提高配额的理由。在通过审理之后，系统会更新您的配额并进行通知。关于配额的具体操作说明，请参见关于配额。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

Kafka结果表功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

然后在指定区域对应的项目中设置相关权限，并且该权限仅对此项目生效；如果在“所有项目”中设置权限，则该权限在所有区域项目中都生效。访问DLI时，需要先切换至授权区域。权限类别：根据授权精程度分为角色和策略。角色：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该

 帮助中心 > 数据湖探索 DLI > 产品介绍
Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中使用Spark将数据写入到DLI表中，主要设置如下参数： fs.obs.access.key fs.obs.secret.key fs.obs.impl fs.obs.endpoint 示例如下： import logging from operator

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
常见场景的委托权限策略 - 数据湖探索 DLI

常见场景的委托权限策略本节操作提供了DLI常见场景的委托权限策略，用于用户自定义权限时配置委托的权限策略。委托策略中的“Resource”根据需要具体情况进行替换。数据清理委托权限配置适用场景：数据清理委托，表生命周期清理数据及lakehouse表数据清理使用。该委托需新建

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
Hudi Clustering操作说明 - 数据湖探索 DLI

新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务可以异步或同步运行

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
查询Flink作业日志 - 数据湖探索 DLI

单击打开桶列表。选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2 设置DLI作业桶查看Flink作业提交日志用户可以通过查看提交日志排查提交作业异常的故障。在DLI管理控制台的左侧导航栏中，单击“作业管理”>

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

x访问元数据时，DataSource语法创建avro类型的OBS表创建失败问题描述使用Spark访问元数据时，DataSource语法创建avro类型的OBS表创建失败。图1 avro类型的OBS创建失败根因分析当前Spark2.3.x不支持创建avro类型的OBS表，Spark2

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

GROUP BY GROUP BY GROUP BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
查询SQL作业日志 - 数据湖探索 DLI

选择用于存放DLI作业临时数据的桶，并单击“确定”。完成设置后DLI作业运行过程中产生的临时数据将会存储在该OBS桶中。图2 设置DLI作业桶查询SQL作业日志登录DLI管理控制台，单击“作业管理 > SQL作业”。选择待查询的SQL作业，单击操作列的“更多 > 归档日志”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
对象存储OBS结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

为每个Reader设置不同的Server ID 每个用于读取Binlog的MySQL客户端都应该有一个唯一的Server ID，确保MySQL服务器能够区分不同的客户端并维护各自的Binlog读取位置。如果不同的作业共享相同的Server ID，可能会导致从错误的Binlog位置读取数据，从而引发数据不一致的问题。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用Hive语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS语句将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在创建t

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
ClickHouse结果表 - 数据湖探索 DLI

数据库名为ClickHouse集群创建的数据库名称。 connector.table 是要创建的ClickHouse的表名。 connector.driver 否连接数据库所需要的驱动。如果建表时不指定该参数，驱动会自动通过ClickHouse的url提取。如果建表时指定该参数，则该参数值固定为“ru

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
ClickHouse结果表 - 数据湖探索 DLI

e和Kafka集群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink作业队列。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列连通性。若

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表

总条数： 931

上一页
1
...
5
6
7
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

VACUUM - 数据湖探索 DLI

分配弹性资源池至项目 - 数据湖探索 DLI

什么是用户配额？ - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

Spark如何将数据写入到DLI表中 - 数据湖探索 DLI

常见场景的委托权限策略 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

在使用Spark2.3.x访问元数据时，DataSource语法创建avro类型的OBS表创建失败 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线