搜索_华为云

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

示例2：使用通用队列，将Spark版本从Spark 2.4.x升级至Spark 3.3.1对数据表的版本有影响吗？ Spark 2.4.x通用队列支持V1表和V2表，但Spark3.3.x通用队列不支持V1表。因此如需将Spark版本从Spark 2.4.x升级至Spark 3.3.1需经过以下步骤：将Spark

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

表数据清理使用。需用户自行在IAM创建名为dli_data_clean_agency的DLI云服务委托并授权。该委托需新建后自定义权限，但委托名称固定为dli_data_clean_agency。委托的权限策略示例请参考常见场景的委托权限策略。其他自定义委托自定义委托使用Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

稳定运行而不会强制缩容，进而避免任务中断和系统不稳定。而SQL批处理类型的作业在独立的资源池中能够更加灵活地进行扩缩容，显著提升扩缩容的成功率和操作效率。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和需要小于等于弹性资源池的最小CU数。在全天的任意一个时间段

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
创建Hive Catalog - 数据湖探索 DLI

Hive通用表是特定于Flink的。当使用HiveCatalog创建通用表时，只是使用HMS来持久化元数据。虽然这些表对Hive来说是可见的，但Hive不太可能理解元数据。因此，在Hive中使用这样的表会导致未定义的行为。建议切换到Hive方言来创建Hive兼容表。如果您想用默认的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink作业性能调优 - 数据湖探索 DLI

作业非倒数第二个算子反压高（红色）该场景说明性能瓶颈点在Vertex2算子，可以通过查看该算子描述，确认该算子具体功能，以进行下一步优化。所有算子反压都正常（绿色），但存在数据堆积该场景说明性能瓶颈点在Source，主要是受数据读取速度影响，此时可以通过增加Kafka分区数并增加source并发解决。作

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。参考创建Flink OpenSource作业，创建flink opensource sql作业，输入以下作业脚本，提交运行作业。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。参考创建Flink OpenSource作业，创建flink opensource sql作业，输入以下作业脚本，提交运行作业。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
CREATE TABLE语句 - 数据湖探索 DLI

如，一个计算列可以使用 cost AS price * quantity 进行定义，这个表达式可以包含物理列、常量、函数或变量的任意组合，但这个表达式不能存在任何子查询。在 Flink 中计算列一般用于为 CREATE TABLE 语句定义时间属性。处理时间属性可以简单地通过使用了系统函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
pyspark样例代码 - 数据湖探索 DLI

resource为指定在CSS关联的资源名。格式可以用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。 ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7.X版本中，单个Index将使用“_do

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Hudi Clustering操作说明 - 数据湖探索 DLI

limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
CREATE TABLE语句 - 数据湖探索 DLI

如，一个计算列可以使用 cost AS price * quantity 进行定义，这个表达式可以包含物理列、常量、函数或变量的任意组合，但这个表达式不能存在任何子查询。在 Flink 中计算列一般用于为 CREATE TABLE 语句定义时间属性。处理时间属性可以简单地通过使用了系统函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
创建DLI自定义委托权限 - 数据湖探索 DLI

dli_data_clean_agency 数据清理委托，表生命周期清理数据、Lakehouse表数据清理使用。该委托需新建后自定义权限，但委托名称固定为dli_data_clean_agency。数据清理委托权限配置允许DLI读写OBS将日志转储自定义 DLI Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
配置DLI云服务委托权限 - 数据湖探索 DLI

需的数据清理委托。需用户自行在IAM创建名为dli_data_clean_agency的DLI云服务委托并授权。该委托需新建后自定义权限，但委托名称固定为dli_data_clean_agency。 DLI Flink作业访问和使用OBS、日志转储（包括桶授权）、开启checkp

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
数据湖探索简介 - 数据湖探索 DLI

能够从其他AZ正常访问数据，适用于对可靠性要求较高的数据存储场景。建议优选使用多AZ存储的策略。选择单AZ存储，数据仅存储在单个AZ中，但相比多AZ更加便宜。收费详情请参见OBS产品价格详情。弹性资源池弹性资源池后端采用CCE集群的架构，支持异构，对资源进行统一的管理和调度

 帮助中心 > 数据湖探索 DLI > 产品介绍
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

fallback-mapred-reader=true Reading Hive Views Flink 能够从 Hive 定义的视图中读取数据，但存在一些限制：必须先将 Hive 目录设置为当前目录，然后才能查询视图。这可以通过表 API 中的 tableEnv.useCatalog（

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

ull GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full GC。但禁用此优化可能会降低查询性能，禁用后Spark将不会自动修剪掉那些不满足条件的分区。更多属性参数配置请参考DLI SQL属性参数说明。图13

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi常见配置参数 - 数据湖探索 DLI

ategy或者SparkSizeBasedClusteringPlanStrategy时，execution.strategy不需要指定。但当plan.strategy为SparkSingleFileSortPlanStrategy时，需要指定execution.strategy

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

间是固定的。您可以将 CUMULATE 函数视为首先应用具有最大窗口大小的 TUMBLE 窗口，然后将每个滚动窗口拆分为具有相同窗口开始但窗口结束步长不同的几个窗口。所以累积窗口会产生重叠并且没有固定大小。例如：1小时步长，24小时大小的累计窗口，每天可以获得如下这些窗口：[00:00

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

描述：近似统计出前buckets个最频繁出现的元素。函数统计高频值时，采用近似估算的方式使用的内存更少。capacity值越大，结果越精确，但消耗的内存也更多。该函数的返回结果是一个map，map的键值对为高频值及对应的频次。 SELECT approx_most_frequent(3

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

返回给定时间列属性rowtime 的当前水印，如果管道中的当前操作没有可用的上游操作的公共水印时则为 NULL。函数的返回类型被推断为与提供的时间列属性匹配，但调整后的精度为 3。例如时间列属性为 TIMESTAMP_LTZ(9)，则函数将返回 TIMESTAMP_LTZ(3)。请注意，此函数可以返回

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数

总条数： 520

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

配置DLI云服务委托权限 - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线