搜索_华为云

窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

同。除此之外，窗口去重需要 PARTITION BY 子句包含表的 window_start 和 window_end 列。否则优化器无法翻译。 Flink 使用 ROW_NUMBER() 移除重复数据，就像窗口TopN一样。理论上，窗口是一种特殊的窗口 Top-N：N是1并且是根据处理时间或事件时间排序的。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Hudi表必须指定primaryKey与preCombineField。在指定路径下创建表时，如果路径下已存在Hudi表，则建表时不需要指定列，且不能修改表的原有属性。权限需求由DLI提供的元数据服务 SQL权限： database table CREATE_TABLE 无细粒度权

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ Flink Jar作业上传配置文件操作流程自定义(JAR)作业支持上传配置文件。将配置文件通过程序包管理上传到DLI；在Flink jar作业的其他依赖文件参数中，选择创建的DLI程序包；在代码中通过ClassName

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

标准版 CU范围弹性资源池最大最小CU范围。 64-64 网段规划弹性资源池所属的网段。如需使用DLI增强型跨源，弹性资源池网段与数据源网段不能重合。弹性资源池网段设置后不支持更改。 172.16.0.0/19 企业项目选择对应的企业项目。 default 参数填写完成后，单击“

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
ClickHouse结果表 - 数据湖探索 DLI

min、minute等。为0则表示不根据时间刷新 connector.write.max-retries 否 3 Integer 写数据失败时的最大尝试次数，默认值为：3。示例从Kafka中读取数据，并将数据插入到数据库为flink、表名为order的ClickHouse数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

ts 成功完成的checkpoint的数量 flink_jobmanager_job_numberOfFailedCheckpoints 失败的checkpoint的数量 flink_jobmanager_job_totalNumberOfCheckpoints 所有checkpoint的总数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
添加分区（只支持OBS表） - 数据湖探索 DLI

obs_path OBS存储路径。注意事项向表中添加分区时，此表和分区列（建表时PARTITIONED BY指定的列）必须已存在，而所要添加的分区不能重复添加，否则将出错。已添加的分区可通过IF NOT EXISTS避免报错。若分区表是按照多个字段进行分区的，添加分区时需要指定所有的分区字段，指定字段的顺序可任意。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
复杂数据类型 - 数据湖探索 DLI

持date、short、timestamp数据类型。对于JSON格式OBS表，MAP的键类型只支持STRING类型。由于MAP类型的键不能为NULL，MAP键不支持对插入数据进行可能出现NULL值类型之间的隐式转换，如：STRING类型转换为其他原生类型、FLOAT类型转换为

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

partition(provice = 'hebei', city= 'baoding') select name,age from test_p_1; 注意事项无法对外部表（external）插入数据。父主题： DML 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DML 语法
创建Hive Catalog - 数据湖探索 DLI

ME_ZONE。 TIMESTAMP_WITH_LOCAL_TIME_ZONE，和 MULTISET。 Flink的INTERVAL类型还不能映射到Hive INTERVAL类型。示例在Flink OpenSource SQL作业中，创建名为myhive的catalog，并使用它用于管理元数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
查看Flink作业详情 - 数据湖探索 DLI

如果是新建队列，在该队列提交作业后，如果立即单击FlinkUI，因为后台大约需要10分钟创建集群，会导致缓存空的projectID，从而导致无法查看FlinkUI。建议作业选择使用专属队列，后台集群不会被释放，避免上述问题产生。或者等待作业运行中时再查看FlinkUI，确保集群已经拉好了，不要立即单击FlinkUI。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

Prometheus实例后将新提交运行的作业监控指标上报到AOM，并按照AOM计费规则收费。绑定Prometheus需具备访问AOM Prometheus的权限，否则绑定失败。具体权限内容包括： aom:prometheusInstances:list aom:metric:list aom:metric:get

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

Top-N 需要 PARTITION BY 子句包含窗口表值函数或窗口聚合产生的 window_start 和 window_end。否则优化器无法翻译。更多介绍和使用请参考开源社区文档：窗口Top-N。语法格式 SELECT [column_list] FROM ( SELECT

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
基本概念 - 数据湖探索 DLI
基本概念 - 数据湖探索 DLI

4GMem。不同规格的计算资源对应的计算能力不一样，规格越高计算能力越好。常量与变量环境变量中，常量与变量的区别如下：常量在程序运行过程中，所表示的值是无法被改变的。变量是“可读、可写”，而常量是“只读”的。变量是在程序运行过程中，内部存储的值，随时可以被改变的一段内存地址。比如：int a

帮助中心 > 数据湖探索 DLI > 产品介绍
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

U数。在全天的任意一个时间段内，弹性资源池中任意一个队列的最大CU必须小于等于弹性资源池的最大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

Kafka源表功能描述创建source流从Kafka获取数据，作为作业的输入数据。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Confluent Avro Format - 数据湖探索 DLI

cs的地址-->测试）。若能连通，则表示跨源已经绑定成功；否则表示未成功。购买ecs集群，并下载5.5.2版本的confluent（https://packages.confluent.io/archive/5.5/）和jdk1.8.0_232，并上传到购买的ecs集群中，然后

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

助用户实现功能扩展。用户使用自定义镜像功能需要具备Docker相关的基础知识。使用限制创建自定义镜像必须使用DLI提供的基础镜像。不能随意修改基础镜像中DLI相关组件及目录。仅支持Spark jar作业、Flink jar作业，即jar包作业。使用流程图1 自定义镜像使用流程

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

ze”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H 标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

ttl（所有分区作为临时表）设置一个相对较大的值。否则，作业容易出现性能问题，避免表更新和重新加载过于频繁。缓存刷新需加载整个Hive表。无法区分新数据和旧数据。参数说明在执行与最新的Hive表的时间关联时，Hive表将被缓存到Slot内存中，然后通过键将流中的每条记录与表进

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 514

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

窗口去重 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

Flink Jar作业是否支持上传配置文件，要如何操作？ - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

基本概念 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线