搜索_华为云

SQL作业开发类 - 数据湖探索 DLI

如何合并小文件 DLI如何访问OBS桶中的数据创建OBS表时怎样指定OBS路径关联OBS桶中嵌套的JSON格式数据如何创建表 count函数如何进行聚合怎样将一个区域中的DLI表数据同步到另一个区域中？ SQL作业如何指定表的部分字段进行表数据的插入 SQL作业运行慢如何定位怎样查看DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB级数据实现秒级响应，极大提升了数据查询的效率。 Serverless资源开箱即用： Serverless服务模式无需关注

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

可以用于基于窗口表值函数（Windowing TVFs）的操作之上，比如窗口聚合，窗口Top-N和窗口关联。窗口 Top-N 的语法和普通的 Top-N 相同。除此之外，窗口 Top-N 需要 PARTITION BY 子句包含窗口表值函数或窗口聚合产生的 window_start 和 window_end。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

戳。注意：范围以外的上界时间戳不可以在随后基于时间的操作中，作为行时间属性使用，比如基于时间窗口的join以及分组窗口或分组窗口上的聚合。 TUMBLE_ROWTIME(time_attr, interval) HOP_ROWTIME(time_attr, interval

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

330110) 常见问题 Q：MySQL CDC源表不支持定义Watermark，怎么进行窗口聚合？ A：可以采用非窗口聚合的方式，即将时间字段转换成窗口值，然后根据窗口值进行GROUP BY聚合。例如：基于上述示例，统计每分钟的订单数，脚本如下（其中order_time为string类型，表示订单的时间）。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
配置DLI作业桶 - 数据湖探索 DLI

Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。使用须知请勿将该OBS桶用作其它用途，避免出现作业结果混乱等问题。

帮助中心 > 数据湖探索 DLI > 用户指南 > 准备工作
查询SQL作业日志 - 数据湖探索 DLI

Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

不同于ROLLUP，GROUPING SETS目前仅支持一种格式。示例根据group_id与job两个字段生成交叉表格行，返回每种聚合情况下的salary总和。 1 2 3 SELECT group_id, job, SUM(salary) FROM group_test

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
查询Spark作业日志 - 数据湖探索 DLI

Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

实时视图读取（SparkSQL为例）：直接读取元数据服务里面存储的Hudi表即可，${table_name}表示表名称。 select (字段 or 聚合函数) from ${table_name}; 实时视图读取（Spark jar作业为例）： Spark jar作业可以通过两种方式来读取Hudi表：Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

并勾选“从Checkpoint恢复”。配置后，作业异常重启，会从最新成功的Checkpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

信息。结果表：按商品类别统计订单销售金额数据。作业首先从订单数据源表读取实时订单数据，将订单数据流与商品商品类别信息维表关联起来，然后聚合统计订单总额，最后将统计结果写入结果表。本例中订单表作为驱动源表输入，商品类别信息表作为静态维表，统计结果表作为作业最终输出。 Connector支持列表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

上界时间戳。范围以外的上界时间戳不可以在随后基于时间的操作中，作为行时间属性使用，比如基于时间窗口的join以及分组窗口或分组窗口上的聚合。 TUMBLE_ROWTIME(time_attr, interval) HOP_ROWTIME(time_attr, interval

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

面，此处可以筛选刚才提交的Flink作业并检查执行状态。点击作业的名称，可以跳转至作业界面，此处可以点击”提交日志”或”运行日志”，检查聚合的日志。也可以直接点击日志列表，选择JobManager或者TaskManager，并下载对应日志。点击作业界面右上角的”更多”->”Flink

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
查询Flink作业日志 - 数据湖探索 DLI

Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置 > 工程配置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

JobManager CPU的负载 flink_jobmanager_Status_JVM_CPU_Time JobManager CPU的使用 flink_taskmanager_Status_JVM_CPU_Load TaskManager CPU的负载 flink_taskma

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

JSON_OBJECTAGG([KEY] key VALUE value [ { NULL | ABSENT } ON NULL ]) 通过将键值表达式聚合到单个JSON对象中来构建JSON对象字符串。键表达式必须返回一个不可为空的字符串。值表达式可以是任意的，包括其他JSON函数。如果值为NULL，则ON

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

戳。注意：范围以外的上界时间戳不可以在随后基于时间的操作中，作为行时间属性使用，比如基于时间窗口的join以及分组窗口或分组窗口上的聚合。 TUMBLE_ROWTIME(time_attr, interval) HOP_ROWTIME(time_attr, interval

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

MERGE-ON-READ 表。未指定type的话，默认值为 'cow'。 preCombineField 表的preCombine字段，写入前预聚合数据时，当主键相同，preCombine字段会用于比较，该字段为必填字段。 payloadClass 使用preCombineField字

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明

总条数： 116

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQL作业开发类 - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

配置DLI作业桶 - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

在DLI使用Hudi提交Flink SQL作业 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

DLI支持的Prometheus基础监控指标 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线