搜索_华为云

cume - 数据湖探索 DLI
cume - 数据湖探索 DLI

cume_dist cume_dist函数用于求累计分布，相当于求分区中大于等于或小于等于当前行的数据在分区中的占比。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
查询弹性资源池下所有队列 - 数据湖探索 DLI

查询弹性资源池下所有队列功能介绍查询队列与弹性资源池的关联关系。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v3/{project_id}/elastic-resource-pools/{elastic_resource_pool_name}/queues

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
trans - 数据湖探索 DLI
trans - 数据湖探索 DLI

trans_array trans_array函数用于将一行数据转为多行的UDTF，将列中存储的以固定分隔符格式分隔的数组转为多行。使用限制所有作为key的列必须位于在前面，而要转置的列必须放在后面。在一个select中只能有一个UDTF，不可以再出现其他的列。不可以与group

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

API语法说明设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
查询作业详情 - 数据湖探索 DLI

查询作业详情功能介绍查看一个作业的详情信息。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{project_id}/streaming/jobs/{job_id} 参数说明表1 URI参数说明参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南概述本节操作介绍基于Flink 1.12版本的Flink Jar作业读写DIS数据的操作方法。 Flink 1.12版本Flink Opensource SQL作业不支持使用DLI提供的connector读写DIS，因此推荐您使用本节操作提供的方法。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

Hbase结果表功能描述 DLI将作业的输出数据输出到HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 Fine BI是一款智能可视化工具，专注于数据分析和可视化。它支持连接多种数据源，能够将复杂的数据转换为直观的图表和仪表板，快速获得数据洞察。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
从Kafka读取数据写入到RDS - 数据湖探索 DLI

从Kafka读取数据写入到RDS 本指导仅适用于Flink 1.12版本。场景描述该场景为根据商品的实时点击量，获取每小时内点击量最高的3个商品及其相关信息。商品的实时点击量数据为输入源发送到Kafka中，再将Kafka数据的分析结果输出到RDS中。例如，输入如下样例数据：

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃）功能介绍该API用于创建队列定时扩缩容计划，对指定的队列创建定时规格变更计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v1/{project_id}/queues/{queue_name}/plans

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

GROUP BY GROUP BY GROUP BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃）功能介绍该API用于修改指定ID的队列的定时扩缩容计划。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： PUT /v1/{project_id}/queues/{queue_name}/plans/{plan_id}

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

get_json_object get_json_object函数用于根据所给路径对json对象进行解析，当json对象非法时将返回NULL。命令格式 get_json_object(string <json>, string <path>) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业本章节主要介绍从创建弹性资源池、创建增强型跨源、添加队列到弹性资源池并运行作业的一个完整流程，帮助您更好、更方便的使用弹性资源池。图1 创建弹性资源池运行作业流程图表1 创建新队列时绑定弹性资源池流程说明阶段说明参考文档步骤一：创建弹性资源池

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
创建批处理作业 - 数据湖探索 DLI

创建批处理作业功能介绍该API用于在某个队列上创建批处理作业。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2.0/{project_id}/batches 参数说明表1 URI参数参数名称是否必选参数类型说明 project_id

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
创建增强型跨源连接 - 数据湖探索 DLI

创建增强型跨源连接功能介绍该API用于创建与其他服务的增强型跨源连接。如果需要了解Console界面的使用方法，可参考《数据湖探索用户指南》中的“增强型跨源连接”。系统default队列不支持创建跨源连接。调试您可以在API Explorer中调试该接口。 URI URI格式

 帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

使用DLI分析电商实时业务数据应用场景当前线上购物无疑是最火热的购物方式，而电商平台则又可以以多种方式接入，例如通过web方式访问、通过app的方式访问、通过微信小程序的方式访问等等。而电商平台则需要每天统计各平台的实时访问数据量、订单数、访问人数等等指标，从而能在显示大屏上

 帮助中心 > 数据湖探索 DLI > 最佳实践
管理DLI全局变量 - 数据湖探索 DLI

管理DLI全局变量什么是全局变量 DLI支持在管理控制台设置全局变量，将作业开发过程中频繁使用的变量设置为全局变量，可以避免在编辑作业过程中重复定义，减少开发与维护成本。通过使用全局变量可以替换长难复杂变量，简化复杂参数，提升SQL语句可读性。本节操作为您介绍如何创建全局变量。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

删除分区功能描述本节操作介绍删除分区表的一个或多个分区。分区表分为两种，OBS表和DLI表。在删除分区时，DLI表和OBS表都支持利用指定条件删除分区表的一个或多个分区。OBS表还支持按指定筛选条件删除分区。注意事项所要删除分区的表必须是已经存在的表，否则会出错。所要

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关

总条数： 517

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

cume - 数据湖探索 DLI

查询弹性资源池下所有队列 - 数据湖探索 DLI

trans - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

修改队列定时扩缩容计划（废弃） - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

管理DLI全局变量 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线